Diferencia entre revisiones de «Manipulación de PDFs e imagenes en linea de comandos»

De Recursos Educativos
Ir a la navegación Ir a la búsqueda
Sin resumen de edición
Sin resumen de edición
Línea 7: Línea 7:
  pdfimages -f 1 -l 1 -j fichero.pdf pgs
  pdfimages -f 1 -l 1 -j fichero.pdf pgs


Secuencia de comandos para procesar un libro que estaba escaneado (una imagen por página) pero con 2 paginas reales por imagen y muchos bordes blancos. Como hacer un PDF mejor:
Secuencia de comandos para partiendo de un libro que estaba escaneado, con una imagen por página, pero con 2 paginas reales por imagen y muchos bordes blancos, hacer un PDF mejor, con una página real por pagina PDF y sin bordes blancos:


  # Extraer todas las imágenes
  # Extraer todas las imágenes
Línea 27: Línea 27:
Ponerle metadata (XMP) para que el e-reader lo muestre:
Ponerle metadata (XMP) para que el e-reader lo muestre:


# extraer metadata a fichero
  pdftk f1.pdf dump_data output metadata.txt
  pdftk f1.pdf dump_data output metadata.txt
 
# Editar metadata.txt a gusto del consumidor (se pueden añadir campos nuevos)
Editar metadata.txt a gusto del consumidor (se pueden añadir campos nuevos.
 
  pdftk f1.pdf update_info metadata.txt output f2.pdf
  pdftk f1.pdf update_info metadata.txt output f2.pdf



Revisión del 20:41 1 abr 2018

Crear un jpg con la primera pagina:

gs -q -sDEVICE=jpeg -dBATCH -dNOPAUSE -dFirstPage=1 -dLastPage=1 -r300 -sOutputFile=test.jpg test.pdf

Extraer una imagen, de la primera pagina, (por ejemplo la portada):

pdfimages -f 1 -l 1 -j fichero.pdf pgs

Secuencia de comandos para partiendo de un libro que estaba escaneado, con una imagen por página, pero con 2 paginas reales por imagen y muchos bordes blancos, hacer un PDF mejor, con una página real por pagina PDF y sin bordes blancos:

# Extraer todas las imágenes
pdfimages -j fichero.pdf pgs
# Cortar las imágenes por la mitad, supongamos que la imagen es de 1200x500
for f in pgs-???.ppm ; do convert $f  -crop 600x500! $f.%d.ppm; done

# Quitar los bordes blancos
for f in pgs-???.pbm.[01].jpg ; do  convert $f  +repage -fuzz "99%" -trim $f.trim.jpg; done
# Recrear el PDF a partir de las imágenes nuevas:
convert pgs-???.ppm.?.ppm fichero.pdf

Crear un PDF a partir de imágenes convirtiendo el tamaño (como mucho de X de alto o de Y de ancho, respetando el aspecto)

convert * -resize XxY fichero.pdf

Ponerle metadata (XMP) para que el e-reader lo muestre:

# extraer metadata a fichero
pdftk f1.pdf dump_data output metadata.txt
# Editar metadata.txt a gusto del consumidor (se pueden añadir campos nuevos)
pdftk f1.pdf update_info metadata.txt output f2.pdf

Un método mejor que no requiere archivo intermedio y edición manual:

exiftool -Title="This is my title" -Author="Cobarde Anonimo" my.pdf