¿Cómo buscar archivos PDF y extraer páginas coincidentes con Automator?

0

Estoy tratando de hacer un flujo de trabajo de Automator que me permita:

  1. Especifique una carpeta para ejecutar las acciones en
  2. Buscar todos los archivos PDF en esa carpeta para una palabra determinada (nombre de mi cliente)
  3. Cree un nuevo archivo PDF con solo las páginas en las que aparece el nombre de mi cliente
  4. Guarda ese archivo en el escritorio

Hasta ahora, puedo realizar los pasos 1 y 2. Pero, ¿hay alguna forma de ver en qué páginas estaban las coincidencias o crear un nuevo PDF para las páginas correspondientes?

    
pregunta aszekely 08.05.2013 - 22:19

1 respuesta

1

Me doy cuenta de que esto es un año después de que hiciste la pregunta, pero me gustó el desafío. Entonces, en resumen, así es como lograría esto ...

  • Para cada PDF en la carpeta, conviértalo a Texto.
  • Use un comando perl para buscar palabras clave en los archivos de texto y devolver los números de página.
  • Use la herramienta de línea de comandos para extraer páginas de PDF.
  • Combinar páginas extraídas.

Puedes hacer la primera parte con bastante facilidad con applecript / automator.

El comando perl para obtener los números de página es:

perl -ne 'print "$1$2" if /blah/ .. /--- Page (\d+) ---(\n)/'

La herramienta de comando que se utiliza para extraer páginas de un archivo PDF se puede encontrar en users.skynet.be/tools/

Finalmente, para fusionar las páginas individuales también se puede hacer con automator o las herramientas anteriores.

Espero que esto ayude.

    
respondido por el Vic 18.03.2014 - 11:03

Lea otras preguntas en las etiquetas