¿Existen herramientas más sólidas que Automator para extraer texto de múltiples PDF?

3

Hay una acción en Automator que le permite programáticamente " Extraer texto PDF ", pero falla cuando se alimenta una cantidad moderada de archivos (25 a 100). Peor aún, falla sin registrar nada útil, excepto por un mensaje que indica que "Automator se cerró inesperadamente".

¿Alguien sabe de un comando equivalente para hacer esto en Applescript? Estoy buscando herramientas donde tenga más control sobre cosas como el registro y el manejo de errores para que pueda ser más eficiente en el procesamiento de archivos PDF en un formato de texto.

    
pregunta user141146 30.04.2013 - 15:01

1 respuesta

2

No sé cómo se compara con otras opciones, pero podría usar pdfotext. Se puede instalar con brew install xpdf .

do shell script "/usr/local/bin/pdftotext /usr/share/doc/bash/bash.pdf -" without altering line endings

Calibre también viene con algunas utilidades de línea de comandos:

/Applications/calibre.app/Contents/MacOS/ebook-convert /usr/share/doc/bash/bash.pdf /tmp/output.txt

Preguntas relacionadas:

respondido por el user495470 30.04.2013 - 15:40

Lea otras preguntas en las etiquetas