Estoy planeando conseguir una oficina sin papel y para eso, ¿necesito una buena pieza de OCR para OS X?
He leído un blogpost de Marco Arment sobre algunos programas . ¿Hay algún trabajo que me permita escribir cosas?
OCRKit es compatible con AppleScript y con una CLI. Desde su página de ayuda :
AppleScript
También puede crear OCRKit para integrarlo en su flujo de trabajo específico. Por ejemplo, procesar archivos entrantes, a través de una carpeta compartida, desde la copia de MFP máquina, etc. y simplemente diga a OCRKit que abra y, por lo tanto, el proceso se realice AppleScript:
tell application "OCRKit" -- the wonders of AppleScript POSIX path handling, ... open "Users:admin:Desktop:orderform.pdf" open POSIX path of "/Users/Admin/Desktop/orderform.pdf" end tell
Línea de comando
Desde que se admiten los scripts de línea de comandos directos de OCRKit versión 2.5. Esto simplifica enormemente el uso de OCRKit en el procesamiento por lotes, permite para establecer más opciones y también es más robusto y multiplataforma que AppleCript.
OCRKit.app/Contents/MacOS/OCRKit \ --lang en | de | fr | es | ... \ --format pdf | html | rtf | text \ --no-progress \ --output out-file in-file
Dado que las opciones de línea de comandos adicionales de OCRKit versión 16.9 son compatibles:
-r, --recursive directory
Escanear el directorio de forma recursiva en busca de nuevos archivos. Omite archivos de OCRKit, con capa de texto o gráficos vectoriales.
--pattern "regex"
Patrón utilizado para hacer coincidir los nombres de archivo durante las exploraciones recursivas. El valor predeterminado es
%.pdf$
, la recomendación para TIFF es%.tiff?$
--log file
Escriba la información y las estadísticas del archivo de registro durante el escaneo recursivo al archivo.
--password secret
Use la contraseña secreta para descifrar archivos PDF durante el procesamiento por lotes.
--test-run [ fast ]
Solo ejecute el procesamiento por lotes de prueba en modo de prueba para probar archivos PDF o obtener el recuento de páginas para estimar el tiempo total de procesamiento. "rápido" sólo lo hará compruebe la primera página de cada archivo, en lugar de ir a través de todas las páginas para Análisis de imágenes y vectores.
--tag name
Use el nombre de atributo extendido para etiquetar el estado de procesamiento de los archivos durante el procesamiento por lotes.
macos:OCRKit (%s)
utilizará macOS nativos En su lugar, las etiquetas del buscador o simplementemacos:OCRKit
no incluyen el estado atributo. El orden del atributo de estado es:started
,analyzed
,processed
, y también puede serencrypted
.
Readiris para Mac. Lo tengo, pero no tengo No lo usé en mucho tiempo, así que no recuerdo exactamente lo bueno que fue. Creo que no hizo muy bien los primeros documentos, pero aprende.
Parece que Readiris tiene un diccionario de secuencias de comandos, y también es bastante bueno.
ABBYY FineReader Pro para Mac funciona bien con OCR y es compatible con scripts. Desde su página de blurb :
Procesar lotes de documentos y automatizar tareas de conversión
Alcance nuevos niveles de productividad y disfrute de una mayor flexibilidad al convertir documentos con soporte para acciones de Automator y comandos de AppleScript.
Es compatible con Applescript y Automator. No había intentado automatizarlo previamente, pero después de analizarlo, tengo algunos planes para hacer algunas cosas básicas. Esta es realmente la razón por la que estoy 'respondiendo' esta pregunta con retraso.
Lea otras preguntas en las etiquetas software-recommendation script ocr scanning