¿Utilidad de línea de comando comercial para transcribir notas de voz a texto?

5

Estoy buscando una utilidad de línea de comandos comercial para transcribir mis notas de voz MP3 en archivos de texto. Mi flujo de trabajo es grabar notas de voz a lo largo del día y subirlas como archivos MP3 a Dropbox. Me gustaría convertir estos archivos MP3 a archivos TXT equivalentes por lotes. Mis notas de voz van desde < 1 minuto a un máximo de ~ 10 minutos.

Intenté usar Dragon Dictate 4 para Mac y encontré esta aplicación una pesadilla para usar y muy poco confiable. Me complacería comprar una versión reducida de esta aplicación que solo transcriba archivos de audio, pero no puedo encontrar un producto de este tipo en el sitio web de Nuance. Desafortunadamente, no pude conseguir que esta aplicación funcionara de manera tan confiable como para buscar una API o una interfaz de scripting ... y estoy un poco asustado por este proveedor después de leer sobre experiencias similares de otros usuarios.

También he analizado los servicios en la nube, pero los que he encontrado parecen ser bastante caros: $ 0.20 / minuto y con limitaciones en el tamaño máximo de archivo de audio que se pueden cargar.

    
pregunta Brett Bond 31.03.2015 - 19:12

1 respuesta

4

Dudo que puedas encontrar una aplicación comercial de línea de comandos.

Puede utilizar mejor una biblioteca de código abierto como pocketsphinx enlace

Para transcribir un archivo puede usar la última versión 5prealpha:

   ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
   pocketsphinx_continuous -infile file.wav -logfn /dev/null

que debería darle una transcripción automatizada. Para aumentar la precisión, puede adaptarse a su propia voz.

    
respondido por el Nikolay Shmyrev 02.04.2015 - 10:57

Lea otras preguntas en las etiquetas