¿Cuál es la velocidad de conversación predeterminada para el programa de síntesis de voz?

4

He estado buscando en todo el Internet, pero parece que no puedo encontrar la tasa de habla predeterminada para el programa de síntesis de voz incorporado en Mac OS.

say "What to say" -r <rate>

Como se muestra arriba, hay una manera de especificar la tasa de habla (wpm) pero no hay ningún lugar donde se especifique la tasa predeterminada.

¿Alguien tiene una idea de lo que es?

    
pregunta keto23 20.07.2013 - 02:57

3 respuestas

3

Las tarifas de voz predeterminadas se pueden cambiar realmente desde Preferencias del sistema:

Elcontroldeslizantesepuedeconfigurarenunaposicióndiferenteparadiferentesvoces.CuandointentéarrastrarloscontrolesdeslizantesdeAlexyMikkoalmedio,losWPMquesemuestranenlasalidadeabajofueron175y180.

$defaultsreadcom.apple.speech.voice.prefsVoiceRateDataArray((1835364215,201,175),(1919902066,546,180))

Lassalidasdesay-r175ysaysinunaopción-rfueronidénticasparaAgnes,AlexyBruce,ycasiidénticasparaotrasvoces.Pero,porejemplo,latasadevozpredeterminadadelavoz"Bahh" es mucho más lenta.

$ say -v ? | sed 's/  .*//' | while read l; do say -v "$l" -r 175 {1..9} -o "$l 1.aif"; say -v "$l" {1..9} -o "$l 2.aif"; done
$ stat -f '%z %N' *
120136 Agnes 1.aif
120136 Agnes 2.aif
131692 Albert 1.aif
180260 Albert 2.aif
122968 Alex 1.aif
122968 Alex 2.aif
231596 Bad News 1.aif
231820 Bad News 2.aif
131692 Bahh 1.aif
180264 Bahh 2.aif
318508 Bells 1.aif
318488 Bells 2.aif
131692 Boing 1.aif
164368 Boing 2.aif
116514 Bruce 1.aif
116514 Bruce 2.aif
131692 Bubbles 1.aif
138860 Bubbles 2.aif
196652 Cellos 1.aif
197088 Cellos 2.aif
131692 Deranged 1.aif
150720 Deranged 2.aif
131692 Fred 1.aif
138860 Fred 2.aif
331052 Good News 1.aif
331492 Good News 2.aif
301932 Hysterical 1.aif
301916 Hysterical 2.aif
131692 Junior 1.aif
144676 Junior 2.aif
131692 Kathy 1.aif
144676 Kathy 2.aif
118196 Kyoko 1.aif
114440 Kyoko 2.aif
420970 Mikko 1.aif
408432 Mikko 2.aif
228012 Pipe Organ 1.aif
228448 Pipe Organ 2.aif
131692 Princess 1.aif
144676 Princess 2.aif
131692 Ralph 1.aif
144676 Ralph 2.aif
128810 Sin-Ji 1.aif
124834 Sin-Ji 2.aif
131692 Trinoids 1.aif
138860 Trinoids 2.aif
119410 Vicki 1.aif
116118 Vicki 2.aif
122742 Victoria 1.aif
119444 Victoria 2.aif
131692 Whisper 1.aif
150724 Whisper 2.aif
131692 Zarvox 1.aif
138860 Zarvox 2.aif
    
respondido por el user495470 20.07.2013 - 08:50
0

No es una forma "agradable" de hacerlo, pero puede hacer algunas muestras, tal vez a partir de 120 ppm, y compararlas con una grabación de control de la velocidad "predeterminada" (obviamente, con todas las grabaciones usando la misma voz y texto). Para mayor precisión, puede cargar los archivos en cualquier aplicación de edición de audio básica y ver las formas de onda para comparar realmente la velocidad de una grabación y otra. No puedo imaginar que tomaría demasiado tiempo reducirlo. Lo haría yo mismo si tuviera tiempo ahora.

De forma alternativa, puede obtener algunas muestras de texto de longitudes conocidas (por ejemplo, 100 palabras, 200 palabras, etc.), grabar la voz y hablarlas todas en la configuración predeterminada, luego usar las duraciones para calcular el wmp promedio de todas las grabaciones . Con suficientes muestras, estoy seguro de que te acercarás.

EDITAR: Siguiendo el primer procedimiento que describí anteriormente, encontré que la frecuencia de voz predeterminada de Alex (la voz predeterminada) es exactamente 175 palabras por minuto .

A las velocidades predeterminadas y de 175 wpm, las dos formas de onda coinciden perfectamente.

    
respondido por el Tortilla 20.07.2013 - 03:01
0

720 parece máximo para la voz que estoy usando

    
respondido por el user145705 07.09.2015 - 12:37

Lea otras preguntas en las etiquetas