Java: Descripción general de los motores de texto a voz

Ahora estoy en la búsqueda de un marco de trabajo de Java Text to Speech (TTS). Durante mis investigaciones, he encontrado varios frameworks compatibles con JSAPI1.0 (parcialmente) enumerados en JSAPI Implementations page, así como un par de frameworks Java TTS que no parecen seguir las especificaciones JSAPI (Mary, Say-It-Now). También noté que actualmente no existe implementación de referencia para JSAPI.Java: Descripción general de los motores de texto a voz

Las breves pruebas que he hecho para FreeTTS (la primera enumerada en la página JSAPI impls) muestran que está lejos de leer palabras simples y obvias (ejemplos: ABC, pizarra). Otras pruebas están actualmente en progreso.

Y aquí va la pregunta (6, en realidad):

¿Cuál de los marcos TTS basados en Java ha utilizado?
¿Cuáles, en su opinión, son capaces de leer la base de palabras más grande?
¿Qué pasa con la calidad de su voz?
¿Qué hay de su rendimiento?
¿Qué frameworks no Java con enlaces Java hay en la escena?
¿Cuál de ellos recomendaría?

Gracias de antemano por sus comentarios y sugerencias.

Fuente

2008-09-27 DiaWorD

Consulte [estas preguntas frecuentes de JSAPI y la lista de implementaciones] (http://www.oracle.com/technetwork/java/jsapifaq-135248.html), en el sitio de Oracle. –

De hecho, he tenido muy buena suerte con FreeTTS

Fuente

2008-09-27 11:36:42 pfranza

No lo hice. Llega al error de sonido de Linux Java, descrito aquí http://stackoverflow.com/questions/2486985/freetts-problem-in-java –

A partir de 2014 FreeTTS parece muerto. (Http://en.wikipedia.org/wiki/ FreeTTS) – Stephan

FreeTTS no puede registrar ninguna voz de MBROLA al lado de las de EE. UU. Aunque ofrezcan otras voces en su página. Total falla, no puedo recomendarlo en absoluto. – jAC

He usado Mary antes y quedé muy impresionado con la calidad de las voces. Lamentablemente, no he usado ninguno de los otros.

Fuente

2008-09-27 10:58:04

Mary no es fácil de usar. Está poco documentado y el proceso de instalación es abismal (espacios en nombres de directorio, lo que impide que los archivos de clase se encuentren en sistemas basados en Unix). –

http://mary.dfki.de/ –

Probé con diferentes soluciones TTS y finalmente me quedé con MaryTTS. Funciona bastante bien y la configuración con Maven no es tan difícil. Lo puedo recomendar – jAC

Muchas gracias a todos, el truco está en la fuente FreeTTS. Brevemente: si se ejecuta como java -jar freetts.jar some-more-args-here, deletrea palabras menores que cuando se ejecuta de una manera bin/Server.jar y bin/Client.jar.

Fuente

2008-09-29 09:28:21 DiaWorD

He usado AT&T Natural Voices que proporciona los ganchos JSAPI y MS SAPI. Proporciona voces de excelente calidad, un buen diccionario de voz "general", muchos controles sobre la pronunciación y múltiples idiomas. Es un poco caro, pero funciona muy bien.

Lo usé para leer la telemetría del sensor importante a los conductores en una aplicación de sensor móvil. No tenemos quejas sobre la calidad de la voz. Tenía aproximadamente un 75% de precisión de fábrica con términos científicos y un nivel mucho más alto (quizás un 90% o más) con un diálogo normal. Logramos hasta aproximadamente el 99% de precisión mediante el uso de marcas (la mayoría de los errores estaban en términos científicos con combinaciones inusuales de fonemas).

Ha sido un poco difícil para el procesador (estábamos usando una máquina equivalente Pentium-III y estaba presionando un 50% -75% de CPU pico). Utiliza un motor de voz nativo (compatible con Windows, Linux y Mac) con una interfaz Java.

Hay una gran variedad de voces e idiomas ...

Fuente

2008-09-29 19:30:42

Solía FreeTTS pero tenía un problema importante conseguir las voces Mbrola se ejecute en Mi MacbookPro. Obtuve voces de MBrola para ejecutar en Windows (dolorosamente) y Linux. No he tenido suerte cargando otros paquetes de voz en FreeTTS, lo cual es una lástima porque las voces provistas son IMO horribles. Fuera de eso tuve un pequeño éxito con Cloudgarden también, pero eso solo funciona en Windows AFAIK. Me interesaría escuchar otros éxitos/fracasos con los motores de voz ya que este tipo de trabajo es particularmente desafiante. También estoy jugando un poco con Sphinx4.Acabo de sacar JVXML (que parece estar basado en Sphinx4) ayer por la noche pero no pude hacerlo funcionar por alguna extraña razón.

Fuente

2009-04-10 13:32:55 Cliff

He contribuido a Mary. Siento que tiene potencial si alguien más inteligente que yo separara las voces HMM del núcleo (esas voces no necesitan grandes conjuntos de datos y suenan bien). También estoy tratando de hacer un sistema de eventos para enviar eventos cuando dice una palabra. He tenido éxito, pero ahora está roto en Linux. (probablemente debido a un error del temporizador).

Fuente

2010-02-27 14:19:20 i30817

Google Translate tiene una API TTS secreto: https://translate.google.com/translate_tts?ie=utf-8&tl=en&q=Hello%20World

Fuente

2013-09-13 15:36:58 nvrandow

Pero dudo que sea útil – Nabin

Recibí un error 403. –

En realidad, no es una gran elección:

Festival, la mayoría de edad. Escrito en C++ pero tiene enlaces a Java.
eSpeak, qucik y simple, utilizado por Google Translate
mbrola

puro Java:

FreeTTS, cuyo código fue portado desde el Festival, y luego fue de código abierto y el desarrollo era detenido.
MaryTTS - más potente y se ve listo para la producción.

También hay otros programas propietarios como:

Acapella
Nuance Vocalizer

Si el software es sólo para Windows, puede utilizar la API de Microsoft Speech.

Fuente

2014-12-25 14:55:57 stokito

Encontré poco cómodo con MarryTTS Tiene una voz clara y multilenguaje para comprender.

T conversión de voz a texto, la mejor opción es sphinx4-5prealpha. Doy un pulgar, porque tiene ajustable, flexibilidad y reconocedor y gramómetro modificables.

Fuente

2017-08-08 12:21:31 Sushant

Java: Descripción general de los motores de texto a voz

Respuesta

Cuestiones relacionadas