Como los otros críticos describen, primero hay que extraer el texto de la. archivo PDF. Los archivos pdf ahora son un formato abierto, por lo que probablemente pueda encontrar un analizador sintáctico a través de Google.
Luego tiene que extraer el texto que desea convertir a voz del archivo, haciendo caso omiso de cosas como títulos de figuras, encabezados de página, tabla de contenidos, etc.
Una vez que tenga el texto, debe convertirlo a voz. Esta es probablemente la parte más difícil.
Hace un tiempo estaba jugueteando con la generación de archivos de voz para un mod de juegos, ya que soy un actor de voz podrida.
Cepstral tenía los mejores convertidores TTS que pude encontrar. (Los gratuitos tenían una tendencia molesta a insertar anuncios Cepstral en el discurso, pero pude editarlo manualmente por lo que estaba haciendo).
Resulta que hay un lenguaje de marcado de síntesis de voz que se puede usar para proporcionar pistas para el convertidor de TTS sobre qué sílaba de colocar acentos, etc. Aquí hay una Linky:
http://www.w3.org/TR/speech-synthesis/
cómo se van añadiendo alrededor automáticamente el SSML al texto es un poco más allá de mí.
De todos modos, el convertidor TTS producirá un archivo de audio, y el paso final sería comprimir el audio a la velocidad de bits deseada en formato mp3.
Al principio pensé que esto era una broma, y luego me di cuenta de que quería decir escuchar el texto :) – Zifre
¡Prefiero usar Acrobat Reader! –
@Zifre - ¡gracias a Dios, aclaraste que estaba a punto de romper a llorar con esto! – joshcomley