2009-06-06 15 views
5

Quiero analizar un archivo PDF desde mi aplicación C# y crear un archivo de audio fuera de él. ¿Cómo haría eso?¿Cómo leer un archivo .pdf programáticamente y convertirlo a audio (formato .mp3)?

Estoy especialmente buscando una buena biblioteca de PDF a texto o una manera de quitar un archivo pdf de su texto.

+1

Al principio pensé que esto era una broma, y ​​luego me di cuenta de que quería decir escuchar el texto :) – Zifre

+0

¡Prefiero usar Acrobat Reader! –

+1

@Zifre - ¡gracias a Dios, aclaraste que estaba a punto de romper a llorar con esto! – joshcomley

Respuesta

0

Supongo que es algo difícil de hacer. En primer lugar, debe leer el texto en ese pdf y luego usar algún mecanismo de generación de voz sintética para crear el contenido de audio. Entonces tienes que almacenarlo como un mp3.

2

Necesita el Speech SDK de Microsoft. Lea una instrucción here

4

Utilice Festival para el texto a voz. Existen varias API de texto a texto ...

+0

¿Cómo se puede usar Festival para generar archivos de audio? Todavía estoy tratando de resolver esto. –

0

En Mac OS X, puede extraer el texto del pdf y luego canalizarlo en "decir". Debería encontrar sintetizadores equivalentes en otros sistemas operativos.

0

No es tan complicado de hacer, siempre que no reinvente la rueda, simplemente reutilice la tecnología existente (es decir, motores de texto a voz como festival), así como los motores de OCR para procesar los archivos PDF .

Lo más complicado probablemente sea trabajar con diferentes diseños de PDF (columnas, filas, gráficos incrustados, notas al pie, URL, etc.), lo que puede ofuscar el proceso de reconocimiento de texto.

Sin embargo, en general (si esto no se supone que es una experiencia de aprendizaje), sin duda es más fácil simplemente recurrir al uso de soluciones de software existentes:

5

Preferiblemente tiene un documento tagged PDF como documento de entrada. Esto significa que el documento contiene etiquetas para marcar la estructura lógica del documento (por lo general, un documento PDF solo contendrá información visual).

Este PDF podría convertirse en formato DAISY, que es un estándar para libros parlantes digitales, es decir, un formato XML intermedio que almacena el texto de libros junto con la estructura lógica y las funciones de navegación.

Este formato Daisy XML puede ser converted to an audio format, o puede utilizar un lector Daisy, un dispositivo físico como un reproductor de MP3 para escuchar el libro.

hay una presentación disponible en el sitio web de la margarita para explicar los principios de esta cadena de herramientas:

Accessible PDF to DAISY/NIMAS Conversion

2

Como los otros críticos describen, primero hay que extraer el texto de la. archivo PDF. Los archivos pdf ahora son un formato abierto, por lo que probablemente pueda encontrar un analizador sintáctico a través de Google.

Luego tiene que extraer el texto que desea convertir a voz del archivo, haciendo caso omiso de cosas como títulos de figuras, encabezados de página, tabla de contenidos, etc.

Una vez que tenga el texto, debe convertirlo a voz. Esta es probablemente la parte más difícil.

Hace un tiempo estaba jugueteando con la generación de archivos de voz para un mod de juegos, ya que soy un actor de voz podrida.

Cepstral tenía los mejores convertidores TTS que pude encontrar. (Los gratuitos tenían una tendencia molesta a insertar anuncios Cepstral en el discurso, pero pude editarlo manualmente por lo que estaba haciendo).

Resulta que hay un lenguaje de marcado de síntesis de voz que se puede usar para proporcionar pistas para el convertidor de TTS sobre qué sílaba de colocar acentos, etc. Aquí hay una Linky:

http://www.w3.org/TR/speech-synthesis/

cómo se van añadiendo alrededor automáticamente el SSML al texto es un poco más allá de mí.

De todos modos, el convertidor TTS producirá un archivo de audio, y el paso final sería comprimir el audio a la velocidad de bits deseada en formato mp3.

2

Si su única tarea es escuchar el texto sintetizado de un PDF, ¿qué tal la función "Leer en voz alta" de Acrobat en la parte inferior del menú "Ver"?

Cuestiones relacionadas