2010-04-14 23 views
8

Estoy buscando crear una aplicación de Facebook y los datos que deseo utilizar no están disponibles, excepto en formato CHM.Convertir archivo CHM a CSV o SQL

¿Es posible convertir archivos CHM a CSV o SQL? ¿Tenemos alguna herramienta existente para esto?

Gracias por la ayuda como siempre.

+6

lol @ cerrar votantes. ¿Buscando una excusa para probar "demasiado localizado"? – xyz

+0

¿Has encontrado algo similar para KU'AN a.z. Quiero hacer la traducción de XML Kur'an al bosnio – adopilot

+0

No, no busqué el Corán. De hecho, estoy haciendo una aplicación de Facebook para publicar aleatoriamente un hadiz en la pared de los usuarios. así que solo los necesitaba para llenar la base de datos, supongo que necesito ir con el procedimiento @mjv y luego usar expresiones regulares en los archivos para hacer mi propia base de datos –

Respuesta

3

Por cierto, debe especificar el idioma (inglés, árabe ...) en el que desea construir este conjunto de datos, ya que esto afecta tanto a la selección de las fuentes del libro como a las utilidades de conversión.

Identifiying fuentes de contenido de datos:
Curiosamente, y para todos los [Interactivo] línea Hadiz búsqueda herramientas tales como el de la
CRCC's Compendium of Muslim Texts sitio (original del MSA West, pero de alguna manera no disponibles/trabajar en Sitio de MSA más), no parece haber ninguna versión con capacidad de descarga de las bases de datos subyacentes.
Existen varias versiones en línea de libros, en particular los populares que usted menciona, pero luego tendría que analizarlos e indexarlos adecuadamente para conservar las referencias, etc. Además, yendo "atrás" a los libros, lo haría tiene que relacionarlos usted mismo.

En cuanto a la conversión de archivos CHM ...
No hay código abierto o un programa freeware que yo sepa, pero la version de prueba ABC Amber CHM converter (c. $ 25.00) parece ser el estándar de oro para ese propósito.
Hace solo un par de años, tuve la oportunidad de aprobar este software por un único trabajo de conversión similar al que está contemplando. El convertidor de Amber "hizo el truco"; Afortunadamente, la estructura subyacente de las páginas de ayuda expuso mucha regularidad, lo que permitió una tabulación relativamente sencilla en los campos de CSV/base de datos.
El convertidor ABC Amber admite muchos idiomas, incluido el árabe (pero lo usé solo para inglés).

1

Existe una conocida fuente abierta * nix lib llamada libchm en la que se basan la mayoría de los * nx chm viewers. Viene con una herramienta para descomprimir .chm a sus originales .html (a partir de la cual tendrías que convertir las tablas html en .csv)

Lazarus/Free Pascal también tiene librerías, incluso puede escribir, pero afaik no herramienta "compilador chm".

+0

gracias +1 .. pero estaba buscando una solución de Windows –

+0

Hay ventanas versiones, creo Hay alguna posibilidad de que la cosa Amber lo esté usando. –