2010-11-15 28 views
5

He estado buscando una forma de capturar texto estructurado (secciones, párrafos, énfasis, listas, etc.) en JSON, pero todavía no he encontrado nada. ¿Alguna sugerencia? (El cambio se me pasó por la cabeza, pero podría haber algo mejor por ahí.)Texto estructurado en JSON

Respuesta

5

HTML es una forma bien establecida de describir texto estructurado, en un formato de texto sin formato (!). Markdown (como mencionas) funcionaría también.

Mi opinión es que probablemente su mejor opción sea utilizar algún tipo de marcado de texto sin formato, como esas opciones, y colocar el texto en una sola variable de cadena JSON. Dependiendo de su aplicación, puede tener sentido tener una matriz de secciones, que contiene una matriz de párrafos, que contiene una matriz de secciones normales/en negrita/lista, etc. Sin embargo, en el caso general, creo que los bloques pasados ​​de moda son markup irónicamente será más limpio y más escalable, debido a la facilidad de pasarlos, y las bibliotecas bien desarrolladas para un análisis completo si es necesario.

5

¿Qué tal algo como esto:

[ { "heading": "Foobar Example" }, 
    { "paragraph": 
    [ 
     "This is normal text, followed by... ", 
     { "bold": "some bold text" }, 
     "etc." 
    ] 
    } 
] 

Es decir:

  • utilizar una cadena de texto sin formato u otro recargo;

  • utilice una matriz cada vez que desee indicar una secuencia ordenada de ciertos elementos de texto;

  • utilice un objeto donde la tecla indica el marcado y el valor del elemento de texto al que se aplica el formateo.

+0

¿Por qué esto obtuvo un voto a favor? Dependiendo del caso de uso del solicitante, esta puede ser una gran solución. (Quizás está almacenando un documento de texto completo en JSON, como parte de un almacén de datos, o algo así). –

Cuestiones relacionadas