2009-06-24 14 views
5

Estoy buscando construir un mapa de temas para catalogar contenido.Creación de una jerarquía de temas para indexar contenido

Por ejemplo 'Arte' el tema puede haber sub categorías de 'Historia del Arte', 'Pintura', 'Escultura', etc, etc

me he arrastrado unos recursos en línea, pero me he pegado a una problema relacionado con la forma en que deseo usar la jerarquía.

Tengo un montón de contenido que deseo indizar por tema. Entonces, para dar el ejemplo anterior, si un usuario busca 'Arte', entonces no solo obtendrá algo que mencione 'Arte', sino también cualquier cosa que mencione 'Pintar', incluso si no menciona 'Arte'. Lo suficientemente justo.

Pero si, en otra parte de mi jerarquía, tengo 'Mantenimiento de casa', por ejemplo, entonces eso también podría tener un subtema de 'Pintura'.

Pero luego, si un usuario busca 'Art', mi motor dirá 'bueno, Painting es una subcategoría de' Art ', así que incluiré esta cantidad de contenido sobre el mejor color para pintar paredes del baño ....

¿Alguien ha encontrado este problema antes? He intentado buscar en Google, pero sin saber la terminología exacta es difícil avanzar.

EDITAR: Más sucintamente, 'Pintura' es un subtema de 'Arte', pero si se trata de 'Pintura', entonces no se sigue necesariamente que se trata de "Arte", ya que "Arte" no es el único padre de "Pintura".

Respuesta

0

Desde desea procesar Casa/Pintura y Arte/Pintura diferente, entonces parece que usted necesitará dos entradas distintas de Pintura (uno para cada sentido). Con cuál asocie un determinado "trozo de texto" podría basarse en las pistas de contexto del texto en sí, si su procesador de texto es lo suficientemente poderoso.

Por ejemplo, cada vez que tenga un conflicto de este tipo, buscar en el texto - es lo que ves otras palabras, no? ¿Como 'fregadero', 'pared', 'madera dura' o 'ventanas'? ¿O ven otros términos como 'Monet', 'impresionismo', 'lienzo' y 'galería'? Eso te permitirá automatizar la decisión y debería ser bastante preciso. El único inconveniente es que esto presupone que tiene un diccionario bastante saludable de '' los términos relacionados por ahí en alguna parte.

Al final del usuario, cuando se selecciona Pintura, simplemente tiene que fusionar todos los resultados o presentarle al usuario una opción para seleccionar el tema principal desde el que desea ver los resultados.

+0

Mejor uso diferentes términos, p. Ej. "pintura (decoración)" y "pintura (arte)". Es una tontería, lo sé, solo un ejemplo de cómo podrían diferenciarse. – helcim

0

No conozco un nombre específico para eso, pero tampoco creo que realmente deba ser un problema. Todo lo que se requiere es que Art/Painting y House Maintenance/Painting se entiendan como entidades separadas. Alguien que busca "arte" obtiene subcategorías de Arte, por lo que obtiene Arte/Pintura. Alguien que busca "mantenimiento de la casa" obtiene subcategorías de Mantenimiento de la casa, por lo que obtiene Mantenimiento/Pintura de la casa. Alguien que busca "pintar" obtiene Arte/Pintura y Mantenimiento/Pintura de la casa, lo cual es apropiado.

+0

El problema es que mi contenido no tiene contexto - sólo tengo trozos de texto. Entonces, si una parte del texto menciona "Pintura", ¿debería ir en el Nodo de Artes/Pintura, o en el nodo de HM/Pintura? ¿O ambos? – PaulJWilliams

+0

Oh, ya veo. No entendí que estabas hablando de categorización automática. Ese es el término que te sugiero que googlees, entonces. – chaos

2

Si el Mapa del tema que está creando está construido en Topic Maps technology, entonces subjectIdentifiers se puede utilizar para distinguir dos Temas con el mismo nombre (ambos llamados "Pintura") que representan dos Sujetos diferentes (Pintura como forma de arte, y Pintura en el sentido de renovación del hogar).

Si alguien consulta sobre Arte y profundiza en Pintura, solo puede devolver aquellas entradas relacionadas con "Pintar como una forma de arte" porque esas entradas de Pintura ya no se juntan en un montón.

2

Llegando tarde a esta fiesta (es probable que ya la hayas construido o sigas adelante o encontraste una respuesta) pero pensé en agregar 2 centavos trabajando en un CMS de Topic Map basado en mapas.

Lo que se está perdiendo en su descripción es cómo se vinculan los temas. El tema está vinculado por medio de Asociaciones que en sí mismas tienen Tipo y Roles. Entonces, sí, pintar sería un arte y un mantenimiento de la casa, pero estaría vinculado de manera diferente.

La definición de su tipo y función depende de usted, no hay reglas duras y rápidas en realidad depende de sus propias tendencias. Así

Tema: Arte

Asociación: Fuente = Arte, Referencia = Painitng, Tipo = Cultura, Papel = Práctica

Tema: mantenimiento de la casa

Asociación: Soruce = mantenimiento de la casa, de referencia = Pintura, Tipo = bricolaje, función = Actividad

Apego a la categorización pero espero que pueda ver a qué me refiero. Filtrarías tus búsquedas según el tipo y el rol. Por lo tanto, si alguien buscara arte, volvería a pintar y, si desea profundizar más y devolver temas relacionados, está hablando de devolver temas relacionados con la cultura y no temas relacionados con bricolaje.

Mapas de tema si se hace bien son extremadamente flexibles, también tiene alcance y lenguaje integrados si lo hace bien. Debería poder vincular los mismos temas en 100 formas diferentes y ver los datos de manera diferente dependiendo de su punto de partida.

3

En "mapas conceptuales", tal como se entiende en la norma relacionada puede establecer diferentes ámbitos "" a un tema. Así que "pintar" puede ser parte de dos ámbitos, con diferentes significados.

Un mapa conceptual: http://www.ontopia.net/page.jsp?id=vizigator

Alcance: http://www.ontopia.net/topicmaps/materials/tao.html#stp-scope

+1

Buena respuesta: los ámbitos son la forma correcta de resolver esto, es decir, el tema de Pintura en Casa sería de alcance "Doméstico", tal vez, mientras que el tema de Pintura separado en Arte sería de alcance "Cultura". Si alguien tiene una representación artística, como un mural que sirve para cubrir toda una pared, podría clasificarse en ambos temas. El motor de mapa de temas mantiene los dos temas separados a través de un ID de tema único para cada tema (el tema es el concepto/cosa del mundo real). – RichVel

Cuestiones relacionadas