Este es un problema real que se aplica a los elementos de etiquetado en general (y sí, esto también se aplica a StackOverflow, y no, no es una pregunta acerca de StackOverflow).Jerarquía de etiquetas y manejo de
Todo el problema de etiquetado ayuda a agrupar elementos similares, independientemente de los elementos que puedan ser (chistes, publicaciones de blog, preguntas, etc.). Sin embargo, existe (normalmente pero no estrictamente) una jerarquía de etiquetas, lo que significa que algunas etiquetas implican otras etiquetas también. Para usar un ejemplo familiar, la etiqueta "C#" también implica ".net"; Otro ejemplo, en una base de datos de bromas, una etiqueta de "rubias" implica la etiqueta "burlona", similar a "irlandés" o "belge" o "canadiense", etc. dependiendo del origen del país del chiste.
¿Cómo ha manejado esto, si tiene, en sus proyectos? Proporcionaré una respuesta que describa dos métodos diferentes que he utilizado en dos casos separados (en realidad, el mismo mecanismo pero implementado en dos entornos diferentes), pero también me interesan no solo los mecanismos similares, sino también su opinión sobre el problema de jerarquía. .
Clay Shirky fue muy interesante. Obviamente, el factor de proximidad (en el ejemplo de la base de datos) se introdujo para suavizar los términos relacionados (un ejemplo en el artículo de 'gay' y 'queer'). – tzot
Por alguna razón no pude encontrar el enlace al artículo de Clay Shirky en la página de WikiAnswers. Aquí está: http://www.shirky.com/writings/ontology_overrated.html. Me gustó también. –