Estoy buscando referencias (tutoriales, libros, literatura académica) sobre la estructuración de texto no estructurado de forma similar al botón de agregar rápido de Google Calendar.Texto no estructurado a datos estructurados
Entiendo que esto puede pertenecer a la categoría PNL, pero estoy interesado sólo en el proceso de pasar de algo así como "pantalones vaqueros Levi tamaño de 32 A0b293"
a: Marca: Levi, Tamaño: 32, Categoría: Jeans, código: A0b293
Imagino que sería una combinación de análisis léxico y técnicas de aprendizaje automático.
soy bastante idioma agnóstico, pero si se les presiona preferirían pitón, Matlab o referencias C++
Gracias
¿Qué tan limitado es su dominio? Google Calendar Quick Add solo analiza las fechas y las horas (y no siempre tan bien). El cuadro de búsqueda de Google Maps solo trata con ubicaciones. La dificultad de hacer esto depende de qué tan estrecho sea su dominio.(¿Un catálogo de productos?) – tcarobruce
Restringido para tratar con clotthes como en el ejemplo – zenna