Estoy buscando las especificaciones del formato TREC. He estado buscando en Google mucho pero no encontré una pista.¿Qué es el formato TREC?
¿Alguien sabe dónde encontrar información al respecto?
Estoy buscando las especificaciones del formato TREC. He estado buscando en Google mucho pero no encontré una pista.¿Qué es el formato TREC?
¿Alguien sabe dónde encontrar información al respecto?
yo sepa TREC es una abreviatura de texto del NIST Conferencia recuperación. Para que el indexador sepa dónde están los límites del documento dentro de los archivos, cada documento debe tener el documento de inicio y las etiquetas del documento final. Estas etiquetas son similares a las etiquetas HTML o XML y en realidad son el formato de los documentos TREC.
TrecParser: Este analizador reconoce el texto en los campos TEXTO, HL, CABEZA, TITULAR, TTL y LP.
Fuente: TREC Wikipedia
Fuente: Lemur Guide
También es un nuevo formato de archivo de grabación para TechSmith Camtasia. https://feedback.techsmith.com/techsmith/topics/mac_upgrade-ri5ox
También es el formato de archivo utilizado por IBM Watson para la ingestión de conocimiento