Necesito dividir texto en oraciones. Actualmente estoy jugando con la herramienta de detección de oraciones de OpenNLP. También he oído hablar de las herramientas NLTK y Stanford CoreNLP. ¿Cuál es la herramienta de detección de oraciones en inglés más precisa que existe? No necesito demasiadas funciones NLP, solo una buena herramienta para dividir/detectar oraciones.¿Cuál es la herramienta de código abierto más precisa para la división de oraciones?
También he oído hablar de Lucene ... pero puede ser demasiado. Pero si tiene un módulo de detección de oraciones kick-ass, entonces lo usaré.
Para Perl, [Lingua :: EN :: Sentence] (http://search.cpan.org/~shlomoy/Lingua-EN-Sentence-0.25/lib/Lingua/EN/Sentence.pm)? – Konerak