¿Hay alguna biblioteca, preferiblemente en python pero al menos de código abierto, que pueda resumir y/o simplificar el texto en lenguaje natural?resume el texto o simplifica el texto
Respuesta
no estoy seguro de si hay actualmente ninguna bibliotecas que hacen esto, como el resumen de texto, o al menos comprensible resumen texto no es algo que se logra fácilmente mediante una simple biblioteca de juego enchufe &.
Éstos son algunos enlaces que pude encontrar sobre los proyectos/recursos que están relacionados con el resumen de texto para empezar:
- The Lemur Project
- Python Natural Language Toolkit
- O'Reilly's Book on Natural Language Processing in Python
- Google Resource on Natural Language Processing
- Tutorial : How to create a keyword summary of text in Python
Espero que ayude :)
Algunos enlaces muertos en la respuesta, reemplazados por páginas en caché de https://archive.org/web/ –
No pitón pero MEAD va a hacer el resumen de texto (está en Perl). Por lo general, lo que sale es comprensible, si no siempre, con un sonido particularmente fluido. Consulte también summarization.com para obtener mucha información útil sobre la tarea de resumen de texto.
, el enlace de summarization.com está muerto. Sustituirlo amablemente – GadaaDhaariGeek
Pruebe Open Text Summarizer que se publica bajo la licencia de código abierto GPL. Funciona razonablemente bien, pero no ha habido ningún trabajo de desarrollo en él desde 2007.
El código original está escrito en C (una biblioteca y una utilidad de línea de comandos) pero hay envoltorios para él en varios idiomas:
C# http://ots.codeplex.com/ –
Necesitaba también lo mismo, pero no pude encontrar nada en Python que me ayudó a tener un completo Resultado.
Así que encontré este servicio web realmente útil, y tienen un API gratuito que da un resultado JSON, y quería compartirlo con usted.
Échale un vistazo aquí: http://smmry.com
Tal vez usted puede intentar sumy. Es una biblioteca bastante pequeña que escribí en Python. Se implementan los enfoques de Luhn y Edmundson, el método LSA, los algoritmos SumBasic, KL-Sum, LexRank y TextRank. Tiene licencia de Apache2 y es compatible con los idiomas checo, eslovaco, inglés, francés, japonés, chino, portugués, español y alemán.
No dude en abrir un problema o enviar una solicitud de extracción si hay algo que falta.
Me encanta Sumy. Es muy fácil de usar. ¿Cuál es tu método preferido? ¿No es 'LSA' la metodología de lenguaje natural más reciente y teóricamente la mejor en comparación con las otras opciones? – Houman
Hola, gracias. Como con casi todo, no hay una bala de plata, pero LSA es el método más avanzado en suma. –
Hace un tiempo, escribí una biblioteca de resumen para Python usando NLTK, usando un algoritmo de la biblioteca Classifier4J. Es bastante simple, pero puede adaptarse a las necesidades de cualquier persona que necesite resumen: https://github.com/thavelick/summarize
Tome un vistazo a este article que hace un estudio detallado de estos métodos y paquetes:
- Lex_rank (sumy)
- LSA (sumy)
- Luhn (sumy)
- PyTeaser
- Gensim TextRank
- PyTextRank
- Google TextSum
El final del artículo hace un 'summary'.
El autor de sumy @miso.belica ha dado una descripción en la respuesta anterior.
Varias otras técnicas de ML han aumentado, como Facebook/NAMAS y Google/TextSum, pero todavía se necesita una amplia capacitación en Gigaword Dataset y unas 7000 GPU horas. El conjunto de datos en sí es bastante costoso.
En conclusión, diría que sumy es la mejor opción en el mercado ahora mismo si no tiene acceso a máquinas de alta gama. Muchas gracias @ miso.belica por este maravilloso paquete.
- 1. Usando el campo o texto de LiftScreen
- 2. Detecta si el carácter se simplifica o el carácter chino tradicional
- 3. Gire un botón (o el texto dentro) en el código
- 4. Cómo borrar el texto en el texto de edición
- 5. jQuery - obtener el texto para el elemento sin hijos texto
- 6. Reemplazar el texto seleccionado en el área de texto
- 7. Cambiar el color del texto en el campo de texto
- 8. Seleccione el texto enfocado
- 9. Rompiendo texto grande en páginas en el selector de texto de Android o ver flipper
- 10. div Rellenar con el texto
- 11. Cuadro de texto enriquecido cómo resaltar el bloque de texto
- 12. Insertar texto en el cuadro de texto de otra aplicación
- 13. Cómo rotar el texto Swing?
- 14. ¿Cambiar el texto del lapso?
- 15. ImageMagick - Texto en el rectángulo
- 16. Jquery para poblar la entrada o el área de texto
- 17. linux + verificar si el archivo es de texto o binario
- 18. link_to con el texto interior o HTML en los carriles
- 19. cómo controlar o cambiar todo el texto a mayúsculas
- 20. ¿arrastrar archivos o carpetas en el cuadro de texto? C#
- 21. Ajustar palabra de cordón o mostrar el texto completo
- 22. Matcher.appendReplacement con el texto literal
- 23. Mostrar el texto truncado normalmente, pero mostrar el texto completo en el control deslizante
- 24. ¿Cambiar el color del texto cuando se pasa el mouse sobre el texto con Tkinter?
- 25. PHP Reparar el texto incorrecto
- 26. Bloquea seleccionar texto o seleccionar texto múltiple a la vez
- 27. Cómo leer el texto de un texto Tkinter Widget
- 28. Buscar el texto que comienza con otro texto
- 29. jQuery ajustar el texto seleccionado en un área de texto
- 30. cómo obtener el texto de Vista de Texto
Hay otra biblioteca que se basa en el algoritmo 'TextRank' que puede encontrar aquí. https://github.com/RaRe-Technologies/gensim – prashanth
Casi no hay ningún programa que pueda hacer esto. – Olaf