Estoy buscando una manera de producir automáticamente un resumen, básicamente las primeras pocas representaciones/párrafos de una entrada de blog, para mostrar en una lista de artículos (que están escritos en rebajas). Actualmente, estoy haciendo algo como esto:Extracto de artículos de computación
def abstract(article, paras=3):
return '\n'.join(article.split('\n')[0:paras])
tomar sólo las primeras líneas de un valor de texto, pero no estoy totalmente satisfecho con los resultados.
Lo que realmente estoy buscando es terminar con aproximadamente 1/3 de una pantalla llena de texto formateado para mostrar en la lista de entradas, pero utilizando el algoritmo anterior, el monto extraído termina con cantidades increíblemente variables, tan poco como una línea o dos, se mezcla frecuentemente con resúmenes de tamaño más ideal.
¿Hay una biblioteca que sea buena en este tipo de cosas? si no, ¿tiene alguna sugerencia para mejorar el resultado?
¿Qué significa "no totalmente feliz"? ¿Puedes dar ejemplos de resúmenes "incorrectos" y "correctos"? –