Dado un conjunto de palabras etiquetadas para parte del discurso, quiero encontrar aquellas que son obscenidades en el inglés general. ¿Cómo podría hacer esto? ¿Debo hacer una gran lista y verificar la presencia de algo en la lista? ¿Debo tratar de usar una expresión regular para capturar un montón de variaciones en una sola raíz?Procesamiento de lenguaje natural: ¿encuentra obscenidades en inglés?
Si lo hace más fácil, no quiero filtrar, solo para obtener un conteo. Entonces, si hay algunos falsos positivos, no es el fin del mundo, siempre que haya una tasa más o menos uniformemente exagerada.
Antes de hacer esto, es posible que desee confirmar que sus suposiciones son correctas. No querrás embarrillarte implementando esto de manera deficiente, haciendo que tus usuarios abandonen la competencia. – JulianR
sí, es por eso que no estoy solucionando nada, solo trato de contar. –
@Julian - De acuerdo, eso sería un error clbuttic. http://www.codinghorror.com/blog/archives/001176.html –