2010-09-05 28 views
5

Estoy buscando realizar una búsqueda en mi base de datos en intervalos establecidos para una lista de palabras que considero ofensivas (porque soy un dictador autoritario y odio la libertad de expresión - Yo mando con puño de hierro).Base de datos de búsqueda de palabras ofensivas

¿Cómo buscaría más eficientemente mi base de datos para obtener una lista de palabras clave? Las dos columnas que intento buscar están indexadas como Texto completo.

Si alguien sabe de una lista de palabras ofensivas que también serían útiles.

Una nota para aquellos que ridiculizan mis intentos de censura

tengo tendrá dos sistemas en su lugar. La primera es una función de informe que los administradores revisan diariamente. La segunda herramienta para combatir a los disidentes es esta. Todo lo que necesita es una búsqueda de palabras para que el administrador pueda verificar y descartar si el contenido es ofensivo o no.

+2

Vale la pena señalar que esta es una pregunta genuina, todas las bromas aparte. – Starlin

+2

Este es un problema clbuttic. – Skilldrick

+0

"¿Cómo buscaría más eficientemente mi base de datos para obtener una lista de palabras clave?" Lo sentimos, tiene una lista de palabras y desea encontrar instancias en datos existentes, o utiliza la búsqueda para crear la lista de palabras que se van a censurar. –

Respuesta

2

Mysql no le dará las herramientas para una búsqueda bastante precisos, tome esta muestra, si tiene entre sus palabras:

libertad

Dado que usted es un dictador que Don 't lo desea, debería aparecer, pero los usuarios inteligentes pondrán fr33dom, que es lo mismo, ahora tiene 3 formas de salpicar esto:

  1. Usted coloca en su lista de una sola palabra y la mayoría de las derivaciones se puede imaginar
  2. usted hace una búsqueda con un gusto en su consulta MySQL, pero debe ser sloow cuando se pulse los miles, incluso con índices de texto completo
  3. Usted indexar su contenido utilizando Lucene

Me gustaría ir por el tercero, ya que Lucene es la mejor opción para realizar búsquedas, y como estás buscando palabras me imagino que estás tratando con texto, por lo que esto podría ayudar más de lo que piensas. Lucene puede ayudarte a buscar palabras similares a freedom, pero no, ¡allí no deberías perderte mucho! ¡Y su regla está garantizada!

Hay extensiones para Lucene usando Zend Framework, puedes encontrarlas fácilmente en Google.

¡La mejor de las suertes en tu esfuerzo dictatorial!

+0

Lucene parece difícil ... Debería haber notado que estoy buscando una solución rápida ... pensada como una solución temporal para el lanzamiento de mi aplicación. Creo que estoy a favor de la primera solución. El segundo probablemente golpeará una gran cantidad de falsos positivos también. – Starlin

+0

También tenga en cuenta que será generosamente recompensado por sus esfuerzos. Nunca me olvido de los que me han apoyado. – Starlin

+0

¡Gracias por tu gracia, mi señor! jajaja. ¡Espero poder ayudar! –

1

aquí está su lista de reproducción! http://onlineslangdictionary.com/lists/most-vulgar-words/ Revise el sitio para más información

idea: DB su lista, luego la pantalla contra su base de datos. O, DB su lista, cree todo como palabras clave, bloqueando la entrada. Luego, use el comodín SQL dentro de las palabras para verificar: freedom o Fr ** dom,

Pero los problemas derivados de Tech1 son infinitos.

+0

Si puede al menos bloquear Cl ** eland St ** mer, debe estar a salvo. – ChaosPandion

+0

La mayoría de ellos parecen ser frases en lugar de palabras, y frases bastante artificiales en eso. – Hammerite

0

El siguiente enlace lleva a la lista de 2200 palabras malas en 12 idiomas. Las opciones de volcado de MySQL, JSON, XML o CSV están disponibles.

https://github.com/turalus/openDB

ejecutar esta volcado en su propia base de datos y luego pregunta para cualquier ocurrencia.

+0

No agregue la [misma respuesta a varias preguntas] (http://meta.stackexchange.com/questions/104227/is-it-acceptable-to-add-a-duplicate-withwer-to-several-questions) Responde el mejor y marca el resto como duplicados, una vez que ganes la suficiente reputación. Si no es un duplicado, adapte la publicación a la pregunta y marque para restablecerla. –

Cuestiones relacionadas