2010-02-23 14 views
7

Actualmente estoy tratando de desarrollar una búsqueda básica de texto completo para mi sitio web, y noté que ciertas palabras como "con respecto" se enumeran como palabras vacías para las búsquedas de texto completo de MySQL. Esto no me molesta mucho ahora ya que las personas que buscan una determinada noticia no necesariamente buscarán usando la palabra "con respecto" (¡pero ciertamente no puedo hablar por todos!). Sin embargo, esperaba que alguien aquí pudiera aclararme la razón de tener una lista de palabras prohibidas. ¡Gracias!MySQL Fulltext Stopwords Justificación

Para aclarar: Estoy usando MyIsam para mi tabla de texto completo. Las palabras vacías son palabras que MySQL no indexará (para cualquier índice de texto completo). Como se señaló en un comentario a esta pregunta, hay una lista completa de palabras vacías sin ningún tipo de explicación. Me gustaría saber si hubo una razón detrás de las palabras "ellos" eligieron.

+0

¿Desea utilizar mySQL para su búsqueda? ¿No estarías más feliz implementando algo más? – Layke

+0

@Laykes Podría ser más feliz usando un marco diferente. Estoy desarrollando de forma muy conservadora en este momento ya que no tengo el control del servidor para el que estoy desarrollando. Tampoco necesito una búsqueda terriblemente avanzada para mi sitio. De cualquier manera, todavía tengo curiosidad sobre la lista de palabras prohibidas. –

+1

raro, nunca supe sobre las palabras prohibidas - aquí hay una lista completa pero sin explicación: http://dev.mysql.com/doc/refman/5.1/en/fulltext-stopwords.html –

Respuesta

8

Las palabras de finalización son solo palabras comunes en inglés. En la mayoría de los casos, sus resultados de búsqueda serán más relevantes, y sus índices serán más pequeños y más rápidos, si no indexa estas palabras.

Puede editar la lista de palabras prohibidas usando la variable ft_stopword_file (o configurarla en '' para indexar todas las palabras tanto o más largas que ft_min_word_len) si eso se adapta mejor a sus necesidades. También puede cambiar la longitud mínima indexada de la palabra utilizando la variable ft_min_word_len, que existe por el mismo motivo.

+0

¡Gracias por la información! –

Cuestiones relacionadas