¿Qué utilizan los robots de los motores de búsqueda como punto de partida? ¿Es la búsqueda de DNS o comienzan con una lista fija de sitios conocidos? ¿Alguna suposición o sugerencia?¿Dónde comienzan a rastrear los motores de búsqueda?
Respuesta
Su pregunta puede ser interpretado de dos maneras:
lo preguntas donde los motores de búsqueda comienzan su rastreo de en general, o donde empiezan a rastrear un sitio en particular?
No sé cómo funcionan los grandes jugadores; pero si tuvieras que hacer tu propio motor de búsqueda, probablemente lo incluirías en sitios de portales populares. DMOZ.org parece ser un punto de partida popular. Dado que los grandes jugadores tienen mucha más información que nosotros, probablemente comiencen sus rastreos desde una variedad de lugares.
Si está preguntando dónde un SE comienza a rastrear su sitio en particular, probablemente tenga mucho que ver con cuáles de sus páginas son las más populares. Imagino que si tiene una página súper popular a la que se enlazan muchos otros sitios, entonces esa sería la página desde la que comenzarán las PE porque habrá muchos más puntos de entrada desde otros sitios.
Tenga en cuenta que no estoy en SEO ni nada; Acabo de estudiar el tráfico de bots y SE por un tiempo para un proyecto en el que estaba trabajando.
Puede enviar su sitio a los motores de búsqueda usando su site submission forms - esto lo llevará a su sistema. Cuando te quedas arrastrado después de eso, es imposible decirlo: por experiencia, generalmente es alrededor de una semana más o menos para un rastreo inicial (página de inicio, un par de páginas más de 1 enlace desde allí). Puede aumentar la cantidad de páginas rastreadas e indexadas utilizando una estructura de enlace semántico clara y enviando un sitemap; estas le permiten enumerar todas sus páginas y ponderarlas una con respecto a la otra, lo que ayuda a los motores de búsqueda a comprender la importancia que tiene cada parte del sitio en relación con los demás.
Si su sitio está vinculado desde otros sitios web rastreados, también se rastreará su sitio, comenzando con la página vinculada y, finalmente, extendiéndose al resto de su sitio. Esto puede llevar mucho tiempo y depende de la frecuencia de rastreo de los sitios de enlace, por lo que el envío de URL es la manera más rápida de informarle a Google acerca de usted.
Una herramienta que no puedo recomendar es la Google Webmaster Tool. Le permite ver con qué frecuencia ha sido rastreado, cualquier error con el que haya tropezado el googlebot (enlaces rotos, etc.) y tiene una gran cantidad de otras herramientas útiles allí.
En principio, comienzan con nada. Solo cuando alguien explícitamente les dice que incluyan su sitio web, pueden comenzar a rastrear este sitio y usar los enlaces en ese sitio para buscar más.
Sin embargo, en la práctica los creadores de un motor de búsqueda colocarán en algunos sitios arbitrarios en los que puedan pensar. Por ejemplo, sus propios blogs o los sitios que tienen en sus marcadores.
En teoría, también podría elegir algunas direcciones aleatorias y ver si hay un sitio web allí. Dudo que alguien haga esto; el método anterior funcionará bien y no requiere codificación adicional solo para arrancar el motor de búsqueda.
- 1. ¿Los sitios AJAX se pueden rastrear por los motores de búsqueda?
- 2. ¿Los motores de búsqueda agregan peso a los microformatos?
- 3. ¿Dónde puedo comenzar a aprender sobre los motores de reglas?
- 4. ¿Los elementos HTML5 significan algo para los motores de búsqueda?
- 5. ¿Por qué los motores de búsqueda ignoran los símbolos?
- 6. ¿Cómo oculto un sitio de los motores de búsqueda?
- 7. ¿Los motores de búsqueda penalizarán el texto oculto por javascript?
- 8. ¿Motores de búsqueda de repositorio Maven recomendables?
- 9. ¿Contando el número de visitas de una página ignorando los motores de búsqueda?
- 10. ¿El contenido cargado por AJAX afectará a los motores de búsqueda/SEO?
- 11. ¿Cuándo comienzan a existir los campos estáticos?
- 12. Los motores de búsqueda no pueden indexar el sitio asp.net debido a los 302 redireccionamientos a la página de error
- 13. ¿Cómo obtienen los motores de búsqueda de viajes y los agregadores sus datos de origen?
- 14. ¿Cómo combinan los motores de búsqueda los resultados de un índice invertido?
- 15. ¿Cómo evitar que los motores de búsqueda rastreen todo el sitio web?
- 16. ¿Qué debería saber sobre el rastreo de motores de búsqueda?
- 17. Java: Descripción general de los motores de texto a voz
- 18. ¿Cómo rastrear desde dónde Magento llama a las plantillas?
- 19. Motores de búsqueda y lenguaje de aceptación del navegador
- 20. ¿Cómo logro que los motores de búsqueda indexen todas las variantes de idioma de una página?
- 21. ¿Cuáles son los motores de búsqueda de código abierto que conoces?
- 22. ¿Los motores de búsqueda captarán palabras clave y metaetiquetas de descripción generadas mediante JavaScript?
- 23. ¿Cómo evitar que los motores de búsqueda indexen una sola página de mi sitio web?
- 24. ¿Las arañas de los motores de búsqueda pueden ver el contenido que agrego usando jQuery?
- 25. ¿Cómo detengo los motores de búsqueda indexando una página de mantenimiento
- 26. ¿Los motores de búsqueda respetan el campo del encabezado HTTP "Content-Location"?
- 27. ¿Cómo rastrear la ruta en una búsqueda de primer orden?
- 28. ¿Pueden los motores de búsqueda indexar páginas web generadas en JavaScript?
- 29. ¿Se puede mejorar progresivamente una aplicación Backbone.js y rastrearla por los motores de búsqueda?
- 30. haciendo posible el contenido generado por JavaScript para que los motores de búsqueda indexen
Esta pregunta parece estar fuera de tema porque no se trata de programación. Consulte [Qué temas puedo preguntar aquí] (http://stackoverflow.com/help/on-topic) en el Centro de ayuda. Tal vez [Web Apps Stack Exchange] (http://webapps.stackexchange.com/) sería un mejor lugar para preguntar. – jww