He leído los documentos de Google en formatos de mapa del sitio, pero hay una cosa que no aclaran: los motores de búsqueda buscarán automáticamente/encontrar/sitemap_index.xml o tienen que decirles acerca de a través de /robots.txt o el /sitemap.xml principal? ¿Puede no tener un /sitemap.xml y aún confiar en /sitemap_index.xml para ser encontrado y cosechado?Confusión sobre sitemap_index.xml
Respuesta
En el archivo robots.txt puede apuntar a un mapa del sitio o un archivo de índice de mapa de sitio utilizando la misma sintaxis:
Sitemap: <location>
los motores de búsqueda sabrá mirando el archivo de qué tipo es.
También vale la pena señalar que sitemap.xml y sitemap_index.xml son solo nombres de archivo sugeridos, puede usar cualquier nombre que desee. A diferencia de la ubicación conocida de robots.txt, los motores de búsqueda no verifican ninguna ubicación como sitemap.xml o sitemap_index.xml sin que usted le diga que hay algo en esa ubicación.
La mejor forma de hacerlo es apuntar a su mapa de sitio en robots.txt:
Sitemap: <sitemap_location>
Hay una explicación bastante buena acerca de esto en www.sitemaps.org
He leído muchas discusiones sobre este tema y nadie sabe cómo Google maneja esto.
Algunas personas dicen que los rastreadores buscarán estos archivos por defecto:
- /sitemap.xml
- /sitemap.xml.gz
- /sitemap.gz
Si lees los artículos de Google sobre los mapas xml-sitemaps, a menudo hablan de estos nombres de archivo, ¿es una coincidencia?
Tal vez sea cierto, pero, sugeriría seguir las directrices de Google y usar robots.txt + enviar el mapa del sitio a través de Google Webmaster Tools.
Creo que las herramientas del webmaster están subestimadas, vale la pena, usted puede recibir información directamente de Google, información que lo ayuda a mejorar su sitio web.
Si no desea iniciar sesión en las herramientas del webmaster cada vez que vuelva a enviar el mapa del sitio cuando se actualice, puede hacer un ping a Google para informarle sobre los cambios.
El enlace para hacer ping a Google: www.google.com/webmasters/tools/ping?sitemap=sitemap_url
Más información en Google Support.
Puedo confirmar que para dos de mis sitios que acabo de investigar, las herramientas del webmaster no tienen un registro de sitemap_index.xml o sus mapas de sitios vinculados.
Ambos sitios que revisé han sido indexados por google durante más de un año, no mencionan el mapa del sitio en robots.txt, y son sitios de WordPress con el sitemap_index.xml auto generado por Yoast SEO. Acabo de agregar los sitemaps de forma manual en las herramientas de webmaster.
- 1. Confusión sobre Function.prototype.bind()
- 2. confusión sobre Contexto
- 3. confusión sobre transacciones y msdtc
- 4. Confusión sobre NaN en Java
- 5. confusión sobre el ejercicio de Javascript
- 6. Confusión sobre las variables globales en python
- 7. Confusión sobre hadoop job tracker api
- 8. Confusión sobre Unicode y varios bytes artículos
- 9. Confusión sobre el uso de Django socialauth
- 10. Desentrañando la confusión sobre los recursos incrustados
- 11. Confusión sobre Nullable <T> restricciones
- 12. Confusión sobre el diseño correcto de un programa C++
- 13. Javascript confusión sobre las variables definidas por referencia vs valor
- 14. Confusión sobre el futuro de .NET Compact Framework
- 15. Confusión sobre el ámbito de variable de CoffeeScript
- 16. La confusión sobre los identificadores de sesión utilizando Conectar
- 17. confusión sobre el vacío y lo que significa.
- 18. Confusión sobre el plegado de vim: ¿cómo deshabilitar?
- 19. confusión sobre celdas estáticas frente a celdas dinámicas
- 20. herencia virtual Confusión
- 21. Amigos confusión
- 22. Tupla == Confusión
- 23. dynamic_cast confusión
- 24. Bitmap.LockBits confusión
- 25. Linq contiene confusión
- 26. Monadic tipo confusión
- 27. Scala - extractor aplicar confusión
- 28. Parámetros SqlCommand tamaño confusión
- 29. Java cadenas inmutables confusión
- 30. C# Roscado/bloqueo confusión