Tengo un sitio con aproximadamente 150,000 páginas en su mapa del sitio. Estoy usando el generador de índices del mapa del sitio para hacer los mapas de sitio, pero en realidad, necesito una forma de almacenarlo en la memoria caché, porque crear 150 mapas de sitio de 1,000 enlaces cada uno es brutal en mi servidor. [1]Cómo servir eficientemente los mapas de sitio masivos en django
PODRÍA guardar en caché cada una de estas páginas del mapa del sitio con memcached, que es lo que estoy usando en otra parte del sitio ... sin embargo, este es un gran número de sitemaps que llenarían completamente memcached ... entonces eso no t trabajo.
Lo que creo que necesito es una forma de utilizar la base de datos como caché para ellos, y solo generarlos cuando hay cambios en ellos (lo que como resultado del índice de sitemap significa solo cambiar los últimos par de sitemap páginas, ya que el resto son siempre las mismas.) [2] Pero, por lo que puedo decir, solo puedo usar un backend de caché con django.
¿Cómo puedo tener estos sitemaps listos para cuando Google venga a rastrear sin matar mi base de datos o memcached?
¿Alguna idea?
[1] Lo he limitado a 1,000 enlaces por página de sitemap porque generar el máximo, 50,000 enlaces, simplemente no estaba sucediendo.
[2] Por ejemplo, si tengo sitemap.xml? Page = 1, page = 2 ... sitemap.xml? Page = 50, solo necesito cambiar sitemap.xml? Page = 50 hasta que está lleno con 1,000 enlaces, entonces puedo hacerlo casi para siempre, y enfocarme en la página 51 hasta que esté lleno, almacenarlo en caché para siempre, etc.
EDITAR, 2012-05-12: Esto ha seguido siendo un problema , y finalmente abandoné el marco de mapa de sitio de Django después de usarlo con un caché de archivos durante aproximadamente un año. En cambio, ahora estoy usando Solr para generar los enlaces que necesito en una vista realmente simple, y luego los paso a la plantilla de Django. Este enormemente simplificó mis sitemaps, los hizo funcionar muy bien, y hasta ahora tengo hasta 2,250,000 enlaces. Si quieres hacer eso, solo echa un vistazo a la plantilla del mapa del sitio; todo es realmente obvio a partir de ahí. Puede ver el código aquí: https://bitbucket.org/mlissner/search-and-awareness-platform-courtlistener/src/tip/alert/casepage/sitemap.py
No, son para bots. Por favor ignóralos. Detalles: sitemaps.org – mlissner