Estoy haciendo un sitio que tendrá revisiones de las políticas de privacidad de cientos de miles de otros sitios en Internet. Su contenido inicial se basa en mi ejecución a través del volcado web CommonCrawl de 5 mil millones de páginas y analyzing all the privacy policies con un guión, para identificar ciertas características (por ejemplo, "Vende su información personal").Vincular juntos> 100K páginas sin obtener el SEO penalizado
De acuerdo con la SEO MOZ Beginner's Guide to SEO:
Los motores de búsqueda sólo tienden a arrastrarse alrededor de 100 enlaces en una página determinada. Esta restricción suelto es necesaria para mantener bajo control el spam y conservar el ranking .
Me preguntaba cuál sería una manera inteligente de crear una red de navegación que no deje huérfana ninguna página, pero aún evitaría esta penalización de SEO de la que hablan. Tengo algunas ideas:
- Crear páginas alfabéticas (o Google Sitemap .xml), como "Sitios que comienzan con Ado *". Y vincularía "Adobe.com" allí por ejemplo. Esta, o cualquier otra división sin sentido de las páginas, parece algo artificial y me pregunto si a Google podría no gustarle.
- Utilizando meta keywords o descripciones para categorizar
- Encuentra alguna forma de aplicar categorías más interesantes, como geográficas o basadas en contenido. Mi preocupación aquí es que no estoy seguro de cómo podría aplicar esas categorías en todos los sitios. Supongo que, de ser necesario, podría escribir otro clasificador para tratar de analizar el contenido de las páginas desde el rastreo. Aunque suena como un gran trabajo en sí mismo.
- Utilice el proyecto DMOZ para ayudar a categorizar las páginas.
Wikipedia y StackOverflow obviamente han resuelto este problema muy bien al permitir a los usuarios categorizar o etiquetar todas las páginas. En mi caso, no tengo ese lujo, pero quiero encontrar la mejor opción disponible.
En el centro de esta pregunta se encuentra cómo Google responde a las diferentes estructuras de navegación. ¿Penaliza a quienes crean una red de páginas de forma programática/sin sentido? ¿O no le importa si todo está conectado a través de enlaces?
¿Cuáles son sus pensamientos sobre los diferentes enfoques para dividir los enlaces. ¿A Google le importará que algunas sean divisiones más significativas que otras? – babonk
No hemos experimentado que un orden de clasificación funcione mejor que otro orden de clasificación. Simplemente siga las directrices de Google de menos de 10 MB o menos por archivo de mapa del sitio y no más de 50,000 URL por archivo. Por cierto, en realidad puedes decirle a Google la prioridad de cada enlace en el archivo sitemap.xml. – Jason