¿Es posible ajustar las directivas a Google a tal punto que ignorará parte de una página y aún así indexará el resto?¿Hay alguna manera de evitar que Googlebot indexe ciertas partes de una página?
Hay un par de cuestiones diferentes que hemos encontrado que ser ayudado por esta, tales como:
- RSS feed texto/noticias de tipo ticker en una página de visualización del contenido de una fuente externa
- usuarios que entran en detalles de teléfono de contacto, etc. que quieren hacerlos visibles en el sitio, pero prefieren no ser capaces google-
soy consciente de que las dos anteriores se pueden abordar a través de otras técnicas (como la escritura el contenido con JavaScript), pero me pregunto si alguien sabe si hay una opción más limpia disponible de Google?
He estado investigando sobre esto y he encontrado menciones de googleon
and googleoff
tags, pero estas parecen ser exclusivas de Google Search Appliances.
¿Alguien sabe si hay un conjunto similar de etiquetas a las que se adherirá Googlebot?
Editar: Solo para aclarar, no quiero pasar por la peligrosa ruta de encubrir/servir contenido diferente a Google, por lo que estoy buscando ver si hay una forma "legítima" de logrando lo que me gustaría hacer aquí.
meta-tags y robots.txt ambos permiten o restringen el acceso a nivel de archivo, tengo curiosidad si puede permitir que una página se indexe, pero bloquee una parte determinada de ella. – ConroyP