2010-04-07 12 views
6

¿Es posible hacer que los datos de JSON sean legibles por una araña de Google?¿Hay alguna forma de hacer que los datos json sean leíbles por una araña de Google?

Digamos, por ejemplo, que tengo un feed JSON que contiene los datos de un sitio de comercio electrónico. Estos datos JSON se utilizan para llenar una página legible por humanos en el navegador de los usuarios. (IE La traducción de los datos de JSON a la página humana se realiza dentro del navegador de los usuarios; no es mi elección, solo lo que me dieron para trabajar, es una antigua aplicación CGI heredada y no un lenguaje de scripting del lado del servidor).

Mi preocupación aquí es que las arañas de Google no podrán recoger/vincular directamente al elemento en cuestión cuando un usuario haga clic en él en Google, se le presentará una página de índice llena de todos los elementos, en lugar de estar vinculado directamente al elemento en el que hicieron clic.

¿Hay alguna forma de "informar" a la araña de google en el JSON que deberían darle al usuario un enlace diferente?

Respuesta

2

Debe crear una página de envoltura en el código del lado del servidor alrededor de los datos JSON y responder a las solicitudes con el envoltorio o la versión normal, según el User-Agent.

+4

¿No está mal visto por Google para mostrar a su araña algo que es diferente de lo que ve un visitante normal? –

+0

Creo que estaría bien en este caso. – SLaks

5

Si bien Google rastrea e indexa JavaScript en algunas circunstancias, de todos modos es mejor publicar contenido HTML "normal" (X). En este caso, sería útil conocer el resto de la configuración del sitio, en particular: es el contenido JSON utilizado para crear un feed de enlaces a las páginas del producto (con contenido estático) o todas las páginas del producto también generadas por fuentes JSON. ? Si el feed solo se utiliza para apuntar a las páginas del producto real (que son estáticas), entonces una forma de hacer que las páginas del producto sean reconocibles podría ser crear una página de mapa del sitio HTML u otra forma de navegación alternativa. Un archivo XML Sitemap también puede ayudar, pero recomendaría no usarlo como única forma de hacer que las páginas de productos sean reconocibles.

Si solo se puede acceder a todo el contenido a través de feeds JSON, entonces creo que tendrá que hacer algunos cambios más grandes si desea que se pueda acceder a ese contenido a través de los resultados de búsqueda.

Una forma de manejarlo también podría ser utilizar la nueva propuesta de rastreo/indexación de JavaScript, que básicamente daría como resultado que se establezca un navegador sin cabeza entre su sitio y Google: http://code.google.com/web/ajaxcrawling/ (ya sea configurando o modernizando el resto de el sitio es más fácil es difícil de decir :-))

Cuestiones relacionadas