2009-05-05 15 views
17

¿Pueden los motores de búsqueda como las páginas web generadas por JavaScript con el índice de Google? Cuando haces clic derecho y seleccionas ver fuente en una página generada por JavaScript (por ejemplo, usando GWT), no ves el HTML generado dinámicamente. Supongo que si un motor de búsqueda tampoco puede ver el código HTML generado, entonces no hay mucho que indexar, ¿verdad?¿Pueden los motores de búsqueda indexar páginas web generadas en JavaScript?

Respuesta

12

Su sospecha es correcta: no se puede confiar en que el contenido generado por JS sea visible para los robots de búsqueda. Tampoco puede ser visto por nadie con JS desactivado, y la última vez agregué algunas pruebas a un sitio en el que estaba trabajando (que era un sitio grande, de audiencia principal, con cientos de miles de visitantes únicos por mes) , aproximadamente el 10% de los usuarios no ejecutaban Javascript de ninguna forma. Eso incluye bots de búsqueda, navegadores de PC con JS deshabilitado, muchos móviles, personas ciegas que utilizan lectores de pantalla ... etc. etc.

Es por eso que el contenido generado a través de JS (sin opción de reserva) es una muy mala idea.

Volver a lo básico. Primero, cree su sitio usando bare-bones (X) HTML, siguiendo los principios de REST (al menos en la medida en que requiera solicitudes POST para cambios de estado). Marcado semántico simple, y olvídate de CSS y Javascript.

El primer paso es hacerlo bien, y hacer que todo su sitio (o tanto como tenga sentido) funcione bien de esta manera para los robots de búsqueda y los agentes de usuario tipo Lynx.

A continuación, agregue una capa visual : CSS/graphics/media para pulir visualmente, pero no cambie significativamente su marcado HTML original (X); Permitir que el sitio original de solo texto permanezca intacto y en funcionamiento. ¡Mantenga limpio su marcado!

Tercero es agregar un capa de comportamiento: Javascript (Ajax). Ofrezca cosas que hagan que la experiencia sea más rápida, fluida y agradable para usuarios/navegadores con JS compatible con Ajax ... pero solo para esos usuarios. Los usuarios sin Javascript todavía son bienvenidos; y también lo son los robots de búsqueda, los discapacitados visuales, muchos móviles, etc.

Esto se llama mejora progresiva en círculos de diseño web. Hágalo de esta manera y su sitio funciona, de alguna forma razonable, para todos.

+9

Ese consejo solo aplica si el sitio es un sitio basado en contenido. Si el sitio es rico en interacciones, como google maps, no lo haría de la manera que sugería esta respuesta. – Chii

+0

Tengo que decir que no estoy completamente de acuerdo allí; no hay una razón intrínseca por la que a los agentes de usuario sin Ajax (robots de búsqueda, la mayoría de los móviles, etc.) se les niegue el contenido si es útil y relevante. La clave es el modo de interacción: si la interacción tiene que ser multidimensional y continua (como un juego de FPS), entonces, seguro, solo texto no tiene sentido. Pero Google Maps * podría * ser implementado de forma útil en una versión HTML estándar. Está bien que no se preocupe por los bots de búsqueda para las secciones de sesión solo iniciada, o por usar solo Ajax si está seguro de que todos sus usuarios tienen Ajax (por ejemplo, en una intranet), pero son excepciones. – mattandrews

+0

Las personas ciegas no tienen ningún problema con el contenido generado por JavaScript ... – Knarf

7

si un motor de búsqueda también no puede ver el código HTML generado entonces no hay mucho para indexar

Eso lo resume todo. Técnicamente, nada impide que un motor de búsqueda implemente un motor de JavaScript para su bot/spider, pero simplemente no se hace normalmente. Podrían, pero no lo harán.

Por otro lado, puede oler el agente de usuario de un motor de búsqueda y publicarlo de forma legible. Pero a los motores de búsqueda generalmente no les gusta esto y lo penalizarán severamente si detectan diferencias con lo que envía a un navegador normal.

1

Google está trabajando en la ejecución de Javascript simple para descubrir algunos contenidos, pero ciertamente no ejecutan los scripts completos. Si le preocupa el SEO, debe considerar proporcionar versiones estáticas de las páginas.

+0

¿Alguna referencia/enlace en google trabajando en su implementación? –

+0

Busque los videos del webmaster de matt cutts en YouTube. Había uno en JavaScript. –

+0

este enlace: https://developers.google.com/webmasters/ajax-crawling/docs/html-snapshot – phabtar

6

Una buena regla general: si puede verla en Lynx, puede indexarla Google.

Lynx es una excelente prueba porque también le da una idea de cómo los lectores de pantalla para ciegos verán su página también.

+1

La suposición sobre el lince y las personas ciegas no es correcta. Las personas ciegas no tienen ningún problema con el contenido generado por JavaScript en las páginas web. Un mejor navegador para comprobar qué verán los ciegos es "enlaces". Pero para comprobar si puede ser indexado por Google, deberías usar lynx. Lynx para Google Enlaces para personas ciegas – Knarf

2

Hay algunas maneras de manejar esto en GWT, this es una gran discusión sobre el tema. Parece que la mejor opción es servir contenido estático de SEO cuando el usuario-agente es un bot, siempre y cuando el contenido de SEO sea idéntico al que se sirve a través de la ruta de GWT. Esto puede ser mucho trabajo, pero si realmente quieres una aplicación GWT completamente enriquecida que esté optimizada para los motores de búsqueda, puede valer la pena.

1

Eche un vistazo al Single Page Interface Manifiesto de cómo una aplicación SPI (intensiva AJAX) puede ser indexada por Google y otros rastreadores. Qué tan difícil es depende del marco web utilizado.

0

Incluso si se ejecutan los básicos JavaScript MAYORITARIAMENTE WEBS Y USOS LIBRARIESFRAMEWORKS, yo no piensa lo mismo que un robot como robot de google o cualquier otra araña también se cargará Js archivos vinculados con la página web y sin ellos cargar el código JS se producir errores

/*Correct Me If I am wrong*/ 
Cuestiones relacionadas