2010-10-25 12 views
6

En un now migrated question sobre URLs legible me he permitido elaborar un pequeño caballo de batalla de la mina:URL legibles por humanos: preferiblemente jerárquicas también?

Cuando encuentro URLs como http://www.example.com/product/123/subpage/456.html Siempre pienso que esto es un intento de crear URLs jerárquicas significativas que, sin embargo, no es completamente jerárquico. Lo que quiero decir es que deberías poder cortar un nivel a la vez. En lo anterior, la URL tiene dos violaciónes en este principio:

  1. /product/123 es uno pieza de información representado como dos niveles. Se estaría representado más correctamente como /product:123 (o lo que sea delimitador se quiere)
  2. /subpage es muy probable que no es una entidad en sí misma (es decir, no se puede subir de nivel uno de 456.html como http://www.example.com/product/123/subpage es "nada").

Por lo tanto, creo que el siguiente más correcto:

http://www.example.com/product:123/456.html 

En este caso, siempre se puede subir un nivel a la vez:

  • http://www.example.com/product:123/456.html — El subpágina
  • http://www.example.com/product:123 — La página del producto
  • http://www.example.com/ — La raíz

Siguiendo la misma filosofía, la siguiente tendría sentido [y proporcionar un vínculo adicional a la lista de productos]:

http://www.example.com/products/123/456.html 

Dónde:

  • http://www.example.com/products/123/456.html — La subpágina
  • http://www.example.com/products/123 — La página del producto
  • http://www.example.com/products — La lista de productos
  • http://www.example.com/ — La raíz

Mi motivación principal de este enfoque es que si cada "elemento de la ruta" (delimitado por /) es autocontenido , siempre podrá navegar hasta el "padre" simplemente eliminando el último elemento de la URL. Esto es lo que (a veces) hago en mi explorador de archivos cuando quiero ir al directorio principal. Siguiendo la misma línea de lógica, el usuario (o un motor de búsqueda/rastreador) puede hacer lo mismo. Muy inteligente, creo.

Por otro lado (y esta es la parte importante de la pregunta): Si bien nunca puedo evitar que un usuario intenta acceder a una URL que él mismo ha amputado, estoy yo erróneamente afirmar (y en honor) que un motor de búsqueda podría hacer lo mismo? Es decir, ¿es razonable esperar que ningún motor de búsqueda (o realmente: Google) intente acceder al http://www.example.com/product/123/subpage (punto 2, arriba)? (¿O realmente solo tomo en cuenta el factor humano aquí?)

No se trata de una preferencia personal. Es una pregunta técnica sobre qué puedo esperar de un rastreador/indexador y en qué medida debería tener en cuenta la manipulación de URL no humana al diseñar las URL.

Además, la "profundidad" estructural de http://www.example.com/product/123/subpage/456.html es 4, donde http://www.example.com/products/123/456.html es solo 3. Se corre el rumor de que esta profundidad influye en la clasificación del motor de búsqueda. Al menos, según me dijeron. (Ahora es evidente que SEO es no lo que más sé sobre esto.) ¿Es esto (¿todavía?) Cierto: ¿influye la profundidad jerárquica (número de directorios) en el ranking de búsqueda?

Entonces, ¿mi "presentimiento" es técnicamente correcto o debería dedicarme a otra cosa?


Ejemplo: Si lo hace (casi) derecho
El bueno de esto casi se pone tan bien. Un ejemplo: perfiles, por ejemplo, http://stackoverflow.com/users/52162:

  • http://stackoverflow.com/users/52162 — perfil individual
  • http://stackoverflow.com/users — Lista de usuarios
  • http://stackoverflow.com/ — raíz

Sin embargo, el canonical URL para el perfil es en realidad http://stackoverflow.com/users/52162/jensgram que parece redundante (el mismo punto final representado en dos niveles jerárquicos). Alternativa: http://stackoverflow.com/users/52162-jensgram (o cualquier otro delimitador usado de manera consistente).


1) lleva una pieza completa de la información no depende de elementos "más profundos".

+1

Y esta continuación de su pregunta migrada está en el tema aquí porque contiene la pregunta de programación ...? –

+0

@Pascal Cuoq No, no necesariamente (y no fue mi pregunta, solo mi "respuesta"). Quizás esto también debería migrarse a "Pro Webmasters", pero no sé si los "programadores profesionales y entusiastas" o "webmasters profesionales y entusiastas" responden mejor a la pregunta. – jensgram

+1

No estoy de acuerdo con que "producto/123" sea solo una información; el primer nivel indica "es de tipo producto" y el segundo indica "tiene id 123". – FacticiusVir

Respuesta

4

Las URL jerárquicas de este tipo "http://www.example.com/product:123/456.html" son tan inútiles como "http://www.example.com/product/123/subpage", porque cuando los usuarios ven sus URL, no les importan los identificadores de su base de datos, quieren rutas significativas. Esta es la razón por la cual StackOverflow coloca títulos de preguntas en urls: "http://stackoverflow.com/questions/4017365/human-readable-urls-preference-hierarchical-too".

Google consejos contra la práctica de reemplazar consultas habituales como "http://www.example.com/?product=123 & página = 456", porque cuando cada sitio desarrolla su propio esquema, el rastreador no sabe qué parte significa, si es importante o no. Google inventó mecanismos sofisticados para encontrar argumentos importantes e ignorarlos sin importancia, lo que significa que obtendrá más páginas en el índice y habrá menos duplicados. Pero estos algoritmos a menudo fallan cuando los desarrolladores web inventan su propio esquema.

Si se preocupan por los usuarios y los rastreadores se debe utilizar URLs esta forma:

Además, los motores de búsqueda otorgan una calificación más alta a las páginas con palabras clave en la url.

+0

Sí, estoy de acuerdo con usted en la inutilidad de los ID en las URL. Pero con respecto a la URL de esta pregunta (para seguir su ejemplo): es 'http: // stackoverflow.com/questions/4017365/human-read-urls-preferiblemente-hierarchical-too' penalized comparado con la alternativa (ficticia)' http : // stackoverflow.com/questions/4017365-human-read-urls-preferiblemente-hierarchical-too' (un nivel más alto)? (La segunda parte de mi pregunta.) – jensgram

+1

@jensgram Dudo seriamente que los motores de búsqueda "penalicen" cualquier URL por niveles adicionales. Incluso si hay una diferencia, es poco probable que lo notes. Agregar una palabra clave a la URL importa cien veces más que el número de caracteres de barra que lo rodean. :) Es solo un personaje. Ahora que las URL "legibles por humanos" (con ID ilegibles) se están volviendo populares, este personaje puede significar prácticamente cualquier cosa. – Athari

Cuestiones relacionadas