Quiero permitir que los rastreadores accedan al directorio raíz de mi dominio (es decir, el archivo index.html), pero nada más profundo (es decir, no hay subdirectorios). No quiero tener que listar y negar cada subdirectorio individualmente en el archivo robots.txt. Actualmente tengo lo siguiente, pero creo que está bloqueando todo, incluso cosas en la raíz del dominio.Robots.txt, ¿cómo permitir el acceso solo a la raíz del dominio y no más?
User-agent: *
Allow: /$
Disallow:/
¿Cómo puedo escribir mi robots.txt para lograr lo que estoy intentando?
¡Gracias de antemano!
Esto no se puede hacer de una manera "robot universal". ¿Tiene acceso a un .htaccess o similar? – alexn
Tengo acceso a .htaccess. Básicamente, mi objetivo, utilizar robots.txt, metaetiquetas y metacabezadores http, es hacer todo lo que puedo para evitar que todo lo que no sea mi página principal (es decir, index.html) termine en los resultados de un motor de búsqueda. – WASa2