Quiero evitar que los motores de búsqueda rastreen todo mi sitio web.¿Cómo evitar que los motores de búsqueda rastreen todo el sitio web?
Tengo una aplicación web para que utilicen los miembros de una empresa. Está alojado en un servidor web para que los empleados de la empresa puedan acceder a él. Nadie más (el público) lo necesitaría o lo encontraría útil.
Así que quiero agregar otra capa de seguridad (In Theory) para tratar de evitar el acceso no autorizado eliminando totalmente el acceso a él por parte de todos los motores de búsqueda bots/crawlers. Tener a Google indexando nuestro sitio para que se pueda buscar no tiene sentido desde el punto de vista comercial y simplemente agrega otra forma para que un hacker encuentre el sitio web en primer lugar para intentar hackearlo.
Sé en el robots.txt
que puede decir a los motores de búsqueda que no rastreen ciertos directorios.
¿Es posible decirle a los bots que no rastreen todo el sitio sin tener que listar todos los directorios para no rastrear?
¿Es mejor hacerlo con robots.txt
o es mejor que lo haga .htaccess u otro?
Su sitio web es accesible por los hackers de sombrero negro, incluso si no hay motores de búsqueda índice de su sitio. Los hackers de Black Hat no hacen búsquedas en Google para encontrarte. Tienen sus propios botnets que rastrean la web e ignoran 'robots.txt'. Además, está perjudicando a Internet al dificultar que los empleados encuentren su sitio web a través de la búsqueda en Google. A Google no le gusta cuando haces esto y no estás haciendo que tu sitio web sea más seguro. Además, Google lo ayuda trayendo clientes. Es como TSA, donde te quitan la cuchilla de 1 pulgada, no están haciendo las cosas más seguras, y están molestando a todos. –