después de varios meses haciendo que el sitio desaparezca de los resultados de búsqueda en todos los principales buscadores, finalmente descubrí una posible razón.La solicitud HEAD recibe "403 prohibido" mientras que GET "200 ok"?
Utilicé WebBug para investigar el encabezado del servidor. Vea la diferencia si la solicitud es HEAD o GET. datos
HTTP/1.1 403 Forbidden
Date: Tue, 10 Aug 2010 23:01:00 GMT
Server: Apache/2.2
Connection: close
Content-Type: text/html; charset=iso-8859-1
enviadas::
CABEZA datos enviados:
HEAD/HTTP/1.1
Host: www.attu.it
Connection: close
Accept: */*
User-Agent: WebBug/5.0
CABEZA Los datos recibidos
GET/HTTP/1.1
Host: www.attu.it
Connection: close
Accept: */*
User-Agent: WebBug/5.0
GET los datos recibidos:
HTTP/1.1 200 OK
Date: Tue, 10 Aug 2010 23:06:15 GMT
Server: Apache/2.2
Last-Modified: Fri, 08 Jan 2010 08:58:01 GMT
ETag: "671f91b-2d2-47ca362815840"
Accept-Ranges: bytes
Content-Length: 722
Connection: close
Content-Type: text/html
// HTML code here
Ahora, los navegadores por defecto enviar una solicitud GET (al menos esto es lo que dice Firebug). ¿Es posible que los rastreadores envíen una solicitud HEAD en su lugar? Si es así, ¿por qué solo este servidor responde con un 403, mientras que otros servidores de otros sitios que estoy manteniendo no lo hacen?
En caso de que sea importante, la única línea presente en .htaccess es (a menos que mi cliente lo cambió, ya que no me quieren dar acceso a su servidor)
AddType text/x-component .htc
ACTUALIZACIÓN
Gracias @Ryk. FireBug y Fiddler ambos envían solicitudes GET, que obtienen 200 (o 300) respuestas. Como se esperaba. Así que supongo que es una configuración incorrecta del servidor (aunque es extraño, ya que el hosting es de una compañía importante con millones de clientes) o algo que pusieron en el .htaccess. Tendrán que dejarme revisar su cuenta.
La segunda parte de mi pregunta fue si esa podría ser la causa de que el sitio web no aparezca en ningún motor de búsqueda (sitio: www.attu.it no da ningún resultado). ¿Cualquier pensamiento?
ACTUALIZACIÓN 2
Después de algún volverse locos, resulta que no era de los robots-bloqueantes .htaccess en el directorio raíz, que causó ninguna petición de robots phpMyAdmin para ser enviado de vuelta con un 403 Forbidden
Es un error con el servidor, el cliente quiere que se solucione, deberían darle al menos algo de acceso. Por lo menos, pregúnteles si podían ver una copia del .htaccess actual. –