Como el tráfico se distribuye de manera desigual en 24 horas, me gustaría rechazar a los rastreadores durante las horas pico y permitir que pasen horas no ocupadas.¿Cómo configurar Robots.txt o Apache para permitir rastreadores solo a ciertas horas?
¿Hay un método para lograr esto?
edit: gracias por todos los buenos consejos.
Esta es otra solución que encontramos.
2bits.com tiene un artículo sobre cómo configurar el firewall de IPTables para limitar el número de conexiones de ciertas direcciones IP.
la configuración de iptables:
- Usando connlimit
En los nuevos núcleos, hay un módulo connlimit de iptables. Se puede utilizar como esto:
iptables tcp ENTRADA -I -p -m connlimit --connlimit anteriormente 5 -j REJECT
Esto limita las conexiones desde cada dirección IP a no más de 5 conexiones simultáneas. Este tipo de conexiones de "raciones" impide que los rastreadores golpeen el sitio de forma simultánea. *
El 503 podría ser el camino a seguir para los sitios dinámicos. –