Digamos que tengo un sitio en http://example.com. Realmente me gustaría permitir que los robots vean la página de inicio, pero cualquier otra página debe estar bloqueada ya que no tiene sentido araña. En otras palabrasCómo configurar un robot.txt que solo permite la página predeterminada de un sitio
http://example.com & http://example.com/ se debe permitir, pero http://example.com/anything y http://example.com/someendpoint.aspx deben ser bloqueados.
Además sería muy bueno si puedo permitir que ciertas cadenas de consulta de paso a través de la página de inicio: http://example.com?okparam=true
pero no http://example.com?anythingbutokparam=true