2011-07-08 15 views
5

Necesito recopilar datos de un sitio, pero primero es necesario iniciar sesión. He estado utilizando hpricot para raspar con éxito otros sitios, pero soy nuevo en el uso de mecanizado, y estoy realmente desconcertado por cómo hacerlo.Uso de Ruby con Mechanize para iniciar sesión en un sitio web

veo este ejemplo comúnmente citado:

require 'rubygems' 
require 'mechanize' 

a = Mechanize.new 
a.get('http://rubyforge.org/') do |page| 
    # Click the login link 
    login_page = a.click(page.link_with(:text => /Log In/)) 

    # Submit the login form 
    my_page = login_page.form_with(:action => '/account/login.php') do |f| 
    f.form_loginname = ARGV[0] 
    f.form_pw   = ARGV[1] 
    end.click_button 

    my_page.links.each do |link| 
    text = link.text.strip 
    next unless text.length > 0 
    puts text 
    end 
end 

Pero he encontrado que es muy críptica. La parte que no entiendo en particular, es lo que está pasando aquí:

f.form_loginname = ARGV[0] 
f.form_pw   = ARGV[1] 

métodos Cómo han esas etiquetas de entrada en la página de repente se vuelven? ¿Me estoy perdiendo de algo? Cuando trato de volver a crearlo, para acceder a AppDataPro (http://www.appdata.com/login) me encuentro con el problema de que el nombre de entrada contiene entre paréntesis, así:

<Table> 
<tr><td width="150"> 
    <label for="user_session_username">Username</label><br /> 
</td><td > 
    <input id="user_session_username" name="user_session[username]" size="30" type="text" /> 
</td></tr> 
<tr><td> 
    <label for="user_session_password">Password</label><br /> 
</td><td> 
    <input id="user_session_password" name="user_session[password]" size="30" type="password" /> 
</td></tr> 
</table> 

Este es mi intento utilizar mecanizar:

a = Mechanize.new 
    a.get('http://www.appdata.com/login') do |page| 
     # Click the login link 
     login_page = a.click(page.link_with(:text => /Login/)) #login_page is basically a doc of appdata/login 

     my_page = login_page.form_with(:action => '/login') do |f| 
      f.user_session[username] = '****username here?****' 
      f.user_session[password] = '****password here?****' 
     end 

    end 

pero causa el error,

logintest01.rb:21:in `block (2 levels) in <main>': undefined method `user_session' for nil:NilClass (NoMethodError) 

¿Qué hay de malo en lo que estoy haciendo?

Respuesta

13

Este es el enfoque normalmente tomar. No me ha fallado:

username_field = form.field_with(:name => "user_session[username]") 
username_field.value = "whatever_user" 
password_field = form.field_with(:name => "user_session[password]") 
password_field.value = "whatever_pwd" 
form.submit 
+0

¡Muchas gracias! Esto funciona perfectamente! – Spacew00t

+0

De nada. – Senthess

0

Try sin este

login_page = a.click(page.link_with(:text => /Login/)) 

O

a.get('http://www.appdata.com/') do |page| 
Cuestiones relacionadas