2009-08-18 31 views
6

Estoy desarrollando un cliente FTP en Python ftplib. ¿Cómo añado el soporte de proxies (la mayoría de las aplicaciones de FTP que he visto parecen tenerlo)? Estoy especialmente pensando en proxies SOCKS, pero también en otros tipos ... FTP, HTTP (¿es posible usar proxys HTTP con el programa FTP?)Proxies en la aplicación FTP de Python

¿Alguna idea de cómo hacerlo?

Respuesta

1

El módulo estándar ftplib no es compatible con los proxies. Parece que la única solución es escribir su propia versión personalizada del ftplib.

6

Según this fuente.

Depende del proxy, pero un método común es ftp para el proxy, luego use el nombre de usuario y la contraseña para el servidor de destino.

E.g. para ftp.example.com:

Server address: proxyserver (or open proxyserver from with ftp) 
User:   [email protected] 
Password:  password 

En el código Python:

from ftplib import FTP 
site = FTP('my_proxy') 
site.set_debuglevel(1) 
msg = site.login('[email protected]', 'password') 
site.cwd('/pub') 
+0

el enlace en la respuesta anterior se 404. podría haber significado ésta: http : //mail.python.org/pipermail/python-list/2004-October/863602.html – AndrewR

+3

La parte "anonymous at ftp.download.com" es pura ficción. Nada de eso ha sido mencionado en ningún RFC o implementado/respaldado por ningún servidor, hasta donde yo sé. Nativamente, el protocolo FTP no es compatible con el proxy. AFAIK, la única forma de proxy FTP es mediante el uso de SOCKS, en cuyo caso se supone que el cliente debe conectarse a SOCKS y el último debe ser instruido sobre cuál es el servidor FTP real. –

+1

Esta respuesta me resuelve un gran dolor de cabeza. ¡¡¡Gracias!!! – dgg32

4

Puede utilizar el ProxyHandler en urllib2.

ph = urllib2.ProxyHandler({ 'ftp' : proxy_server_url }) 
server= urllib2.build_opener(ph) 
+0

El error tipográfico de "urlli2" en el ejemplo no se puede editar porque "Las ediciones deben tener al menos 6 caracteres". – HongboZhu

0

corrigiendo el zócalo de la biblioteca incorporada definitivamente no será una opción para todos, pero mi solución se parchear socket.create_connection() utilizar un proxy HTTP cuando el nombre de host coincide con una lista blanca:

from base64 import b64encode 
from functools import wraps 
import socket 

_real_create_connection = socket.create_connection 
_proxied_hostnames = {} # hostname: (proxy_host, proxy_port, proxy_auth) 


def register_proxy (host, proxy_host, proxy_port, proxy_username=None, proxy_password=None): 
    proxy_auth = None 
    if proxy_username is not None or proxy_password is not None: 
     proxy_auth = b64encode('{}:{}'.format(proxy_username or '', proxy_password or '')) 
    _proxied_hostnames[host] = (proxy_host, proxy_port, proxy_auth) 


@wraps(_real_create_connection) 
def create_connection (address, *args, **kwds): 
    host, port = address 
    if host not in _proxied_hostnames: 
     return _real_create_connection(address, *args, **kwds) 

    proxy_host, proxy_port, proxy_auth = _proxied_hostnames[host] 
    conn = _real_create_connection((proxy_host, proxy_port), *args, **kwds) 
    try: 
     conn.send('CONNECT {host}:{port} HTTP/1.1\r\nHost: {host}:{port}\r\n{auth_header}\r\n'.format(
      host=host, port=port, 
      auth_header=('Proxy-Authorization: basic {}\r\n'.format(proxy_auth) if proxy_auth else '') 
     )) 
     response = '' 
     while not response.endswith('\r\n\r\n'): 
      response += conn.recv(4096) 
     if response.split()[1] != '200': 
      raise socket.error('CONNECT failed: {}'.format(response.strip())) 
    except socket.error: 
     conn.close() 
     raise 

    return conn 


socket.create_connection = create_connection 

también tuve que crear una subclase de ftplib.FTP que ignora la host devuelto por PASV y EPSV comandos FTP. Ejemplo de uso:

from ftplib import FTP 
import paramiko # For SFTP 
from proxied_socket import register_proxy 

class FTPIgnoreHost (FTP): 
    def makepasv (self): 
     # Ignore the host returned by PASV or EPSV commands (only use the port). 
     return self.host, FTP.makepasv(self)[1] 

register_proxy('ftp.example.com', 'proxy.example.com', 3128, 'proxy_username', 'proxy_password') 

ftp_connection = FTP('ftp.example.com', 'ftp_username', 'ftp_password') 

ssh = paramiko.SSHClient() 
ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy()) # If you don't care about security. 
ssh.connect('ftp.example.com', username='sftp_username', password='sftp_password') 
sftp_connection = ssh.open_sftp() 
0

Aquí es solución usando requests, probado con un proxy squid que no admite CONECTAR túnel:

def ftp_fetch_file_through_http_proxy(host, user, password, remote_filepath, http_proxy, output_filepath): 
    """ 
    This function let us to make a FTP RETR query through a HTTP proxy that does NOT support CONNECT tunneling. 
    It is equivalent to: curl -x $HTTP_PROXY --user $USER:$PASSWORD ftp://$FTP_HOST/path/to/file 
    It returns the 'Last-Modified' HTTP header value from the response. 

    More precisely, this function sends the following HTTP request to $HTTP_PROXY: 
     GET ftp://$USER:[email protected]$FTP_HOST/path/to/file HTTP/1.1 
    Note that in doing so, the host in the request line does NOT match the host we send this packet to. 

    Python `requests` lib does not let us easily "cheat" like this. 
    In order to achieve what we want, we need: 
    - to mock urllib3.poolmanager.parse_url so that it returns a (host,port) pair indicating to send the request to the proxy 
    - to register a connection adapter to the 'ftp://' prefix. This is basically a HTTP adapter but it uses the FULL url of 
    the resource to build the request line, instead of only its relative path. 
    """ 
    url = 'ftp://{}:{}@{}/{}'.format(user, password, host, remote_filepath) 
    proxy_host, proxy_port = http_proxy.split(':') 

    def parse_url_mock(url): 
     return requests.packages.urllib3.util.url.parse_url(url)._replace(host=proxy_host, port=proxy_port, scheme='http') 

    with open(output_filepath, 'w+b') as output_file, patch('requests.packages.urllib3.poolmanager.parse_url', new=parse_url_mock): 
     session = requests.session() 
     session.mount('ftp://', FTPWrappedInFTPAdapter()) 
     response = session.get(url) 
     response.raise_for_status() 
     output_file.write(response.content) 
     return response.headers['last-modified'] 


class FTPWrappedInFTPAdapter(requests.adapters.HTTPAdapter): 
    def request_url(self, request, _): 
     return request.url 
Cuestiones relacionadas