¿Hay alguna forma de descargar automáticamente los precios históricos de las acciones de yahoo finance o google finance (formato csv)? Preferiblemente en Python.Descargar automáticamente los precios de las acciones de yahoo en python
Respuesta
Respuesta corta: Sí. Use Python's urllib para obtener las páginas de datos históricos de las existencias que desea. Vete con Yahoo! Financiar; Google es a la vez menos confiable, tiene menos cobertura de datos y es más restrictiva en cómo puede usarlo una vez que lo tiene. Además, creo que Google le prohíbe específicamente robar los datos en sus ToS.
Respuesta más larga: Esta es la secuencia de comandos que utilizo para extraer todos los datos históricos de una empresa en particular. Tira de la página de datos históricos para un símbolo de cotización en particular, luego la guarda en un archivo csv nombrado por ese símbolo. Tendrás que proporcionar tu propia lista de símbolos de cotización que deseas extraer.
import urllib
base_url = "http://ichart.finance.yahoo.com/table.csv?s="
def make_url(ticker_symbol):
return base_url + ticker_symbol
output_path = "C:/path/to/output/directory"
def make_filename(ticker_symbol, directory="S&P"):
return output_path + "/" + directory + "/" + ticker_symbol + ".csv"
def pull_historical_data(ticker_symbol, directory="S&P"):
try:
urllib.urlretrieve(make_url(ticker_symbol), make_filename(ticker_symbol, directory))
except urllib.ContentTooShortError as e:
outfile = open(make_filename(ticker_symbol, directory), "w")
outfile.write(e.content)
outfile.close()
Cuando vas a trabajar con tales series de tiempo en Python, pandas
es indispensable. Y esta es la buena noticia: viene con un descargador de datos históricos para Yahoo: pandas.io.data.DataReader
.
from pandas.io.data import DataReader
from datetime import datetime
ibm = DataReader('IBM', 'yahoo', datetime(2000, 1, 1), datetime(2012, 1, 1))
print(ibm['Adj Close'])
Here's an example from the pandas
documentation.
Actualización para pandas> = 0,19:
El módulo pandas.io.data
se ha eliminado de pandas>=0.19
en adelante. En su lugar, debe usar el pandas-datareader
package por separado. Instala con:
pip install pandas-datareader
Y entonces usted puede hacer esto en Python:
import pandas_datareader as pdr
from datetime import datetime
ibm = pdr.get_data_yahoo(symbols='IBM', start=datetime(2000, 1, 1), end=datetime(2012, 1, 1))
print(ibm['Adj Close'])
Cuando lo intento, las importaciones funcionan bien, pero cuando llamo a la línea 'goog' recibo un error: "IOError: después de 3 intentos, Yahoo! no devolvió un 200 para la URL 'http://ichart.finance.yahoo .com/table.csv? s = GOOG & a = 0 & b = 1 & c = 2000 & d = 0 & e = 1 & f = 2012 & g = d & ignore = .csv '"¿Cómo se pudo arreglar esto? – Cleb
Igual que Cleb. No devolvió el código de estado 200 – bluerubez
@Cleb parece ser porque 'GOOG' no es aceptado por la API (no entiendo por qué, después de pasar a Alphabet, se mantuvo el ticker de GOOGI). Funciona bien para 'GOOGL' y varios otros símbolos. Ejemplo ajustado por si acaso. –
Extendiendo @Def_Os's respuesta con una demostración real ...
Como @Def_Os ya ha dicho - usando Pandas Datareader hace esta tarea una verdadera diversión
In [12]: from pandas_datareader import data
tirando todos los datos históricos disponibles para AAPL
partir de 1980-01-01
#In [13]: aapl = data.DataReader('AAPL', 'yahoo', '1980-01-01')
# yahoo api is inconsistent for getting historical data, please use google instead.
In [13]: aapl = data.DataReader('AAPL', 'google', '1980-01-01')
primeras 5 filas
In [14]: aapl.head()
Out[14]:
Open High Low Close Volume Adj Close
Date
1980-12-12 28.750000 28.875000 28.750 28.750 117258400 0.431358
1980-12-15 27.375001 27.375001 27.250 27.250 43971200 0.408852
1980-12-16 25.375000 25.375000 25.250 25.250 26432000 0.378845
1980-12-17 25.875000 25.999999 25.875 25.875 21610400 0.388222
1980-12-18 26.625000 26.750000 26.625 26.625 18362400 0.399475
últimos 5 filas
In [15]: aapl.tail()
Out[15]:
Open High Low Close Volume Adj Close
Date
2016-06-07 99.250000 99.870003 98.959999 99.029999 22366400 99.029999
2016-06-08 99.019997 99.559998 98.680000 98.940002 20812700 98.940002
2016-06-09 98.500000 99.989998 98.459999 99.650002 26419600 99.650002
2016-06-10 98.529999 99.349998 98.480003 98.830002 31462100 98.830002
2016-06-13 98.690002 99.120003 97.099998 97.339996 37612900 97.339996
guardar todos los datos como archivo CSV
In [16]: aapl.to_csv('d:/temp/aapl_data.csv')
d:/temp/aapl_data.csv - 5 primeras filas
Date,Open,High,Low,Close,Volume,Adj Close
1980-12-12,28.75,28.875,28.75,28.75,117258400,0.431358
1980-12-15,27.375001,27.375001,27.25,27.25,43971200,0.408852
1980-12-16,25.375,25.375,25.25,25.25,26432000,0.378845
1980-12-17,25.875,25.999999,25.875,25.875,21610400,0.38822199999999996
1980-12-18,26.625,26.75,26.625,26.625,18362400,0.399475
...
ya hay una biblioteca en Python llamado yahoo_finance por lo que tendrá que descargar la biblioteca primero utilizando la siguiente línea de comandos:
sudo pip install yahoo_finance
Luego, una vez que haya instalado la biblioteca yahoo_finance, aquí hay un código de ejemplo que descargará los datos que necesita de Yahoo Finanzas:
#!/usr/bin/python
import yahoo_finance
import pandas as pd
symbol = yahoo_finance.Share("GOOG")
google_data = symbol.get_historical("1999-01-01", "2016-06-30")
google_df = pd.DataFrame(google_data)
# Output data into CSV
google_df.to_csv("/home/username/google_stock_data.csv")
Esto debe hacerlo. Déjame saber si funciona.
Simplemente curioso: ¿qué beneficio ofrece yahoo-finance sobre pandas_datareader (o viceversa)? – Mathematician
En ese momento era la única biblioteca que podía encontrar en relación con tirar de los precios de las acciones de Yahoo Finance. Sin embargo, parece que ya no funciona. – Naufal
Afirmado - 21/02/2018 - 'yahoo_finance' ya no funciona. – 3kstc
- 1. Descargar los precios de las acciones de Yahoo en R
- 2. Obteniendo precios de acciones de Yahoo con Elisp?
- 3. acciones de división api google o yahoo
- 4. ¿Dónde puedo encontrar alogritos de muestra para analizar los precios históricos de las acciones?
- 5. ¿Es posible descargar automáticamente la matriz de precios actual de iTunes Connect?
- 6. cómo identificar puntos de inflexión en los datos de precios de acciones
- 7. ¿yahoo financió acciones de API que devolvieron datos de opciones sobre acciones?
- 8. Cómo descargar automáticamente las dependencias C++ de forma cruzada + CMake?
- 9. ¿La manera más fácil de descargar automáticamente los módulos requeridos en Python?
- 10. PHP/AJAX toolkit para hacer un "gráfico en vivo" (ej. Para rastrear precios de acciones)
- 11. Reconocer automáticamente los patrones en las imágenes
- 12. acciones múltiples en lista de comprensión python
- 13. Descargar html en python?
- 14. Python: cómo descargar las cookies de una instancia mecanizada.Browser?
- 15. descargar un módulo en Python
- 16. ¿Cómo raspar los datos de precios de kayak.com?
- 17. Las acciones personalizadas de CanCan no funcionan con los bloques
- 18. ¿Cómo ampliar/anular las acciones del controlador de los complementos?
- 19. Vim elimina automáticamente la sangría en los comentarios de Python
- 20. python: ¿los campos de propiedad se almacenan en caché automáticamente?
- 21. descargar imágenes automáticamente desde cualquier ubicación URL
- 22. Obteniendo gráficos de stock de yahoo finance
- 23. ¿Flotante o decimal para los precios?
- 24. Magento: obtenga las reglas de precios a partir del pedido
- 25. Cotización de acciones API?
- 26. jQuery: ¿Anula automáticamente AjaxRequests en la página Descargar?
- 27. MySQL: tipo de columna preferida para los precios (de productos)?
- 28. ¿Las referencias temporales se borran automáticamente en Python?
- 29. ¿Cuál es el mejor método para agrupar las cifras de volumen intradía de una serie de precios de acciones usando XTS/ZOO, etc. en R?
- 30. Parámetros de Struts2 entre las acciones
echa un vistazo a http://scrape-google-finance.compunect.com/ es un raspador PHP de código abierto bastante nuevo para Google finance. Es gratis de usar/modificar y puede descargar todos los precios de acciones y todas las compañías de Google. No debería ser demasiado difícil aprender de él y escribir lo mismo en python. – John