Tengo un marco de datos con una columna llamada "Date"
y quiero que todos los valores de esta columna tengan el mismo valor (solo el año). Ejemplo:pandas: cómo cambiar todos los valores de una columna?
City Date
Paris 01/04/2004
Lisbon 01/09/2004
Madrid 2004
Pekin 31/2004
Lo que quiero es:
City Date
Paris 2004
Lisbon 2004
Madrid 2004
Pekin 2004
Aquí está mi código:
fr61_70xls = pd.ExcelFile('AMADEUS FRANCE 1961-1970.xlsx')
#Here we import the individual sheets and clean the sheets
years=(['1961','1962','1963','1964','1965','1966','1967','1968','1969','1970'])
fr={}
header=(['City','Country','NACE','Cons','Last_year','Op_Rev_EUR_Last_avail_yr','BvD_Indep_Indic','GUO_Name','Legal_status','Date_of_incorporation','Legal_status_date'])
for year in years:
# save every sheet in variable fr['1961'], fr['1962'] and so on
fr[year]=fr61_70xls.parse(year,header=0,parse_cols=10)
fr[year].columns=header
# drop the entire Legal status date column
fr[year]=fr[year].drop(['Legal_status_date','Date_of_incorporation'],axis=1)
# drop every row where GUO Name is empty
fr[year]=fr[year].dropna(axis=0,how='all',subset=[['GUO_Name']])
fr[year]=fr[year].set_index(['GUO_Name','Date_of_incorporation'])
Sucede que en mis tramas de datos, llamados por ejemplo fr['1961']
los valores de Date_of_incorporation
puede ser cualquier cosa (cadenas, enteros, etc.), así que tal vez sería mejor borrar por completo esta columna y luego adjuntar otra columna con solo el año al DataFram es?
¿Las fechas son solo cadenas? –
Cadenas y números dependiendo de si solo existe el año (como en el ejemplo de Madrid) o si también está el mes y el día (como Pekín y París). – brodrigues