Estoy familiarizado con los titulares de datos R como vectores, marcos de datos, etc., pero necesito hacer algunos análisis de texto y parece que Python tiene algunas buenas configuraciones para hacerlo. Mi pregunta es dónde puedo encontrar una explicación de cómo Python guarda los datos.Ir a Python desde R, ¿cuál es el equivalente de Python de un marco de datos?
Específicamente tengo un conjunto de datos en un archivo separado por tabuladores, donde el texto está en la tercera columna y la puntuación de los datos que necesito está en la cuarta columna.
id1 id2 text score
123 889 "This is the text I need to read..." 88
234 778 "This is the text I need to read..." 78
345 667 "This is the text I need to read..." 91
En R que acababa de cargar en un marco de datos denominado df1
y cuando quería llamar a una columna que haría uso de $ texto DF1 o df1[,3]
y si quería una celda específica que podría utilizar df1[1,3]
.
Tengo una idea de cómo leer datos en python, pero no cómo tratar con estructuras similares a tablas.
¿Cómo sugeriría trabajar con esto para un principiante de python?
Python no tiene equivalente a el marco de datos –
@DavidHeffernan ¿Qué hay de eso [pandas] (http://pandas.pydata.org/) cosas? ¿No es eso (pretendido) cercano? – joran
@joran Eso es tercero. Supongo que quise decir que no hay nada integrado en la forma en que está integrado el marco de datos R. –