Preguntas etiquetadas con dataframe

Un marco de datos es una estructura de datos tabular. Por lo general, contiene datos donde las filas son observaciones y las columnas son variables de varios tipos. Mientras "marco de datos" o "marco de datos" es el término utilizado para este concepto en varios idiomas (R, Apache Spark, deedle, Maple, la biblioteca de pandas en Python y la biblioteca de marcos de datos en Julia), "tabla" es el término utilizado en MATLAB y SQL.





3
Operadores lógicos para la indexación booleana en pandas
Estoy trabajando con el índice booleano en Pandas. La pregunta es por qué la declaración: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] funciona bien mientras a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] sale con error? Ejemplo: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with …

6
¿Debo usar un data.frame o una matriz?
¿Cuándo se debe usar a data.frame, y cuándo es mejor usar a matrix? Ambos mantienen los datos en un formato rectangular, por lo que a veces no está claro. ¿Hay alguna regla general sobre cuándo usar qué tipo de datos?
152 r  matrix  dataframe  r-faq 



8
¿Pueden los pandas reconocer fechas automáticamente?
Hoy me sorprendió positivamente el hecho de que, al leer datos de un archivo de datos (por ejemplo), los pandas pueden reconocer tipos de valores: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Por ejemplo, se puede verificar de esta manera: for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) En particular, los …
151 python  date  types  dataframe  pandas 





7
Convierta los nombres de fila en la primera columna
Tengo un marco de datos como este: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at "116.493632746934" "A" "0.39799368200131" 1294_at "739.927122116896" "A" "0.0668649772942343" Quiero convertir los nombres de fila en la primera columna. Actualmente utilizo algo como …
147 r  dataframe  col  rowname 


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.