Preguntas etiquetadas con dataframe

Un marco de datos es una estructura de datos tabular. Por lo general, contiene datos donde las filas son observaciones y las columnas son variables de varios tipos. Mientras "marco de datos" o "marco de datos" es el término utilizado para este concepto en varios idiomas (R, Apache Spark, deedle, Maple, la biblioteca de pandas en Python y la biblioteca de marcos de datos en Julia), "tabla" es el término utilizado en MATLAB y SQL.

9
Importar archivo CSV como un DataFrame de pandas
¿Cuál es la forma de Python para leer un archivo CSV en un DataFrame de pandas (que luego puedo usar para operaciones estadísticas, puede tener columnas de tipos diferentes, etc.)? Mi archivo CSV "value.txt"tiene el siguiente contenido: Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 En R leeríamos este archivo …
91 python  pandas  csv  dataframe 

6
seleccionar de pandas de índice múltiple
Tengo un marco de datos de índices múltiples con columnas 'A' y 'B'. ¿Hay alguna manera de seleccionar filas filtrando en una columna del índice múltiple sin restablecer el índice a un índice de una sola columna? Por ejemplo. # has multi-index (A,B) df #can I do this? I know …


5
Construya pandas DataFrame a partir de elementos en un diccionario anidado
Supongamos que tengo un diccionario anidado 'user_dict' con estructura: Nivel 1: UserId (entero largo) Nivel 2: Categoría (cadena) Nivel 3: Atributos surtidos (flotadores, entradas, etc.) Por ejemplo, una entrada de este diccionario sería: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2": {"att_1": 23, "att_2": "another"}} cada elemento …

3
Anotar barras con valores en diagramas de barras de Pandas
Estaba buscando una forma de anotar mis barras en un gráfico de barras de Pandas con los valores numéricos redondeados de mi DataFrame. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 Me gustaría obtener algo como esto: Intenté con este ejemplo de código, pero todas …

13
Comparar dos marcos de datos y obtener las diferencias
Tengo dos marcos de datos. Ejemplos: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green 2013-11-25 Apple …

5
Reemplazar todos los valores particulares en un marco de datos
Teniendo un marco de datos, ¿cómo hago para reemplazar todos los valores particulares a lo largo de todas las filas y columnas? Digamos, por ejemplo, que quiero reemplazar todos los registros vacíos con NA's (sin escribir las posiciones): df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100))) A B 1 12 …
89 r  dataframe  replace 




1
Aplicar función a cada celda en DataFrame
Tengo un marco de datos que puede verse así: A B C foo bar foo bar bar foo foo bar Quiero mirar a través de cada elemento de cada fila (o cada elemento de cada columna) y aplicar la siguiente función para obtener el DF subsiguiente: def foo_bar(x): return x.replace('foo', …



5
Convertir vector de caracteres con nombre en data.frame
Tengo un vector de caracteres con nombre devuelto por xmlAttrs como este: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Me gustaría convertirlo en un marco de datos que se vea así: testDF <- data.frame("db_version"="11.2.0.3.0","elapsed_time"=12.89,"cpu_time"=12.71) head(testDF) db_version elapsed_time cpu_time 1 11.2.0.3.0 12.89 12.71


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.