Preguntas etiquetadas con dataframe

Un marco de datos es una estructura de datos tabular. Por lo general, contiene datos donde las filas son observaciones y las columnas son variables de varios tipos. Mientras "marco de datos" o "marco de datos" es el término utilizado para este concepto en varios idiomas (R, Apache Spark, deedle, Maple, la biblioteca de pandas en Python y la biblioteca de marcos de datos en Julia), "tabla" es el término utilizado en MATLAB y SQL.





5
¿Crear un marco de datos de Pandas vacío y luego llenarlo?
Estoy comenzando con los documentos de Pandas DataFrame aquí: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Me gustaría llenar iterativamente el DataFrame con valores en un tipo de cálculo de serie temporal. Básicamente, me gustaría inicializar el DataFrame con columnas A, B y filas de marca de tiempo, todas 0 o todas NaN. Luego agregaría valores …
463 python  dataframe  pandas 



11
Seleccione por cadena parcial de un marco de datos de pandas
Tengo un DataFramecon 4 columnas de las cuales 2 contienen valores de cadena. Me preguntaba si había una manera de seleccionar filas en función de una coincidencia de cadena parcial contra una columna en particular. En otras palabras, una función o función lambda que haría algo como re.search(pattern, cell_in_question) devolviendo …


7
Obtenga estadísticas para cada grupo (como conteo, media, etc.) usando pandas GroupBy?
Tengo un marco de datos dfy uso varias columnas para groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() De la manera anterior, casi obtengo la tabla (marco de datos) que necesito. Lo que falta es una columna adicional que contenga el número de filas en cada grupo. En otras palabras, quiero decir, pero también me gustaría …

7
Cómo filtrar el marco de datos de Pandas usando 'in' y 'not in' como en SQL
¿Cómo puedo lograr los equivalentes de SQL INy NOT IN? Tengo una lista con los valores requeridos. Aquí está el escenario: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Mi forma actual de hacer esto es la siguiente: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # …

18
UnicodeDecodeError al leer el archivo CSV en Pandas con Python
Estoy ejecutando un programa que procesa 30,000 archivos similares. Un número aleatorio de ellos se detiene y produce este error ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", …


16
Cambiar los nombres de columna de un marco de datos
Tengo un marco de datos llamado "newprice" (ver más abajo) y quiero cambiar los nombres de columna en mi programa en R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 De hecho, esto es lo que estoy haciendo: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") …
399 r  dataframe  rename 


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.