Preguntas etiquetadas con pandas

Pandas es una biblioteca de Python para la manipulación y el análisis de datos, por ejemplo, marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.

11
Seleccione por cadena parcial de un marco de datos de pandas
Tengo un DataFramecon 4 columnas de las cuales 2 contienen valores de cadena. Me preguntaba si había una manera de seleccionar filas en función de una coincidencia de cadena parcial contra una columna en particular. En otras palabras, una función o función lambda que haría algo como re.search(pattern, cell_in_question) devolviendo …


7
Obtenga estadísticas para cada grupo (como conteo, media, etc.) usando pandas GroupBy?
Tengo un marco de datos dfy uso varias columnas para groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() De la manera anterior, casi obtengo la tabla (marco de datos) que necesito. Lo que falta es una columna adicional que contenga el número de filas en cada grupo. En otras palabras, quiero decir, pero también me gustaría …

7
Cómo filtrar el marco de datos de Pandas usando 'in' y 'not in' como en SQL
¿Cómo puedo lograr los equivalentes de SQL INy NOT IN? Tengo una lista con los valores requeridos. Aquí está el escenario: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Mi forma actual de hacer esto es la siguiente: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # …

18
UnicodeDecodeError al leer el archivo CSV en Pandas con Python
Estoy ejecutando un programa que procesa 30,000 archivos similares. Un número aleatorio de ellos se detiene y produce este error ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", …




15
La construcción de pandas DataFrame a partir de valores en variables proporciona "ValueError: si usa todos los valores escalares, debe pasar un índice"
Esta puede ser una pregunta simple, pero no puedo entender cómo hacerlo. Digamos que tengo dos variables de la siguiente manera. a = 2 b = 3 Quiero construir un DataFrame a partir de esto: df2 = pd.DataFrame({'A':a,'B':b}) Esto genera un error: ValueError: si usa todos los valores escalares, debe …


12
Cómo aplicar una función a dos columnas del marco de datos Pandas
Supongamos que tengo un dfque tiene columnas de 'ID', 'col_1', 'col_2'. Y defino una función: f = lambda x, y : my_function_expression. Ahora quiero aplicar la fa df's dos columnas 'col_1', 'col_2'para calcular elemento gota una nueva columna 'col_3', algo así como: df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: …
368 python  pandas  dataframe 

2
Pandas Merging 101
¿Cómo realizar una unión ( LEFT| RIGHT| FULL) ( INNER| OUTER) con pandas? ¿Cómo agrego NaNs para las filas que faltan después de la fusión? ¿Cómo me deshago de NaNs después de la fusión? ¿Puedo fusionarme en el índice? Cruz unirse con pandas? ¿Cómo fusiono múltiples DataFrames? merge? join? concat? …
365 python  pandas  join  merge 

2
Cómo pivotar un marco de datos
¿Qué es el pivote? ¿Cómo giro? ¿Es esto un pivote? Formato largo a formato ancho? He visto muchas preguntas sobre las tablas dinámicas. Incluso si no saben que están preguntando sobre tablas dinámicas, generalmente lo hacen. Es prácticamente imposible escribir una pregunta canónica y una respuesta que abarque todos los …

11
¿Cómo obtener un valor de una celda de un marco de datos?
He construido una condición que extrae exactamente una fila de mi marco de datos: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Ahora me gustaría tomar un valor de una columna en particular: val = d2['col_name'] Pero como resultado obtengo un marco de datos que contiene una fila y …
344 python  pandas  dataframe 

30
Python Pandas Error al tokenizar datos
Estoy tratando de usar pandas para manipular un archivo .csv pero aparece este error: pandas.parser.CParserError: error al tokenizar datos. Error C: se esperaban 2 campos en la línea 3, vi 12 Intenté leer los documentos de los pandas, pero no encontré nada. Mi código es simple: path = 'GOOG Key …
341 python  csv  pandas 

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.