Preguntas etiquetadas con pandas

Pandas es una biblioteca de Python para la manipulación y el análisis de datos, por ejemplo, marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.


4
¿Cuáles son los pros y los contras entre get_dummies (Pandas) y OneHotEncoder (Scikit-learn)?
Estoy aprendiendo diferentes métodos para convertir variables categóricas en numéricas para clasificadores de aprendizaje automático. Encontré el pd.get_dummiesmétodo y sklearn.preprocessing.OneHotEncoder()quería ver cómo se diferenciaban en términos de rendimiento y uso. Encontré un tutorial sobre cómo usar OneHotEncoder()en https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/ desde la sklearndocumentación no fue muy útil sobre esta función. Tengo la …



3
Combine dos marcos de datos de pandas (únase en una columna común)
Tengo 2 marcos de datos: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values latitude 4503 non-null values longitude 4503 non-null values name 4503 non-null values neighborhoods 4503 non-null values open 4503 non-null values review_count 4503 non-null …


6
Índice de acceso del último elemento en el marco de datos
Estoy buscando esto, pero parece que no puedo encontrarlo (aunque debe ser extremadamente trivial). El problema que tengo es que me gustaría recuperar el valor de una columna para las primeras y últimas entradas de un marco de datos. Pero si lo hago: df.ix[0]['date'] Yo obtengo: datetime.datetime(2011, 1, 10, 16, …
83 python  pandas 

4
Aplicar función en el índice DataFrame
¿Cuál es la mejor manera de aplicar una función sobre el índice de un Pandas DataFrame? Actualmente estoy usando este enfoque detallado: pd.DataFrame({"Month": df.reset_index().Date.apply(foo)}) donde Datees el nombre del índice y fooes el nombre de la función que estoy aplicando.


5
Múltiples salidas de celda de IPython Notebook
Estoy ejecutando esta celda en IPython Notebook: # salaries and teams are Pandas dataframe salaries.head() teams.head() El resultado es que solo obtengo el resultado del teamsmarco de datos en lugar de ambos salariesy teams. Si solo ejecuto salaries.head(), obtengo el resultado para salariesel marco de datos, pero al ejecutar ambas …



6
Cómo fusionar una serie y un DataFrame
Si usted vino aquí en busca de información sobre cómo combinar una DataFramey Seriesen el índice , por favor vaya a esta respuesta . La intención original del OP era preguntar cómo asignar elementos de serie como columnas a otro DataFrame . Si está interesado en conocer la respuesta a …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.