Preguntas etiquetadas con dataframe

Un marco de datos es una estructura de datos tabular. Por lo general, contiene datos donde las filas son observaciones y las columnas son variables de varios tipos. Mientras "marco de datos" o "marco de datos" es el término utilizado para este concepto en varios idiomas (R, Apache Spark, deedle, Maple, la biblioteca de pandas en Python y la biblioteca de marcos de datos en Julia), "tabla" es el término utilizado en MATLAB y SQL.


11
Cómo soltar columnas por nombre en un marco de datos
Tengo un gran conjunto de datos y me gustaría leer columnas específicas o descartar todas las demás. data <- read.dta("file.dta") Selecciono las columnas que no me interesan: var.out <- names(data)[!names(data) %in% c("iden", "name", "x_serv", "m_serv")] y de lo que me gustaría hacer algo como: for(i in 1:length(var.out)) { paste("data$", var.out[i], …
304 r  dataframe  subset 

15
Convertir Python dict en un marco de datos
Tengo un diccionario de Python como el siguiente: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, …
299 python  pandas  dataframe 


11
¿Cómo acceder al último valor en un vector?
Supongamos que tengo un vector que está anidado en un marco de datos de uno o dos niveles. ¿Hay alguna forma rápida y sucia de acceder al último valor, sin usar la length()función? ¿Algo especial de ala PERL $#? Entonces me gustaría algo como: dat$vec1$vec2[$#] en vez de dat$vec1$vec2[length(dat$vec1$vec2)]
289 r  dataframe  vector 



3
Cómo verificar si existe una columna en Pandas
¿Hay alguna manera de verificar si existe una columna en un Pandas DataFrame? Supongamos que tengo el siguiente DataFrame: >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for …
274 python  pandas  dataframe 

21
¿Qué significa axis en pandas?
Aquí está mi código para generar un marco de datos: import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) entonces obtuve el marco de datos: +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ Cuando escribo el comando: dff.mean(axis=1) Tengo : 0 1.074821 …

6
Eliminar una columna completa de un data.frame en R
¿Alguien sabe cómo eliminar una columna completa de un data.frame en R? Por ejemplo, si me dan este data.frame: > head(data) chr genome region 1 chr1 hg19_refGene CDS 2 chr1 hg19_refGene exon 3 chr1 hg19_refGene CDS 4 chr1 hg19_refGene exon 5 chr1 hg19_refGene CDS 6 chr1 hg19_refGene exon y quiero …
267 r  dataframe 

10
Cómo tomar secciones de columna de marco de datos en pandas
Cargo algunos datos de aprendizaje automático de un archivo CSV. Las primeras 2 columnas son observaciones y las columnas restantes son características. Actualmente, hago lo siguiente: data = pandas.read_csv('mydata.csv') que da algo como: data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) Me gustaría cortar esta trama de datos en dos tramas de …



9
Combinar simultáneamente múltiples data.frames en una lista
Tengo una lista de muchos data.frames que quiero fusionar. El problema aquí es que cada data.frame difiere en términos del número de filas y columnas, pero todos comparten las variables clave (que he llamado "var1"y "var2"en el código a continuación). Si los data.frames fueran idénticos en términos de columnas, podría …
259 r  list  merge  dataframe  r-faq 


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.