Para el caso de uso como se presenta en la pregunta, también puede simplemente multiplicar la condición lógica con 1
(o tal vez incluso mejor, con 1L
):
df1 <- data.frame(yr = 1951:1960)
df1$is.1957 <- 1L * (df1$yr == 1957)
df1$after.1957 <- 1L * (df1$yr >= 1957)
lo que da:
> df1
yr is.1957 after.1957
1 1951 0 0
2 1952 0 0
3 1953 0 0
4 1954 0 0
5 1955 0 0
6 1956 0 0
7 1957 1 1
8 1958 0 1
9 1959 0 1
10 1960 0 1
Para los casos de uso que se presentan, por ejemplo, en las respuestas de @ zx8754 y @Sotos, todavía hay algunas otras opciones que aún no se han cubierto en mi opinión.
1) Crea tu propia make_dummies
función
df2 <- data.frame(id = 1:5, year = c(1991:1994,1992))
make_dummies <- function(v, prefix = '') {
s <- sort(unique(v))
d <- outer(v, s, function(v, s) 1L * (v == s))
colnames(d) <- paste0(prefix, s)
d
}
cbind(df2, make_dummies(df2$year, prefix = 'y'))
lo que da:
id year y1991 y1992 y1993 y1994
1 1 1991 1 0 0 0
2 2 1992 0 1 0 0
3 3 1993 0 0 1 0
4 4 1994 0 0 0 1
5 5 1992 0 1 0 0
2) utilice la función dcast
-detabla de datos o reshape2
dcast(df2, id + year ~ year, fun.aggregate = length)
lo que da:
id year 1991 1992 1993 1994
1 1 1991 1 0 0 0
2 2 1992 0 1 0 0
3 3 1993 0 0 1 0
4 4 1994 0 0 0 1
5 5 1992 0 1 0 0
Sin embargo, esto no funcionará cuando haya valores duplicados en la columna para los que se deben crear las variables ficticias. En el caso de que se necesite una función de agregación específica dcast
y el resultado de la dcast
necesidad de fusionarse con el original:
df3 <- data.frame(var = c("B", "C", "A", "B", "C"))
f <- function(x) as.integer(length(x) > 0)
merge(df3, dcast(df3, var ~ var, fun.aggregate = f), by = 'var', all.x = TRUE)
que da (tenga en cuenta que el resultado está ordenado de acuerdo con la by
columna):
var A B C
1 A 1 0 0
2 B 0 1 0
3 B 0 1 0
4 C 0 0 1
5 C 0 0 1
3) usa el spread
-detidyr(con mutate
dedplyr)
library(dplyr)
library(tidyr)
df2 %>%
mutate(v = 1, yr = year) %>%
spread(yr, v, fill = 0)
lo que da:
id year 1991 1992 1993 1994
1 1 1991 1 0 0 0
2 2 1992 0 1 0 0
3 3 1993 0 0 1 0
4 4 1994 0 0 0 1
5 5 1992 0 1 0 0