"Variable ficticia" y "variable indicadora" son etiquetas que se usan con frecuencia para describir la pertenencia a una categoría con codificación 0/1; generalmente 0: no es miembro de la categoría, 1: miembro de la categoría.
El 26/11/2014, una búsqueda rápida en scholar.google.com (con comillas adjuntas) revela que la "variable ficticia" se usa en aproximadamente 318,000 artículos, y la "variable indicadora" se usa en aproximadamente 112,000 artículos. El término "variable ficticia" también tiene un significado en matemática no estadística de " variable ligada " que probablemente contribuye al mayor uso de "variable ficticia" en artículos indexados.
Mis preguntas vinculadas por temas:
- ¿Son estos términos siempre sinónimos (dentro de las estadísticas)?
- ¿Alguno de estos términos se aplica de manera aceptable a otras formas de codificación categórica (por ejemplo , codificación de efectos , codificación Helmert, etc. )?
- ¿Qué razones estadísticas o disciplinarias existen para preferir un término sobre el otro?
sex
.
male
, donde 1 significa verdadero (en este caso masculino) y 0 significa falso (en este caso femenino). Si uso el nombre de la variable sex
, tendré que buscar cómo codifiqué esa variable cada vez que regreso a ese conjunto de datos.
male
con valores1
o0
. Si hay una variable categórica con más de 2 categorías que luego se expande en variables indicadoras para la membresía en cada nivel, usaría "variables ficticias" para describir ese conjunto de variables indicadoras.