Preguntas etiquetadas con categorical-encoding

Representar variables categóricas como conjuntos de variables numéricas. Necesario en muchos tipos de análisis para que puedan procesar datos categóricos. Un ejemplo común es usar un predictor categórico en regresión / ANOVA mediante codificación ficticia, codificación de efectos, codificación Helmert, contrastes definidos por el usuario, etc.




1
Descartar una de las columnas cuando se utiliza la codificación hot-one
Tengo entendido que en el aprendizaje automático puede ser un problema si su conjunto de datos tiene características altamente correlacionadas, ya que codifican efectivamente la misma información. Recientemente, alguien señaló que cuando realiza una codificación de una sola vez en una variable categórica, termina con características correlacionadas, por lo que …

3
¿Cuándo se debe usar la regresión múltiple con codificación ficticia frente a ANCOVA?
Recientemente analicé un experimento que manipuló 2 variables categóricas y una variable continua usando ANCOVA. Sin embargo, un revisor sugirió que la regresión múltiple con la variable categórica codificada como variables ficticias es una prueba más apropiada para experimentos con variables categóricas y continuas. ¿Cuándo es apropiado usar ANCOVA versus …


5
Cómo recodificar la variable categórica en variable numérica cuando se usa SVM o red neuronal
Para usar SVM o red neuronal, necesita transformar (codificar) variables categóricas en variables numéricas, el método normal en este caso es usar valores binarios 0-1 con el k-ésimo valor categórico transformado para ser (0,0, .. ., 1,0, ... 0) (1 está en la posición k-ésima). ¿Hay otros métodos para hacer …


2
La codificación de variables cualitativas en regresión conduce a "singularidades"
Tengo una variable independiente llamada "calidad"; Esta variable tiene 3 modalidades de respuesta (mala calidad; calidad media; alta calidad). Quiero introducir esta variable independiente en mi regresión lineal múltiple. Cuando tengo una variable independiente binaria (variable ficticia, puedo codificar 0/ 1) es fácil introducirla en un modelo de regresión lineal …


2
¿Cómo hacer la regresión con la codificación de efectos en lugar de la codificación ficticia en R?
Actualmente estoy trabajando en un modelo de regresión donde solo tengo variables categóricas / factoriales como variables independientes. Mi variable dependiente es una relación transformada logit. Es bastante fácil ejecutar una regresión normal en R, ya que R sabe automáticamente cómo codificar dummies tan pronto como son del tipo "factor". …

1
¿Cuáles son los diferentes tipos de codificaciones disponibles para las variables categóricas (en R) y cuándo las usaría?
Si se ajusta a un modelo lineal o un modelo mixto, hay diferentes tipos de codificaciones disponibles para transformar una variable categórica o nominal en una serie de variables para las que se estiman los parámetros, como la codificación ficticia (el valor predeterminado de R) y la codificación de efectos. …




Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.