Preguntas etiquetadas con data-transformation

Reexpresión matemática, a menudo no lineal, de valores de datos. Los datos a menudo se transforman para cumplir con los supuestos de un modelo estadístico o para hacer que los resultados de un análisis sean más interpretables.



5
Reducción de dimensionalidad SVD para series de tiempo de diferente longitud
Estoy usando la descomposición del valor singular como técnica de reducción de dimensionalidad. Dados los Nvectores de dimensión D, la idea es representar las características en un espacio transformado de dimensiones no correlacionadas, lo que condensa la mayor parte de la información de los datos en los vectores propios de …



1
¿ recomiendan las transformaciones raíz -ésima?
Mi colega quiere analizar algunos datos después de transformar la variable de respuesta elevándola a la potencia de (es decir, ). y0.1251818\frac18y0,125y0.125y^{0.125} Me siento incómodo con esto, pero me cuesta articular por qué. No se me ocurre ninguna razón mecanicista para esta transformación. Tampoco lo he visto antes, y me …





1
Criterios para seleccionar el "mejor" modelo en un modelo oculto de Markov
Tengo un conjunto de datos de series temporales en el que estoy tratando de ajustar un Modelo de Markov Oculto (HMM) para estimar el número de estados latentes en los datos. Mi pseudo código para hacer esto es el siguiente: for( i in 2 : max_number_of_states ){ ... calculate HMM …


1
¿Por qué usar variables registradas?
Probablemente, esta es una pregunta muy básica, pero parece que no puedo encontrar una respuesta sólida para ella. Espero aquí, puedo. Actualmente estoy leyendo documentos como preparación para mi propia tesis de maestría. Actualmente, estoy leyendo un artículo que investiga la relación entre los tweets y las características del mercado …

2
¿Qué hacer cuando algunos puntos temporales tienen respuestas muy sesgadas y otras no en un estudio de medidas repetidas?
Típicamente, cuando uno encuentra medidas de resultado continuas pero sesgadas en un diseño longitudinal (digamos, con un efecto entre sujetos), el enfoque común es transformar el resultado en normalidad. Si la situación es extrema, como en el caso de las observaciones truncadas, uno podría ponerse elegante y usar un modelo …

2
¿Son los modelos de series cronológicas de diferencia de registro mejores que las tasas de crecimiento?
A menudo veo que los autores estiman un modelo de "diferencia logarítmica", p. Ej. log(yt)−log(yt−1)=log(yt/yt−1)=α+βxtlog⁡(yt)−log⁡(yt−1)=log⁡(yt/yt−1)=α+βxt\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t Estoy de acuerdo en que esto es apropiado para relacionar con un cambio porcentual en mientras que es .xtxtx_tytyty_tlog(yt)log⁡(yt)\log (y_t)I(1)I(1)I(1) Pero la diferencia logarítmica es una aproximación, …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.