Preguntas etiquetadas con python

Python es un lenguaje de programación comúnmente utilizado para el aprendizaje automático. Use esta etiqueta para cualquier pregunta * sobre el tema * que (a) involucre a `Python` ya sea como parte crítica de la pregunta o respuesta esperada, y (b) no es * solo * sobre cómo usar` Python`.

6
Recursos para aprender a implementar métodos de conjunto
Entiendo teóricamente (más o menos) cómo funcionarían, pero no estoy seguro de cómo hacerlo utilizando un método de conjunto (como votación, mezclas ponderadas, etc.). ¿Cuáles son buenos recursos para implementar métodos de conjunto? ¿Hay algún recurso en particular con respecto a la implementación en Python? EDITAR: Para aclarar algunos basados …

3
Ruby como banco de trabajo de estadísticas
Esta también es una pregunta que se relaciona mucho con Python como un banco de trabajo de estadísticas y sobresale como un banco de trabajo de estadísticas . Sé que hay una gran discusión sobre Ruby versus Python, pero este no es el punto en esta pregunta. Pensé que Ruby …
13 r  python  software  ruby 


9
¿Árboles de decisión impulsados ​​en Python? [cerrado]
Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 5 meses . ¿Existe una buena biblioteca de Python para entrenar árboles de decisión potenciados?
13 python  cart  boosting 

1
Paquete GBM vs. Caret usando GBM
He estado usando el ajuste del modelo caret, pero luego volví a ejecutar el modelo usando el gbmpaquete. Entiendo que el caretpaquete usa gbmy el resultado debe ser el mismo. Sin embargo, solo una ejecución de prueba rápida usando data(iris)muestra una discrepancia en el modelo de aproximadamente 5% usando RMSE …

2
Usando BIC para estimar el número de k en KMEANS
Actualmente estoy tratando de calcular el BIC para mi conjunto de datos de juguete (ofc iris (:). Quiero reproducir los resultados como se muestra aquí (Fig. 5). Ese documento también es mi fuente para las fórmulas de BIC. Tengo 2 problemas con esto: Notación: ninin_i = número de elementos en …

2
¿Cómo usar un filtro Kalman?
Tengo una trayectoria de un objeto en un espacio 2D (una superficie). La trayectoria se da como una secuencia de (x,y)coordenadas. Sé que mis medidas son ruidosas y, a veces, tengo valores atípicos evidentes. Entonces, quiero filtrar mis observaciones. Hasta donde entendí el filtro de Kalman, hace exactamente lo que …


1
Regresión logística ordinal en Python
Me gustaría ejecutar una regresión logística ordinal en Python, para una variable de respuesta con tres niveles y con algunos factores explicativos. El statsmodelspaquete admite modelos logit binarios y logit multinomiales (MNLogit), pero no logit ordenado. Dado que la matemática subyacente no es tan diferente, me pregunto si se puede …


5
¿Cómo realizar la imputación de valores en una gran cantidad de puntos de datos?
Tengo un conjunto de datos muy grande y faltan alrededor del 5% de valores aleatorios. Estas variables están correlacionadas entre sí. El siguiente conjunto de datos R de ejemplo es solo un ejemplo de juguete con datos correlacionados ficticios. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


1
Paquetes de Python para trabajar con modelos de mezcla gaussianos (GMM)
Parece que hay varias opciones disponibles para trabajar con Gaussian Mixture Models (GMM) en Python. A primera vista hay al menos: PyMix - http://www.pymix.org/pymix/index.php Herramientas para modelar mezclas PyEM: http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/ que forma parte de la caja de herramientas de Scipy y parece centrarse en la actualización de GMM : ahora …

1
Interpretación de salida de scikit predic_proba
Estoy trabajando con la biblioteca scikit-learn en python. En el siguiente código, estoy prediciendo la probabilidad, pero no sé cómo leer la salida. Datos de prueba from sklearn.ensemble import RandomForestClassifier as RF from sklearn import cross_validation X = np.array([[5,5,5,5],[10,10,10,10],[1,1,1,1],[6,6,6,6],[13,13,13,13],[2,2,2,2]]) y = np.array([0,1,1,0,1,2]) Dividir el conjunto de datos X_train, X_test, y_train, …

2
¿Es posible evaluar GLM en Python / scikit-learn usando las distribuciones de Poisson, Gamma o Tweedie como la familia para la distribución de errores?
Intento aprender algo de Python y Sklearn, pero para mi trabajo necesito ejecutar regresiones que utilicen distribuciones de error de las familias Poisson, Gamma y especialmente Tweedie. No veo nada en la documentación sobre ellos, pero están en varias partes de la distribución R, por lo que me preguntaba si …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.