¿Cuál es la mejor manera de preparar interacciones de características categóricas antes de ajustar con scikit-learn?
Con statsmodelspodría decir convenientemente en estilo R smf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()(lo mismo en Stata con regress depvar i.var1##i.var2).
¿Puede sklearn.preprocessing.PolynomialFeatures(en v0.15, actualmente dev) usarse con variables categóricas?
~var1*var2está perfectamente bien en R para construir la matriz RHS)