Estoy trabajando en el desarrollo de un modelo predictivo de riesgo de seguro. Estos modelos son de "eventos raros" como predicción de ausencia de aerolínea, detección de fallas de hardware, etc. Mientras preparaba mi conjunto de datos, traté de aplicar la clasificación, pero no pude obtener clasificadores útiles debido a la alta proporción de casos negativos .
No tengo mucha experiencia en estadísticas y datos de modelado más allá de un curso de estadística de secundaria, así que estoy un poco confundido.
Como pensé por primera vez, he estado pensando en usar un modelo de proceso de Poisson no homogéneo. Lo clasifiqué en función de los datos del evento (fecha, lat, lon) para obtener una buena estimación de la posibilidad de un riesgo en un momento determinado en un día en particular en un lugar en particular.
Me gustaría saber, ¿cuáles son las metodologías / algoritmos para predecir eventos raros?
¿Qué recomienda como enfoque para abordar este problema?