Cuando leo sobre cómo configurar sus datos, una cosa que a menudo me encuentro es que transformar algunos datos continuos en datos categóricos no es una buena idea, ya que es muy posible que llegue a una conclusión incorrecta si los umbrales están mal determinados.
Sin embargo, actualmente tengo algunos datos (valores de PSA para pacientes con cáncer de próstata), donde creo que el consenso común es que si tiene menos de 4 años, probablemente no lo tenga, si está por encima está en riesgo, y luego algo así como por encima de 10 y 20, probablemente lo tengas. Algo como eso. En ese caso, ¿seguiría siendo incorrecto clasificar mis valores continuos de PSA en grupos de digamos 0-4, 4-10 y> 10? ¿O está realmente bien ya que los umbrales están "bien determinados", por así decirlo?