He estado trabajando en un nuevo método para analizar y analizar conjuntos de datos para identificar y aislar subgrupos de una población sin conocimiento previo de las características de ningún subgrupo. Si bien el método funciona lo suficientemente bien con muestras de datos artificiales (es decir, conjuntos de datos creados específicamente con el propósito de identificar y segregar subconjuntos de la población), me gustaría probarlo con datos en vivo.
Lo que estoy buscando es una fuente de datos de libre acceso (es decir, no confidencial, no propietaria). Preferiblemente uno que contenga distribuciones bimodales o multimodales o que obviamente esté compuesto por múltiples subconjuntos que no pueden separarse fácilmente por medios tradicionales. ¿A dónde iría para encontrar esa información?