Esto me recuerda a los diagnósticos de cáncer, donde las firmas antiguas de expresión génica son reemplazadas por otras más nuevas, que por supuesto se supone que son mejores. ¿Pero cómo demostrar que son mejores?
Aquí hay un par de sugerencias para comparar la repetibilidad de los métodos.
1. Utilice el análisis de co-inercia (CIA).
La CIA debería ser más publicitada, desafortunadamente no se usa ampliamente (no hay página de Wikipedia, por ejemplo). CIA es un método de dos tablas que funciona según el mismo principio que el análisis canónico (CA), que consiste en buscar un par de puntajes lineales con una correlación máxima entre dos conjuntos de mediciones multidensionales. Su ventaja sobre CA es que puede hacerlo incluso si tiene más dimensiones que observaciones. Puede medir ambos métodos en las mismas muestras para obtener dos tablas acopladas de 30 columnas ynobservaciones El primer par de componentes principales debe estar fuertemente correlacionado (si los métodos realmente miden lo mismo). Si el método B es mejor, la varianza residual debería ser menor que la varianza residual del método A. Con este enfoque, usted aborda tanto el acuerdo de los métodos como su desacuerdo, que interpreta como ruido.
2. Use una distancia .
Puede usar la distancia euclidiana en 30 dimensiones entre la prueba y la nueva prueba para medir la repetibilidad de un método. Genera una muestra de esa puntuación para cada método y puede comparar las muestras con la prueba de Wilcoxon.
3. Utilice la aplicación aguas abajo.
Probablemente esté obteniendo estas huellas digitales para tomar una decisión o clasificar pacientes o material biológico. Puede contar los acuerdos frente a desacuerdos entre las pruebas y las nuevas pruebas para ambos métodos y compararlos con la prueba de Wilcoxon.
El método 3 es el más simple, pero también el más realista. Incluso para entradas de altas dimensiones, las decisiones suelen ser bastante simples. Y por complejo que sea nuestro problema, tenga en cuenta que la estadística es la ciencia de la decisión.
Respecto a la pregunta en tu comentario.
¿Qué pasa con el uso de un método robusto de reducción de dimensionalidad para reducir los datos multivariados a una sola dimensión y analizarlos?
La reducción de la dimensionalidad, por fuerte que sea, se asociará con una pérdida de varianza. Si hay una manera de transformar su huella digital multivariada en un solo puntaje capturando casi toda su variación, entonces seguro, esto es, con mucho, lo mejor que puede hacer. Pero entonces, ¿por qué la huella digital es multivariada en primer lugar?
Asumí por el contexto del OP que la huella digital es multivariada precisamente porque es difícil reducir aún más su dimensionalidad sin perder información. En ese caso, su repetibilidad en un solo puntaje no tiene que ser un buen indicador de la repetibilidad general, ya que puede descuidar la mayoría de la varianza (cerca de 29/30 en el peor de los casos).