Recientemente, un cliente vino a mí para hacer un análisis de arranque porque un revisor de la FDA dijo que su regresión de errores en variables no era válida porque al agrupar datos de sitios, el análisis incluía datos de tres sitios donde dos sitios incluían algunas muestras que estaban lo mismo.
ANTECEDENTES
El cliente tenía un nuevo método de ensayo que quería mostrar que era "equivalente" a un método aprobado existente. Su enfoque consistía en comparar los resultados de ambos métodos aplicados a las mismas muestras. Se usaron tres sitios para hacer la prueba. Se aplicaron errores en las variables (regresión de Deming) a los datos en cada sitio. La idea es que si la regresión mostró que el parámetro de pendiente está cerca de 1 y la intersección cerca de 0, esto demostraría que las dos técnicas de ensayo dieron casi los mismos resultados y, por lo tanto, el nuevo método debería ser aprobado. En el sitio 1 tenían 45 muestras que les daban 45 observaciones emparejadas. El sitio 2 tenía 40 muestras y el sitio 3, 43 muestras. Hicieron tres regresiones de Deming separadas (suponiendo una relación de 1 para los errores de medición para los dos métodos). Entonces el algoritmo minimizó la suma de las distancias perpendiculares al cuadrado.
En su presentación, el cliente señaló que algunas de las muestras utilizadas en los sitios 1 y 2 eran las mismas. En la revisión, el revisor de la FDA dijo que la regresión de Deming no era válida porque se usaron muestras comunes que causan "interferencia" que invalida los supuestos del modelo. Solicitaron que se aplicara un ajuste de arranque a los resultados de Deming para tener en cuenta esta interferencia.
En ese momento, dado que el cliente no sabía cómo hacer el bootstrap, me llevaron. El término interferencia era extraño y no estaba seguro de a qué se refería exactamente el crítico. Supuse que el punto realmente era que debido a que los datos agrupados tenían muestras comunes, habría correlación para las muestras comunes y, por lo tanto, los términos de error del modelo no serían todos independientes.
EL ANÁLISIS DEL CLIENTE
Las tres regresiones separadas fueron muy similares. Cada uno tenía parámetros de pendiente cercanos a 1 e intercepta cerca de 0. El intervalo de confianza del 95% contenía 1 y 0 para la pendiente e intercepción respectivamente en cada caso. La principal diferencia fue una varianza residual ligeramente mayor en el sitio 3. Además, compararon esto con los resultados de hacer OLS y encontraron que eran muy similares (en solo un caso el intervalo de confianza para la pendiente basado en OLS no contenía 1). En el caso donde el IC OLS para la pendiente no contenía 1, el límite superior del intervalo era algo así como 0.99.
Con los resultados tan similares en los tres sitios que agrupaban los datos del sitio, parecía razonable. El cliente realizó una regresión de Deming agrupada que también condujo a resultados similares. Dados estos resultados, escribí un informe para el cliente que disputaba la afirmación de que las regresiones no eran válidas. Mi argumento es que debido a que hay errores de medición similares en ambas variables, el cliente tenía razón al usar la regresión de Deming como una forma de mostrar acuerdo / desacuerdo. Las regresiones de sitios individuales no tuvieron problemas de errores correlacionados porque no se repitieron muestras dentro de un sitio dado. Agrupando datos para obtener intervalos de confianza más ajustados.
Esta dificultad podría remediarse simplemente agrupando los datos con las muestras comunes del sitio 1, por ejemplo, excluidas. Además, los tres modelos de sitio individuales no tienen el problema y son válidos. Esto me parece proporcionar una fuerte evidencia de acuerdo, incluso sin la agrupación. Además, las mediciones se tomaron independientemente en los sitios 1 y 2 para los sitios comunes. Entonces, creo que incluso el análisis agrupado que usa todos los datos es válido porque los errores de medición para una muestra en el sitio 1 no están correlacionados con los errores de medición en la muestra correspondiente en el sitio 2. Esto realmente equivale a repetir un punto en el diseño espacio que no debería ser un problema. No crea correlación / "interferencia".
En mi informe escribí que un análisis de arranque era innecesario porque no hay correlación para ajustar. Los tres modelos de sitio eran válidos (no era posible "interferencia" dentro de los sitios) y se podía realizar un análisis agrupado para eliminar las muestras comunes en el sitio 1 cuando se realizaba la agrupación. Tal análisis agrupado no podría tener un problema de interferencia. Un ajuste de arranque no sería necesario porque no hay sesgo para ajustar.
CONCLUSIÓN
El cliente estuvo de acuerdo con mi análisis, pero tenía miedo de llevarlo a la FDA. Quieren que haga el ajuste de arranque de todos modos.
MIS PREGUNTAS
A) ¿Está de acuerdo con (1) Mi análisis de los resultados del cliente y (2) mi argumento de que el bootstrap es innecesario.
B) Dado que tengo que arrancar la regresión de Deming, ¿hay algún procedimiento SAS o R que esté disponible para que yo haga la regresión de Deming en las muestras de arranque?
EDITAR: Dada la sugerencia de Bill Huber, planeo mirar los límites en la regresión de errores en variables por regresión tanto en y en x como en x en y. Ya sabemos que para una versión de OLS la respuesta es esencialmente la misma que los errores en variables cuando se supone que las dos variaciones de error son iguales. Si esto es cierto para la otra regresión, entonces creo que eso mostrará que la regresión de Deming da una solución adecuada. ¿Estás de acuerdo?
Para cumplir con la solicitud del cliente, necesito hacer el análisis de arranque solicitado que se definió vagamente. Éticamente creo que sería un error simplemente proporcionar el bootstrap porque realmente no resuelve el problema real del cliente, que es justificar su procedimiento de medición de ensayo. Por lo tanto, les daré ambos análisis y solicitaré al menos que le digan a la FDA que, además de hacer el arranque, hice una regresión inversa y limité las regresiones de Deming, lo que creo que es más apropiado. También creo que el análisis mostrará que su método es equivalente a la referencia y, por lo tanto, la regresión de Deming también es adecuada.
Planeo usar el programa R que @whuber sugirió en su respuesta para permitirme iniciar la regresión de Deming. No estoy muy familiarizado con R, pero creo que puedo hacerlo. Tengo R instalado junto con R Studio. ¿Eso lo hará lo suficientemente fácil para un novato como yo?
También tengo SAS y estoy más cómodo programando en SAS. Entonces, si alguien sabe una manera de hacer esto en SAS, agradecería saberlo.