¿Cuáles son los criterios mínimos de correspondencia recomendados para una correspondencia demográfica confiable de pacientes?


30

Al hacer coincidir pacientes con base en datos demográficos, ¿hay alguna recomendación sobre qué campos deben coincidir para que el paciente sea el "mismo paciente"?

Sé que los algoritmos serán diferentes para diferentes implementaciones, solo tengo curiosidad por saber si hay mejores prácticas o recomendaciones en torno a este proceso.

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

etc?


44
Probablemente, la respuesta a esta pregunta también puede cambiar dependiendo del país específico o incluso de consideraciones étnicas y culturales. Por ejemplo, el nombre de una persona puede no ser un buen identificador de paciente para los aborígenes australianos (o se le debe dar un "peso" menor en su caso) ya que pueden cambiar el nombre con el tiempo. Los aborígenes australianos que llevan el mismo nombre que un difunto lo abandonan porque consideran que es muy malo llevar el mismo nombre de alguien que está muerto. Algo similar sucede en otras culturas donde el nombre de los muertos es tabú. enlace

44
O otro ejemplo de un estudio aún no publicado: en los inmigrantes filipinos a los Estados Unidos, los diez apellidos más comunes representan aproximadamente el 6% de todas las personas. En los inmigrantes vietnamitas, representan ~ 60%. Los nombres son un identificador significativamente mejor en los filipinos que en los vietnamitas. Definitivamente publicaré ese estudio una vez que esté disponible.

Solo para aclarar: ¿es el objetivo principal hacer coincidir dos conjuntos de registros?

Cuando intente hacer coincidir los registros, asegúrese de distinguir entre la fuerza de una coincidencia ("Bob" es muy similar a "Bob") y el número de coincidencias posibles (hay muchos Bobs). Si dos registros tienen el mismo nombre y no hay otros registros con ese nombre , probablemente sea la misma persona, incluso si las direcciones difieren. Asumiendo que tienes un corpus grande, por supuesto.
Jon of All Trades

Respuestas:


20

Existe este gran ensayo (en español, lo siento) escrito por Pablo Pazos, un ingeniero de CS de Uruguay que ha estado trabajando en TI para el cuidado de la salud desde 2006 y ha hecho grandes contribuciones al campo, en el que describe un algoritmo para hacerlo.

Puede publicar el artículo a través de un traductor, pero lo esencial es que la información básica para determinar la identidad de una persona son sus nombres y apellidos (tanto del padre como de la madre), el sexo y la fecha de nacimiento. Curiosamente, excluye específicamente los números de identificación como el SSN de sus algoritmos de coincidencia de identidad, ya que "cualquier tipo de identificador NO es parte de su identidad" (aunque supongo que este punto podría ser discutible). Además, excluye atributos como la dirección, los números de teléfono, etc., ya que no están realmente relacionados con la identidad de alguien, no están asociados con "quién es realmente alguien".

Además, asigna diferentes "pesos" a cada uno de los atributos anteriores, como este:

  • Nombre: 17.5%
  • Segundo nombre: 17.5%
  • Apellido (padre): 17.5%
  • Apellido (madre): 17.5%
  • Sexo: 10%
  • Fecha de nacimiento: 20%

Con las coincidencias encontradas en cada uno de estos atributos, describe una metodología para obtener un "índice de concordancia de concordancia" compuesto con el cual las comparaciones entre registros pueden ser posibles. Además, las coincidencias "parciales" en los atributos de nombre son posibles mediante el uso de algoritmos como la distancia de Levenshtein .

Buena lectura, OMI. Lo siento, está en español, pero espero haber podido transmitir sus ideas principales.


2
Esto es genial, gracias. +1 también por mencionar la distancia como errores tipográficos son bastante comunes, especialmente en comunidades con una gran diversidad de antecedentes culturales, como suele ser el caso en América del Norte. Dicho esto, la mayoría de los casos en los que tengo que realizar coincide con el dominio de posibles valores es bastante restringido. Entonces, en estos casos, cualquier criterio confiable (como los números de seguro de salud) que devuelva un solo hit en la base de datos será suficiente, si se devuelven varias entradas, tiendo a preguntar al usuario (si está disponible) o filtrar con un criterio adicional.

(... cont.) Sin embargo, tenga en cuenta que estos casos se aplican bien a la instalación local de un EMR en una clínica u hospital, o un RIS a un departamento de radio9logía. En estos casos, el cliente está registrado en la clínica u hospital o no lo está. Sin embargo, en casos de MPI, este es un juego de pelota completamente nuevo.

13

No existe un algoritmo mágico único para la correspondencia de pacientes, y dudo que alguna vez lo haya.

Para empezar, hay variaciones regionales. Como señaló MMattoli, lo que funciona bien en un hospital urbano de los Estados Unidos probablemente no encajará bien en una clínica rural australiana que trata a los aborígenes.

Además, los sitios individuales tienen diferentes puntos de vista sobre la tolerancia a fallas. Si solo igualaras cuando estuvieras absolutamente seguro , obtendrías muchos partidos perdidos. Esto provoca registros de pacientes duplicados, lo que crea un conjunto de problemas completamente diferente. La mayoría de los sitios estarán dispuestos a conformarse con bastante seguridad , pero ¿qué tan seguro es lo suficientemente seguro? Pregunta a 10 personas y obtendrás 12 respuestas.

Por lo tanto, el "mejor" algoritmo será configurable, para que sus clientes puedan ajustarlo a sus necesidades.

Al considerar un partido, los diferentes campos ofrecen diversos grados de confianza.

Los identificadores específicos de la atención médica ofrecen la mayor confianza, ya que su único propósito es identificar de manera única a la persona dentro del sistema de salud. Los hospitales generalmente se esfuerzan para asegurarse de que no se dupliquen.

Ejemplos:

  • Identificación nacional de salud (por ejemplo, número del NHS del Reino Unido)
  • Número de registro médico asignado por el hospital.

Otros identificadores de pacientes también pueden ofrecer una gran confianza, dependiendo del sistema. Por ejemplo, una identificación militar es probablemente muy relevante en un hospital militar.

Ejemplos:

  • ID militar
  • ID de seguro
  • Número de seguro social (en los EE. UU., El número de seguro social generalmente no se considera una coincidencia de alta confianza, debido al fraude de seguros desenfrenado).

En ausencia de identificadores únicos, uno debe recurrir a la información demográfica. Es poco aconsejable para que coincida en cualquier uno de campo, pero el partido campo más demográfica, más confianza el partido.

Las cosas sobre una persona que a menudo no cambian son buenas para emparejar:

  • Nombre
  • Género
  • Fecha de nacimiento

Pero se puede considerar aún más información maleable en el partido para aumentar la confianza:

  • Dirección
  • Número de teléfono
  • Dirección de correo electrónico

3
El SSN también tiene algunas restricciones muy estrictas, por ejemplo, en Canadá es ilegal incluso pedirlo a menos que sea un empleador o un banco (quizás un poco más, no soy un abogado). Otros lugares como China lo usan para casi cualquier cosa, incluso para comprar boletos de tren durante las vacaciones de alto tráfico.

Los cambios de nombre son comunes si eres mujer. Y a menudo dos personas tienen el mismo nombre e incluso viven en el mismo lugar (por ejemplo, un padre con un hijo que lleva su nombre).
HLGEM

@HLGEM: Completamente correcto, por lo que no se debe usar un solo campo demográfico para la coincidencia. Pero cuando la gente tiene que recurrir a eso, los campos más estáticos (que a veces cambian) son más confiables que la alternativa. Sin embargo, eso no los hace buenos.
Lynn

7

También vale la pena consultar los apellidos anteriores, ya que estos a menudo cambian.


+1 "a menudo" es un eufemismo. :) Este ciertamente puede ser el caso para pacientes que no son identificables o sin nombre, recién nacidos, identificados erróneamente, etc. Los nombres son más difíciles, pero más significativos, en un entorno con muchas transacciones.

4

Además de las combinaciones obvias de los siguientes tres que figuran en su pregunta

First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code

Pensaría en agregar phone number (Home and/or Cell)a la lista. En estos días es bastante común y cada uno tendrá un número único e incluso si algunas veces las personas cambian sus números de teléfono, la mayoría de la gente recuerda los números de teléfono más antiguos, por lo que puede ser útil.

Descubrimos que la dirección a menudo sufre de múltiples deletreos y múltiples formas de representación, especialmente en países como India, donde las personas usan un idioma local y los softwares de gestión de pacientes 'aún' usan el inglés.


3

El género en los registros parece derivarse a menudo del Nombre. He visto una mayor variación en el género para los extranjeros, cuando no podemos derivar el género del nombre.

En Alemania tenemos algunas variaciones adicionales con nombres que contienen 'Umlaute' como 'äöü', que a veces se reemplazan por 'ae oe ue'.


1

Mi pensamiento está en el orden de abajo 1). SSN, apellido y primeros 5 caracteres del primer nombre 2). SSN, fecha de nacimiento y los primeros 5 caracteres del primer nombre 3). SSN, fecha de nacimiento y apellido 4). SSN, Sexo, Fecha de nacimiento 5). Apellido, primeros 5 caracteres de nombre, ciudad y código postal


1

Este es un problema realmente difícil en los Estados Unidos. Los nombres no son únicos y a menudo cambian durante la vida de una persona o se presentan de manera diferente (Rob versus Robert, por ejemplo), por lo que nunca se pueden usar para identificar al paciente, excepto en combinación con alguna información más confiable. El número de seguro médico y el proveedor cambian con mucha más frecuencia y pueden ser los mismos para varios miembros de la familia. El SSN es supuestamente único, pero hay fraude a su alrededor. Lo mismo con el número de licencia del conductor que, por supuesto, no todos tendrán.

Personalmente, comenzaría con la combinación de número de póliza de seguro y fecha de nacimiento y nombre, luego SSN y combinación de fecha de nacimiento y nombre. Verificaría la dirección y el teléfono para darme seguridad adicional cuando coinciden, pero no mucho peso si no lo hacen. Además, usaría el tipo de sangre como un factor de descarte si se conoce (y todos sabemos que los vampiros del hospital tomarán muestras de sangre) ya que eso no cambia. La coincidencia de nombres tendría que ser difusa debido al problema de variación de nombre. Otras cosas generalmente deberían buscar una coincidencia exacta primero, una coincidencia difusa si la confianza del nombre es realmente alta (podría haber sido un error tipográfico ingresando al SSN).

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.