El papel de la depuración de datos en la confiabilidad de la IA en salud

En los últimos diez años, el sector de la salud ha vivido al menos tres olas distintas en su relación con los datos. La primera, hacia 2015, llegó bajo la etiqueta de big data: hospitales, aseguradoras y empresas de expedientes clínicos electrónicos se apresuraron a acumular datos, construir data lakes y digitalizar registros. El problema fue que pocos sabían qué hacer con todo eso; faltaba depuración de datos clínicos, faltaba el puente entre la medicina, la ciencia y el negocio.
La segunda ola, alrededor de 2018, trajo consigo el business intelligence y los primeros algoritmos predictivos. Los dashboards proliferaron y algunos modelos llegaron a producción, pero la adopción real se mantuvo limitada, sin una validación científica robusta (interna o externa) y con una lentitud excesiva para las necesidades del mundo real, la urgencia de la clínica y la sostenibilidad de los negocios.
Por su parte, la tercera ola, iniciada en 2023, es la de la inteligencia artificial generativa y aplicada, sobre todo las LLM (por sus siglas en inglés para Large Language Model, o Gran Modelo de Lenguaje). El apetito por utilizar la IA nunca ha sido tan alto. Y, sin embargo, en medio de muchas necesidades reales y de un gran hype, el patrón se repite: la adopción real sigue siendo limitada. Este panorama evidencia que el problema no es tecnológico. Es el mismo de siempre, y comienza antes del algoritmo.
El dato bruto no es un activo clínico de valor
En la salud, la palabra «datos» puede resultar engañosa. Los sistemas hospitalarios generan volúmenes inmensos de datos todos los días. Tener acceso a ese volumen no equivale a lograr generar información clínica relevante, y mucho menos a disponer de una base de datos útil para desarrollar, entrenar y validar modelos de IA que tengan utilidad en el mundo real.
La distinción fundamental radica entre el dato bruto y el dato estructurado depurado críticamente (Figura 1). El dato bruto refleja la manera en que la información fue registrada en el contexto de cada institución: con variables en su nomenclatura, incompleto en campos críticos, dependiente del flujo de trabajo de cada servicio, sin una definición que pase por una validación científica o por una utilización estandarizada en la práctica clínica.
El dato estructurado y depurado con criterio clínico es diferente por naturaleza: el dataset (conjunto de datos) proviene de la investigación; es decir, los datos utilizados en él fueron bien definidos, probados y validados en estudios y publicaciones científicas. Por lo tanto, se recolectan bajo protocolos estandarizados, son validados por profesionales con experiencia en investigación y una sólida formación asistencial, y se organizan en estructuras que preservan la lógica clínica de las variables. Esta diferencia es técnica y, en cierto modo, epistémica.
La fragmentación de los sistemas de salud y la ausencia de una infraestructura digital estandarizada hacen que la representatividad de los datos clínicos sea una condición que rara vez se garantiza. Los modelos de IA entrenados en este contexto tienden a aprender los patrones del registro y no, necesariamente, los patrones de la historia del paciente, de la evolución clínica, de las características de presentación de la enfermedad o de la trayectoria de un individuo a lo largo de una hospitalización.
La consecuencia directa es el sesgo implícito, que es quizás el riesgo más relevante de la IA en la salud hoy en día, incluso más que las alucinaciones ampliamente discutidas en los medios.
Figura 1: Del dato bruto al activo de IA: las tres etapas de madurez del dato clínico y las preguntas clave de transición.

¿Por qué este activo es difícil de replicar?
Existe una razón estructural por la cual la adopción real de la IA en la salud sigue siendo limitada: los datos clínicos de calidad no son el core business de las organizaciones que más los producen.
Un hospital existe para cuidar a los pacientes, y sus datos están destinados a respaldar el registro clínico. Una empresa de expedientes clínicos electrónicos existe para registrar e integrar información. Una aseguradora existe para gestionar riesgos financieros y de salud poblacional. Muchas son extraordinarias en lo que hacen; sin embargo, con frecuencia carecen de la ingeniería de datos clínicos necesaria, ya que la elección de variables y la validación científica de algoritmos en entornos reales de hospitales y unidades de cuidados intensivos (UCI) simplemente no están en el ADN de estas organizaciones.
Ahí es donde entra un tipo diferente de organización: aquella que nació a partir de los datos clínicos, que tiene sus orígenes en la investigación clínica y en la gestión de la calidad asistencial, y que tiene en la recolección, estructura, validación y análisis su misión central. Cuando una empresa acumula casi dos décadas de datos de millones de hospitalizaciones en cientos de instituciones y construye, sobre esos datos, modelos de riesgo, benchmarks de calidad y herramientas de utilidad clínica, ofrece una verdadera infraestructura de inteligencia.
Cabe destacar también que un alto rendimiento algorítmico no garantiza un beneficio clínico demostrado: la mayoría de las herramientas de IA en salud se prueban con datos históricos, no en entornos hospitalarios reales, y con frecuencia desestiman cómo estas herramientas se acoplan al flujo de trabajo efectivo del médico.
La depuración de datos como un proceso continuo
Un aspecto que suele pasarse por alto es el carácter dinámico de la depuración de datos. Los datos clínicos envejecen. Los patrones de las enfermedades cambian, tal como la pandemia de COVID-19 lo demostró de forma dramática. Las prácticas médicas evolucionan. Una base de datos confiable para la IA en la salud no es un repositorio estático: exige una visión clínica y científica, así como atención a los cambios y a las nuevas publicaciones para evaluar, seleccionar e incorporar nuevos datos de manera continua.
Se trata de un proceso con un impacto directo en los modelos predictivos y en el uso de la IA. Un trabajo continuo de actualización, revalidación y monitoreo del desvío del modelo (model drift). Esta depuración no termina cuando el dato ingresa a la base; acompaña el ciclo de vida completo del modelo (Figura 2).
Esta perspectiva tiene una implicación práctica directa para los directivos y tomadores de decisiones: al evaluar soluciones de IA en salud, las preguntas más importantes no son solo «¿cuál es la precisión del modelo?», sino también «¿cómo se construyó esa base, quién la hizo y cómo se mantiene?».
Figura 2: El ciclo de vida del dato clínico en IA: la depuración de datos como proceso continuo, desde la recolección estandarizada hasta el monitoreo del desvío y la revalidación.

La confianza comienza antes del algoritmo
La base de Epimed Monitor se ha construido bajo esta lógica desde 2008. Cuenta con más de 9 millones de hospitalizaciones indexadas, provenientes de más de 900 hospitales en 14 países, recolectadas con protocolos estandarizados y una depuración de datos técnico-científica continua. Es, por ejemplo, la base de datos de pacientes críticos más grande del mundo, estructurada específicamente para generar conocimiento clínico y no solo para registrar.
Fue sobre este fundamento que, en 2022, desarrollamos e implementamos a gran escala el Epimed Prediction Model, la primera puntuación pronóstica con aprendizaje automático validada y operativa en miles de UCI brasileñas.
La probabilidad de que la disrupción de la IA mejore la salud para todos depende, de forma decisiva, de la existencia de un ecosistema capaz de generar conocimiento rápido, robusto y generalizable sobre los efectos de estas herramientas; y ese ecosistema comienza, necesariamente, con datos de calidad, en gran volumen y con una depuración adecuada.
La próxima gran palanca de eficiencia hospitalaria no vendrá de quien tenga más datos. Vendrá de quien sepa hacer más con los datos que ya existen y que haya construido, a lo largo de los años, las condiciones para que la IA funcione de verdad en la práctica clínica. Esta base sólida permite generar análisis, modelos y algoritmos científicamente robustos, basados en datos consistentes, que se traducen en ganancias concretas de eficiencia clínica, seguridad y desenlaces de los pacientes.
___________________________________________________________________________________________________
Esta es la segunda publicación de la serie editorial «IA en la Salud: Credibilidad, Seguridad e Impacto en la Práctica Clínica», producida por Epimed Solutions.
Autor: Dr. Jorge Salluh, médico científico y profesor de Terapia Intensiva en el IDOR, cofundador y director científico de Epimed Solutions, editor en jefe de la revista Critical Care Science (2023–2027); se encuentra entre el 2% de los científicos más influyentes del mundo (Stanford–Elsevier, 2020–2025).