Blog

O papel da curadoria de dados na confiabilidade da IA em saúde

O papel da curadoria de dados na confiabilidade da IA em saúde

Nos últimos dez anos, o setor de saúde viveu pelo menos três ondas distintas em sua relação com dados. A primeira, por volta de 2015, veio com o rótulo de big data: hospitais, operadoras e empresas de prontuário eletrônico correram para acumular dados, construir data lakes e digitalizar registros. O problema foi que poucos sabiam o que fazer com tudo aquilo. Faltava curadoria clínica, faltava a ponte entre medicina, ciência e negócio.

A segunda onda, por volta de 2018, trouxe business intelligence e os primeiros algoritmos preditivos. Dashboards proliferaram, alguns modelos chegaram à produção, mas a adoção real permaneceu limitada, sem validação científica robusta (interna ou externa) e lenta demais para as necessidades do mundo real, para a urgência da clínica e para a sustentabilidade dos negócios.

Já a terceira onda, iniciada em 2023, é a da inteligência artificial generativa e aplicada, sobretudo as LLMs (sigla em inglês para Large Language Model, ou Grande Modelo de Linguagem). O apetite para usar IA nunca foi tão alto. E, no entanto, em meio a muitas necessidades reais e muito hype, o padrão se repete: a adoção real ainda é limitada. Esse quadro evidencia que o problema não é tecnológico. É o mesmo de sempre e começa antes do algoritmo.

Dado bruto não é ativo clínico de valor

Em saúde, a palavra “dados” pode enganar. Sistemas hospitalares geram volumes imensos de dados todos os dias. Ter acesso a esse volume não equivale a conseguir gerar informação clínica relevante e muito menos a dispor de uma base de dados útil para desenvolver, treinar e validar modelos de IA com utilidade no mundo real.

A distinção fundamental é entre dado bruto e dado estruturado com curadoria clínica (Figura 1). O dado bruto reflete o modo como a informação foi registrada no contexto de cada instituição: variável em nomenclatura, incompleto em campos críticos, dependente do fluxo de trabalho de cada serviço e sem uma definição que passe por validação científica ou por utilização padronizada na prática clínica.

O dado estruturado com curadoria clínica é diferente em natureza: o dataset é oriundo de pesquisa, ou seja, os dados nele utilizados foram bem definidos, testados e validados em estudos e publicações científicas. São, portanto, coletados segundo protocolos padronizados, validados por profissionais com experiência em pesquisa e sólida formação assistencial, e organizados em estruturas que preservam a lógica clínica das variáveis. Essa diferença é técnica e, de certa forma, epistêmica.

A fragmentação dos sistemas de saúde e a ausência de infraestrutura digital padronizada tornam a representatividade dos dados clínicos uma condição raramente garantida. Modelos de IA treinados nesse contexto tendem a aprender os padrões do registro e não, necessariamente, os padrões da história do paciente, da evolução clínica, das características de apresentação da doença ou do percurso de um indivíduo ao longo de uma internação.

A consequência direta é o viés embutido, talvez o risco mais relevante da IA em saúde hoje, mais do que as alucinações amplamente discutidas na mídia.

Figura 1: Do dado bruto ao ativo de IA: os três estágios de maturidade do dado clínico e as perguntas-chave de transição.

Por que esse ativo é difícil de replicar?

Há uma razão estrutural pela qual a adoção real de IA em saúde permanece limitada: dados clínicos de qualidade não são o core business das organizações que mais os produzem.

Um hospital existe para cuidar de pacientes, e seus dados destinam-se a apoiar o registro clínico. Uma empresa de prontuário eletrônico existe para registrar e integrar informações. Uma operadora existe para gerir riscos financeiros e de saúde populacional. Muitas são extraordinárias no que fazem; contudo, frequentemente carecem da engenharia de dados clínicos necessária, pois curadoria de variáveis e validação científica de algoritmos em ambiente real de hospitais e UTIs simplesmente não estão no DNA dessas organizações.

É aí que entra um tipo diferente de organização: aquela que nasceu a partir dos dados clínicos, que tem suas origens na pesquisa clínica e na gestão de qualidade assistencial, e que tem na coleta, na estrutura, na validação e na análise sua missão central. Quando uma empresa acumula quase duas décadas de dados de milhões de internações em centenas de instituições e constrói, sobre esses dados, modelos de risco, benchmarks de qualidade e ferramentas de utilidade clínica, ela oferece uma verdadeira infraestrutura de inteligência.

Cabe ressaltar ainda que alta performance algorítmica não garante benefício clínico demonstrado. A maioria das ferramentas de IA em saúde é testada em dados históricos, não em ambientes hospitalares reais, e frequentemente desconsidera como essas ferramentas se encaixam no fluxo de trabalho efetivo do médico.

Curadoria de dados como processo contínuo

Um aspecto frequentemente negligenciado é o caráter dinâmico da curadoria. Dados clínicos envelhecem. Padrões de doença mudam, como a pandemia de COVID-19 demonstrou de forma dramática. Práticas assistenciais evoluem. Uma base de dados confiável para IA em saúde não é um repositório estático. Exige visão clínica e científica, e atenção às mudanças e às novas pesquisas publicadas para avaliar, selecionar e incorporar novos dados continuamente.

Trata-se de um processo com impacto direto nos modelos preditivos e no uso da IA, um trabalho contínuo de atualização, revalidação e monitoramento de deriva (model drift). A curadoria clínica não termina quando o dado entra na base; ela acompanha o ciclo de vida completo do modelo (Figura 2).

Essa perspectiva tem uma implicação prática direta para gestores e tomadores de decisão: ao avaliar soluções de IA em saúde, as perguntas mais importantes não são apenas “qual é a acurácia do modelo?”, mas também “como essa base foi construída, por quem e como ela é mantida?”

Figura 2: O ciclo de vida do dado clínico em IA: curadoria como processo contínuo, da coleta padronizada ao monitoramento de deriva e revalidação.

A confiança começa antes do algoritmo

A base do Epimed Monitor foi construída com essa lógica desde 2008. São mais de 9 milhões de internações indexadas, provenientes de mais de 900 hospitais em 14 países, coletadas com protocolos padronizados e curadoria técnico-científica contínua. É, por exemplo, a maior base de pacientes críticos do mundo, estruturada especificamente para gerar conhecimento clínico, não apenas para registrar.

Foi sobre essa fundação que, em 2022, desenvolvemos e implementamos em larga escala o Epimed Prediction Model, o primeiro escore prognóstico com aprendizado de máquina validado e operacional em milhares de UTIs brasileiras.

A probabilidade de que a disrupção da IA melhore a saúde para todos depende, de forma decisiva, da existência de um ecossistema capaz de gerar conhecimento rápido, robusto e generalizável sobre os efeitos dessas ferramentas; e esse ecossistema começa, necessariamente, por dados de qualidade, em grande volume e com curadoria adequada.

A próxima grande alavanca de eficiência hospitalar não virá de quem tem mais dados. Virá de quem sabe fazer mais com os dados que já existem e que construiu, ao longo de anos, as condições para que a IA funcione de verdade na prática clínica. Essa base sólida permite gerar análises, modelos e algoritmos cientificamente robustos, baseados em dados consistentes, que se traduzem em ganhos concretos de eficiência clínica, segurança e desfechos dos pacientes.

___________________________________________________________________________________________________

Esta é a segunda publicação da série editorial “IA na Saúde: Credibilidade, Segurança e Impacto na Prática Clínica”, produzida pela Epimed Solutions.

Autor: Dr. Jorge Salluh, médico-cientista e professor de Terapia Intensiva no IDOR, cofundador e diretor científico da Epimed Solutions, editor-chefe da revista Critical Care Science (2023–2027); entre os 2% de cientistas mais influentes do mundo (Stanford–Elsevier, 2020–2025).