O papel da curadoria de dados na confiabilidade da IA em saúde

Blog IA na saúde

O papel da curadoria de dados na confiabilidade da IA em saúde

Resumo:

No atual cenário de expansão da Inteligência Artificial na saúde, o maior desafio para sua consolidação não é tecnológico, mas sim a qualidade da matéria-prima que a alimenta. Volume de dados não se traduz, necessariamente, em valor clínico.

O segundo artigo da série editorial “IA na Saúde: Credibilidade, Segurança e Impacto na Prática Clínica” demonstra que o verdadeiro pilar de sustentação e confiabilidade de uma IA médica está na curadoria de dados. Entenda como a transformação de dados brutos em ativos estruturados e validados cientificamente é o único caminho capaz de mitigar vieses, prever a deterioração de modelos e garantir segurança e eficiência reais na tomada de decisão à beira do leito.

Principais tópicos abordados:

As três ondas dos dados na saúde
Dado bruto vs. dado estruturado com curadoria clínica
O desafio estrutural da curadoria
A curadoria como um processo dinâmico e contínuo
O caso prático do Epimed Prediction Model
A próxima alavanca de eficiência hospitalar

Conteúdo:

Nos últimos dez anos, o setor de saúde viveu pelo menos três ondas distintas em sua relação com dados. A primeira, por volta de 2015, veio com o rótulo de big data: hospitais, operadoras e empresas de prontuário eletrônico correram para acumular dados, construir data lakes e digitalizar registros. O problema foi que poucos sabiam o que fazer com tudo aquilo. Faltava curadoria clínica, faltava a ponte entre medicina, ciência e negócio.

A segunda onda, por volta de 2018, trouxe business intelligence e os primeiros algoritmos preditivos. Dashboards proliferaram, alguns modelos chegaram à produção, mas a adoção real permaneceu limitada, sem validação científica robusta (interna ou externa) e lenta demais para as necessidades do mundo real, para a urgência da clínica e para a sustentabilidade dos negócios.

Já a terceira onda, iniciada em 2023, é a da inteligência artificial generativa e aplicada, sobretudo as LLMs (sigla em inglês para Large Language Model, ou Grande Modelo de Linguagem). O apetite para usar IA nunca foi tão alto. E, no entanto, em meio a muitas necessidades reais e muito hype, o padrão se repete: a adoção real ainda é limitada. Esse quadro evidencia que o problema não é tecnológico. É o mesmo de sempre e começa antes do algoritmo.

Dado bruto não é ativo clínico de valor

Em saúde, a palavra “dados” pode enganar. Sistemas hospitalares geram volumes imensos de dados todos os dias. Ter acesso a esse volume não equivale a conseguir gerar informação clínica relevante e muito menos a dispor de uma base de dados útil para desenvolver, treinar e validar modelos de IA com utilidade no mundo real.

A distinção fundamental é entre dado bruto e dado estruturado com curadoria clínica (Figura 1). O dado bruto reflete o modo como a informação foi registrada no contexto de cada instituição: variável em nomenclatura, incompleto em campos críticos, dependente do fluxo de trabalho de cada serviço e sem uma definição que passe por validação científica ou por utilização padronizada na prática clínica.

O dado estruturado com curadoria clínica é diferente em natureza: o dataset é oriundo de pesquisa, ou seja, os dados nele utilizados foram bem definidos, testados e validados em estudos e publicações científicas. São, portanto, coletados segundo protocolos padronizados, validados por profissionais com experiência em pesquisa e sólida formação assistencial, e organizados em estruturas que preservam a lógica clínica das variáveis. Essa diferença é técnica e, de certa forma, epistêmica.

A fragmentação dos sistemas de saúde e a ausência de infraestrutura digital padronizada tornam a representatividade dos dados clínicos uma condição raramente garantida. Modelos de IA treinados nesse contexto tendem a aprender os padrões do registro e não, necessariamente, os padrões da história do paciente, da evolução clínica, das características de apresentação da doença ou do percurso de um indivíduo ao longo de uma internação.

A consequência direta é o viés embutido, talvez o risco mais relevante da IA em saúde hoje, mais do que as alucinações amplamente discutidas na mídia.

Figura 1: Do dado bruto ao ativo de IA: os três estágios de maturidade do dado clínico e as perguntas-chave de transição.

Por que esse ativo é difícil de replicar?

Há uma razão estrutural pela qual a adoção real de IA em saúde permanece limitada: dados clínicos de qualidade não são o core business das organizações que mais os produzem.

Um hospital existe para cuidar de pacientes, e seus dados destinam-se a apoiar o registro clínico. Uma empresa de prontuário eletrônico existe para registrar e integrar informações. Uma operadora existe para gerir riscos financeiros e de saúde populacional. Muitas são extraordinárias no que fazem; contudo, frequentemente carecem da engenharia de dados clínicos necessária, pois curadoria de variáveis e validação científica de algoritmos em ambiente real de hospitais e UTIs simplesmente não estão no DNA dessas organizações.

É aí que entra um tipo diferente de organização: aquela que nasceu a partir dos dados clínicos, que tem suas origens na pesquisa clínica e na gestão de qualidade assistencial, e que tem na coleta, na estrutura, na validação e na análise sua missão central. Quando uma empresa acumula quase duas décadas de dados de milhões de internações em centenas de instituições e constrói, sobre esses dados, modelos de risco, benchmarks de qualidade e ferramentas de utilidade clínica, ela oferece uma verdadeira infraestrutura de inteligência.

Cabe ressaltar ainda que alta performance algorítmica não garante benefício clínico demonstrado. A maioria das ferramentas de IA em saúde é testada em dados históricos, não em ambientes hospitalares reais, e frequentemente desconsidera como essas ferramentas se encaixam no fluxo de trabalho efetivo do médico.

Curadoria de dados como processo contínuo

Um aspecto frequentemente negligenciado é o caráter dinâmico da curadoria. Dados clínicos envelhecem. Padrões de doença mudam, como a pandemia de COVID-19 demonstrou de forma dramática. Práticas assistenciais evoluem. Uma base de dados confiável para IA em saúde não é um repositório estático. Exige visão clínica e científica, e atenção às mudanças e às novas pesquisas publicadas para avaliar, selecionar e incorporar novos dados continuamente.

Trata-se de um processo com impacto direto nos modelos preditivos e no uso da IA, um trabalho contínuo de atualização, revalidação e monitoramento de deriva (model drift). A curadoria clínica não termina quando o dado entra na base; ela acompanha o ciclo de vida completo do modelo (Figura 2).

Essa perspectiva tem uma implicação prática direta para gestores e tomadores de decisão: ao avaliar soluções de IA em saúde, as perguntas mais importantes não são apenas “qual é a acurácia do modelo?”, mas também “como essa base foi construída, por quem e como ela é mantida?”

Figura 2: O ciclo de vida do dado clínico em IA: curadoria como processo contínuo, da coleta padronizada ao monitoramento de deriva e revalidação.

A confiança começa antes do algoritmo

A base do Epimed Monitor foi construída com essa lógica desde 2008. São mais de 9 milhões de internações indexadas, provenientes de mais de 900 hospitais em 14 países, coletadas com protocolos padronizados e curadoria técnico-científica contínua. É, por exemplo, a maior base de pacientes críticos do mundo, estruturada especificamente para gerar conhecimento clínico, não apenas para registrar.

Foi sobre essa fundação que, em 2022, desenvolvemos e implementamos em larga escala o Epimed Prediction Model, o primeiro escore prognóstico com aprendizado de máquina validado e operacional em milhares de UTIs brasileiras.

A probabilidade de que a disrupção da IA melhore a saúde para todos depende, de forma decisiva, da existência de um ecossistema capaz de gerar conhecimento rápido, robusto e generalizável sobre os efeitos dessas ferramentas; e esse ecossistema começa, necessariamente, por dados de qualidade, em grande volume e com curadoria adequada.

A próxima grande alavanca de eficiência hospitalar não virá de quem tem mais dados. Virá de quem sabe fazer mais com os dados que já existem e que construiu, ao longo de anos, as condições para que a IA funcione de verdade na prática clínica. Essa base sólida permite gerar análises, modelos e algoritmos cientificamente robustos, baseados em dados consistentes, que se traduzem em ganhos concretos de eficiência clínica, segurança e desfechos dos pacientes.

___________________________________________________________________________________________________

Esta é a segunda publicação da série editorial “IA na Saúde: Credibilidade, Segurança e Impacto na Prática Clínica”, produzida pela Epimed Solutions.

Autor: Dr. Jorge Salluh, médico-cientista e professor de Terapia Intensiva no IDOR, cofundador e diretor científico da Epimed Solutions, editor-chefe da revista Critical Care Science (2023–2027); entre os 2% de cientistas mais influentes do mundo (Stanford–Elsevier, 2020–2025).

Hospital:	Cidade:	Estado:	Tipo:
Hospital das Clínicas Luzia de Pinho Melo	Mogi das Cruzes	SP	Público
Hospital São Lucas	Ribeirão Preto	SP	Privado
Hospital Unimed Ribeirão Preto	Ribeirão Preto	SP	Privado
Hospital e Maternidade São Luiz – Unidade Itaim	São Paulo	SP	Privado
Hospital Santa Paula	São Paulo	SP	Privado
Hospital Villa-Lobos	São Paulo	SP	Privado
Hospital e Maternidade Galileo	Valinhos	SP	Privado

Hospital:	Cidade:	Estado:	Tipo:
Complexo Hospitalar de Niterói	Niterói	RJ	Privado
Hospital Barra D’Or II	Rio de Janeiro	RJ	Privado
Hospital Glória D’Or	Rio de Janeiro	RJ	Privado
Hospital São Lucas Copacabana	Rio de Janeiro	RJ	Privado
Hospital Unimed	Rio de Janeiro	RJ	Privado
Hospital do Câncer e do Coração – HCCOR	São Gonçalo	RJ	Público

Hospital:	Cidade:	Estado:	Tipo:
Hospital Esperança Olinda – Prontolinda	Olinda	PE	Privado
Hospital Santa Joana	Recife	PE	Privado
Real Hospital Português de Beneficência	Recife	PE	Privado

Hospital:	Cidade:	Estado:	Tipo:
Hospital Regional da Costa Leste Magid Thomé	Três Lagoas	MS	Público

Hospital:	Cidade:	Estado:	Tipo:
Hospital Felício Rocho	Belo Horizonte	MG	Privado

Blog

O papel da curadoria de dados na confiabilidade da IA em saúde

Resumo:

Principais tópicos abordados:

Conteúdo:

Dado bruto não é ativo clínico de valor

Por que esse ativo é difícil de replicar?

Curadoria de dados como processo contínuo

A confiança começa antes do algoritmo

Baixe nosso aplicativo

Contato

Hospital:	Cidade:	Estado:	Tipo:
Hospital Municipal Ruth Cardoso	Balneário Camboriú	SC	Público
Hospital Baía Sul	Florianópolis	SC	Privado
Hospital SOS Cardio	Florianópolis	SC	Privado

Hospital:	Cidade:	Estado:	Tipo:
Hospital do Círculo	Caxias do Sul	RS	Privado
Hospital Regina	Novo Hamburgo	RS	Privado
Hospital de Clínicas de Passo Fundo	Passo Fundo	RS	Privado
Hospital de Clínicas de Porto Alegre – HCPA	Porto Alegre	RS	Público
Hospital Mãe de Deus	Porto Alegre	RS	Privado

Hospital:	Cidade:	Estado:	Tipo:
Hospital Rondon	Marechal Cândido Rondon	PR	Privado
Hospital Municipal do Idoso Zilda Arns – FEAES	Curitiba	PR	Público
Hospital Nossa Senhora das Graças	Curitiba	PR	Privado
Hospital Universitário Cajuru	Curitiba	PR	Público
Hospital Municipal Padre Germano Lauck	Foz do Iguaçu	PR	Público
Hospital Araucária de Londrina	Londrina	PR	Privado

Hospital:	Cidade:	Estado:	Tipo:
Hospital Municipal de Aparecida De Goiânia – HMAP	Aparecida de Goiânia	GO	Público
Hospital São Francisco de Assis	Goiânia	GO	Privado
Hospital Estadual da Mulher Dr. Jurandir do Nascimento – HEMU	Goiânia	GO	Público
Hospital Samaritano de Goiânia	Goiânia	GO	Privado
Hospital Santa Helena	Goiânia	GO	Privado
Hospital de Caridade São Pedro D’Alcântara	Goiás	GO	Público
Hospital do Câncer de Rio Verde – HCRV	Rio Verde	GO	Público
Hospital Estadual de Santa Helena de Goiás Dr. Albanir Faleiros Machado – HERSO	Santa Helena de Goiás	GO	Público

Blog

O papel da curadoria de dados na confiabilidade da IA em saúde

Resumo:

Principais tópicos abordados:

Conteúdo:

Dado bruto não é ativo clínico de valor

Por que esse ativo é difícil de replicar?

Curadoria de dados como processo contínuo

A confiança começa antes do algoritmo

Posts relacionados

O que muda na prática do profissional de saúde com IA de verdade

IA na saúde e o protagonismo do profissional: por que o cuidado humano se torna ainda mais valioso

Epimed Monitor: a plataforma de inteligência clínica que viabiliza IA na saúde