Aprimore sua estratégia de dados para avançar com a IA

Para ter sucesso com a Inteligência Artificial (IA), é crucial aprimorar sua estratégia de dados. Uma boa estratégia de dados é mais do que uma tendência passageira; ela é a base para aproveitar ao máximo a IA e as tecnologias de automação. Ela define como a qualidade, a governança e a acessibilidade dos dados apoiam seus objetivos de negócios. Dados de qualidade podem ser uma mina de ouro, influenciando diretamente a eficiência da sua organização.

No primeiro episódio da nova série de podcast Leaders of Code, Don Woodlock, Head of Global Healthcare Solutions da InterSystems, e Prashanth Chandrasekhar, CEO do Stack Overflow, discutiram o papel crítico da estratégia de dados no desenvolvimento da IA com o apresentador Ben Popper. Eles abordaram desde a importância de dados bem estruturados até a necessidade de governança e a constante supervisão humana nos sistemas de IA.

A importância de uma Estratégia de dados para IA bem definida

Segundo Woodlock, negligenciar a estratégia de dados é como pegar um violão desafinado em uma festa: nem mesmo Jimmy Hendrix conseguiria impressionar os convidados. “O primeiro passo é afinar o instrumento, para então tocar uma ótima música. É assim que vejo os dados”, explica Woodlock.

Antes de implementar a IA, Woodlock enfatiza a importância de uma estratégia de dados bem definida. Ele recomenda consolidar as bases antes de avançar para a implementação técnica, como construir um sistema RAG (retrieval-augmented generation) ou escolher uma plataforma de IA. O plano deve incluir uma visão de cinco a dez anos sobre como os dados e os sistemas podem ser integrados.

Woodlock destaca que muitos dados de saúde são desestruturados e podem se tornar confusos. Em prontuários médicos, dados de pacientes de diversas fontes podem ter diferentes identificadores ou variações de nomes, como “Don” e “Donald”, ou endereços antigos e novos. Sem um algoritmo de correspondência de pacientes, os dados não são integrados corretamente. A normalização dos dados melhora a precisão dos modelos de IA e a análise para melhores resultados nos tratamentos.

Para projetos complexos de integração de dados e IA, é útil ser realista sobre o ponto de partida. Mathew Zeilier, da Clarifai, já observou que muitas empresas superestimam a qualidade de seus dados. Ao analisá-los, descobrem que “não há tantos dados assim ou nem sequer sabem onde eles estão internamente”.

Woodlock e Chandrasekhar enfatizam que a qualidade dos dados é tão importante quanto o modelo de IA para produzir resultados de alta qualidade. Uma base de conhecimento limpa e centralizada apoia melhorias no treinamento do modelo de IA, resultando em melhores resultados para iniciativas de IA internas e voltadas para o cliente. Organizar e codificar o conhecimento da sua equipe cria um ciclo virtuoso para futuros treinamentos de modelo ou métodos de RAG e indexação.

É vital ter uma supervisão humana para revisar qualquer resultado do sistema de IA, especialmente em setores regulamentados como o de saúde, onde a coleta de dados está sujeita a diretrizes legais de privacidade e segurança.

O papel da GenAI na experiência do usuário

A InterSystems incorporou a GenAI em seu software para melhorar a experiência do usuário para os médicos, visando resolver a frustração histórica com softwares complexos e não confiáveis. O objetivo é tornar a tecnologia mais humana. A nAI (narrow AI) pode fazer uma série de perguntas sobre o paciente e revisar o conhecimento médico disponível, além de escrever automaticamente documentos como resumos de alta ou cirúrgicos.

Outros fornecedores de tecnologia para a saúde também observaram ganhos de eficiência semelhantes com a IA. Amit Garg, da HiLabs, propõe que a GenAI e o ML (machine learning) podem imitar especialistas em saúde para padronizar, enriquecer e limpar dados. Essa abordagem resolve desafios persistentes de dados, como manter a precisão dos diretórios de provedores de planos de saúde. É importante notar que essa tecnologia não substitui pessoas; em vez disso, permite que as equipes se envolvam em tarefas de pensamento mais profundo.

No podcast, Woodlock menciona que muitas empresas acham desafiador implementar um piloto de GenAI bem-sucedido. Embora os pilotos possam mostrar ganhos de produtividade de dois dígitos, dimensionar os resultados em toda a organização pode ser difícil. Isso geralmente se deve ao elemento humano necessário. Em vez de presumir que a tecnologia sozinha proporcionará ganhos de produtividade, as organizações precisam combinar novas tecnologias com novas formas de trabalhar. Processos e governança que funcionam em um projeto piloto menor podem não funcionar tão bem em uma organização grande e matricial. Diretrizes claras são necessárias para apoiar a adoção.

A fase de implementação também envolve construir confiança com as partes interessadas. Em um ambiente médico, claro, há grandes e compreensíveis preocupações sobre imprecisões que podem impactar negativamente o atendimento e violações da privacidade do paciente. Organizações de saúde que desejam incorporar essas ferramentas em seus fluxos de trabalho devem se concentrar em construir confiança, executando programas piloto e compartilhando os resultados.

Esse ceticismo em relação à nova saída da IA se reflete em nossa pesquisa anual de desenvolvedores. O entusiasmo pelas ferramentas de desenvolvedor genAI está aumentando a cada ano, com mais de 3 em cada 4 (76%) entrevistados usando ou planejando usá-las. No entanto, a confiança na saída das ferramentas de IA não é garantida; 31% dos desenvolvedores são céticos e apenas 42% dos desenvolvedores profissionais confiam em sua precisão. Eles expressam preocupações semelhantes sobre alucinações e implantação de código gerado por IA diretamente em ambientes de produção críticos.

Além de construir confiança, é preciso ter cautela com as novas ferramentas de IA. Um estudo revelou como o trauma pode alterar o DNA e impactar gerações futuras, reforçando a importância de usar a tecnologia com responsabilidade.

A importância da governança de dados na jornada da IA

Uma boa gestão e governança de dados não devem necessariamente tornar os processos mais lentos. Pelo contrário, podem ajudar a acelerar o processo. Woodlock cita o piloto de F1 Mario Andretti: “Muitas pessoas pensam que os freios servem para diminuir a velocidade. Se você tem bons freios, pode dirigir mais rápido”.

Da mesma forma, Woodlock diz que, uma vez que as organizações descobrem seu estilo de governança, elas podem acelerar sua jornada de IA. Satish Jayanthi, da Coalesce, observou em uma conversa anterior no podcast do Stack Overflow que uma estratégia de dados bem-sucedida precisa das pessoas, dos processos e da tecnologia certos para se unirem. As pessoas são a parte mais difícil: as partes interessadas certas precisam estar na mesa para supervisionar a governança de dados.

À medida que a adoção da IA cresce, a variedade de modelos e abordagens para gestão e governança de dados cria oportunidades, mas também adiciona complexidade. No último ano, a indústria mudou de um punhado de bons LLMs (large language models) de propósito geral para vários modelos de código aberto e nAI confiáveis, apoiando requisitos de negócios específicos. Adicione a isso a agentic AI e há uma infinidade de ofertas para escolher.

As prioridades de Woodlock são focar na precisão, como medir a confiabilidade de um resumo da conversa de um paciente e de um médico. A qualificação da sua equipe sobre as tendências de IA também é crucial: sua série de vídeos Code to Care explica tópicos relacionados à IA, como RAG e agentic AI.

Chandrasekhar observa que os dados usados para treinar modelos foram amplamente esgotados. Há uma necessidade de desenvolver mecanismos para a criação de novos conhecimentos e dados: “Com mais pressão sobre nossos clientes para fazer mais com menos, há uma tentação de acreditar que a IA impulsionará rapidamente os ganhos de produtividade”. Ele observa que “É importante reconhecer que a IA ainda não é uma panaceia para todas as coisas” e adverte que muitos estão superestimando o impacto da IA a curto prazo e subestimando seu impacto transformador a longo prazo.

Em resumo, o primeiro passo é estabelecer as bases, como a criação de conjuntos de dados limpos e sua base de conhecimento. Comece agora, porque acertar isso pode levar mais tempo do que você imagina. Então, você estará pronto para aproveitar ao máximo as oportunidades que a IA oferece.

Este conteúdo foi auxiliado por Inteligência Artificiado, mas escrito e revisado por um humano.

Via Stack Overflow Blog

Leave a Comment

Exit mobile version