Tecnologia

Dados para o bem: como tornar a IA uma aliada do impacto social

Por que os dados são um dos maiores desafios para aproveitar a IA para o bem social – e como podemos enfrentar esse problema

Por Nithya Ramanathan e Jim Fruchterman 

Os avanços recentes relacionados à inteligência artificial generativa fizeram com que organizações sem fins lucrativos, negócios de impacto social e financiadores corressem para entender como essas inovações podem ser aplicadas para o bem global. Junto com esse entusiasmo, surgem preocupações legítimas de que a IA possa ampliar ainda mais a desigualdade digital e não consiga melhorar a vida de 90% da população mundial. O foco atual em financiar a IA de forma inteligente e estratégica no setor social é fundamental e isso ajudará a garantir que os recursos gerem o maior impacto possível.

Mas como o setor social pode responder a este momento?

A IA já é eficiente em muitas coisas. Diversas organizações de impacto social estão usando IA hoje com resultados positivos. Existem ótimos recursos para quem quer entender o cenário atual e como as tecnologias de IA já disponíveis podem contribuir com sua missão, incluindo este relatório da Stanford HAI em parceria com a Project Evident e o Mapa do Tesouro da IA para Organizações Sem Fins Lucrativos [em tradução livre], da Tech Matters.

Algumas empresas de tecnologia voltadas para o bem estão desenvolvendo soluções de IA e prosperando, como Digital Green, Khan Academy e Jacaranda Health, entre outras. A maioria das organizações do setor social, porém, ainda não está pronta para construir soluções baseadas em IA. No entanto, mesmo aquelas que ainda nem consideram a IA precisam começar a pensar em como enfrentar um dos maiores desafios para aproveitar essa tecnologia na solução de problemas sociais: dados insuficientes.

Alimentando a IA com os dados corretos

A IA é uma máquina, e dados são o combustível que a alimenta. Essa máquina só funciona bem se os dados que ela consome forem de qualidade. A maior barreira para desenvolver uma IA robusta capaz de resolver problemas é ter conjuntos de dados de treinamento adequados. Um bom conjunto de dados precisa ser:

  1. Grande o suficiente para representar todos os cenários que se deseja modelar;

  2. Atualizado o suficiente, ou seja, precisa existir uma forma de atualizar os dados sempre que as condições mudarem; e

  3. Preciso o suficiente, garantindo que cada dado seja correto e reflita o contexto e a situação de forma adequada, permitindo que o algoritmo aprenda corretamente.

Esses princípios foram adaptados dos critérios de investimento “Grande o suficiente, Simples o suficiente, Barato o suficiente”, de Kevin Starr. Se eles não forem atendidos, é improvável que as soluções de IA gerem resultados confiáveis para a tomada de decisão.

Atualmente, os dados robustos, atualizados e precisos necessários para que a IA enfrente muitos dos problemas urgentes do setor social simplesmente não existem, ou estão espalhados e desconectados. Por isso, o setor social sofre com a falta de conjuntos de dados que sejam suficientemente grandes, atualizados e precisos.

Para que possamos realmente usufruir dos benefícios da IA de forma ampla e inclusiva, organizações do setor social – incluindo ONGs, negócios de impacto, financiadores e as próprias comunidades impactadas – precisam assumir o compromisso de coletar dados de forma sistemática, ética e contínua como parte fundamental de seu trabalho. Além disso, é essencial investir em infraestrutura de dados compartilhada, que permita agregar informações e construir uma visão precisa da realidade que queremos transformar.

Uma forma simples de enxergar essa questão é a seguinte: para construir carros, antes precisamos investir em estradas.

Financiar as bases: coletar e pagar por dados melhores

Sempre que chegamos a um novo paradigma tecnológico que esperamos que melhore as vidas de todos de forma justa, nos deparamos com o mesmo problema: a falta de infraestrutura necessária nos países de baixa renda. Hoje, um dos principais componentes dessa assimetria de infraestrutura é, simplesmente, a ausência do volume e dos tipos de dados necessários para que a IA funcione.

Se você tem uma visão ambiciosa de transformação social, precisa coletar dados e, muito provavelmente, precisa coletá-los de forma melhor. Coletar dados de maneira ética, confiável, consistente e precisa custa dinheiro, mas é a única maneira de construir um ecossistema no qual a maior parte do mundo possa se beneficiar das tecnologias emergentes.

Vemos avanços rápidos no desenvolvimento de IA no setor privado, viabilizados pela disponibilidade de dados em grande escala. Por outro lado, a maioria das organizações do setor social sofre com a falta de dados adequados que reflitam seu trabalho, seus resultados e a real magnitude dos problemas que buscam resolver. Mesmo quando coletamos dados para monitoramento e avaliação de programas, muitas vezes fazemos isso de forma pontual e insustentável, apenas para atender exigências de relatórios para financiadores ou obrigações legais. Além disso, os desafios de coletar dados de forma ética no que diz respeito a consentimento, propriedade e segurança das comunidades vulneráveis tornam ainda mais difícil ampliar essa prática no setor social.

Quando a Nexleaf foi fundada, em 2009, seus cofundadores tinham como objetivo levar o valor dos dados gerados por sensores para sistemas de saúde em contextos de poucos recursos. Como profissionais de tecnologia que entendiam o poder dos dados para impulsionar ações humanas e já previam o futuro dos modelos de aprendizado de máquina, a Nexleaf reconheceu que dados robustos eram um elemento fundamental da infraestrutura necessária para inovar. Como uma empresa social, a Nexleaf desenvolveu uma plataforma de sensores e dados que permite que ministérios da saúde acessem um mapa em tempo real de suas cadeias de suprimento de vacinas, direcionem investimentos e façam rapidamente reparos em refrigeradores de vacinas e caminhões de transporte que estejam com problemas.

Coletar dados não pode mais ser encarado como uma etapa burocrática para concluir um projeto de curto prazo. Os dados devem ser vistos como um componente essencial de qualquer intervenção, inclusive como uma linha orçamentária dedicada. Dados que podem ser coletados de forma responsável por meio de operações contínuas e de longo prazo (em vez de ações pontuais de monitoramento e avaliação), também podem gerar oportunidades futuras para ampliar o impacto. Para construir uma máquina complexa, primeiro precisamos investir nas porcas e parafusos.

Compartilhar dados: bases interoperáveis impulsionam a inovação

Coletar e gerenciar os grandes volumes de dados que sustentam a IA é caro. Por isso, o setor social precisa contribuir e financiar uma infraestrutura de dados compartilhada, que mantenha recursos de dados suficientes para garantir máxima precisão e utilidade.

Esse é um dos aspectos em que o setor social tem a oportunidade de conduzir sua revolução em IA de forma radicalmente diferente do setor privado. Mesmo organizações que competem entre si, como, por exemplo, diferentes desenvolvedores de ferramentas de planejamento agrícola em países de baixa renda, podem obter benefícios mútuos e ampliar seu impacto ao contribuir com uma infraestrutura de dados compartilhada.

Atualmente, até mesmo os dados que existem estão excessivamente fragmentados. Tome como exemplo os registros de vacinação. Alguns países possuem seus próprios sistemas digitais de saúde, enquanto outros dependem de um ou mais fornecedores de aplicativos para armazenar esses registros, e todos esses dados ficam isolados em bases separadas. Em caso de um surto de sarampo que atravesse fronteiras, quão útil seria um algoritmo capaz de recomendar os locais ideais para campanhas emergenciais de vacinação?

Por outro lado, as centrais de atendimento em situações de crise estão liderando o caminho da interoperabilidade. As aplicações de IA têm enorme potencial para ajudar atendentes de emergências em saúde mental a fazer mais com menos, além de ajudar a suprir a grande escassez de profissionais capacitados para lidar com essas situações. Diversas organizações estão compartilhando tecnologias e, muitas vezes, dados anonimizados, entre áreas semelhantes. 

Com financiamento e apoio pro bono da Google.org, o The Trevor Project foi pioneiro no uso de um simulador para treinar voluntários que atuam na linha de apoio LGBTQ+. Isso aumentou a quantidade de simulações disponíveis para os treinandos (que podem conversar com personagens gerados por IA) reduzindo a sobrecarga de tempo e o estresse dos instrutores humanos. Esse projeto deu origem à ReflexAI, que agora oferece essa tecnologia para muitas outras linhas de apoio, incluindo aquelas voltadas para saúde mental de veteranos das Forças Armadas dos Estados Unidos e para pessoas em situação de dependência química. Da mesma forma, o projeto Aselo, da Tech Matters, uma plataforma de atendimento para situações de crise, tem recebido dados de diversas linhas de apoio a crianças em diferentes países, com o objetivo de desenvolver algoritmos de IA de código aberto capazes de categorizar os conteúdos das conversas, uma funcionalidade essencial para várias iniciativas que usam IA para melhorar serviços e a qualidade dos dados. Além disso, a Tech Matters trabalha com a Child Helpline International, que reúne linhas de apoio infantil do mundo todo, para consolidar dados de vários países (excluindo informações pessoais) e, assim, gerar uma compreensão mais profunda dos desafios enfrentados pelas crianças.

A Nexleaf Analytics já está implantando infraestrutura de dados compartilhada para sistemas de saúde. Ao desenvolver sistemas de gestão de dados capazes de funcionar em todo o sistema de saúde de um país, juntamente com a padronização das interfaces de dados (APIs), sua plataforma consolida informações de vários modelos de refrigeradores de vacinas em operação na África e na Ásia, além de dados de viagens de veículos de transporte e caixas térmicas. Isso permite que os países tenham uma visão completa de sua cadeia de distribuição de vacinas. Com isso, os usuários não precisam mais gastar tempo realizando as tarefas difíceis de coleta, limpeza e rotulagem dos dados, podendo direcionar seus recursos limitados para usar essas informações na gestão de seus sistemas de saúde. Ao mesmo tempo, os fabricantes de equipamentos de refrigeração para vacinas podem focar no que fazem de melhor, tendo a garantia de que os dados gerados pelos equipamentos em campo ajudarão os países clientes a gerenciar seus ativos de refrigeração.

Compartilhar dados exige mais do que infraestrutura técnica. Também é necessário construir uma infraestrutura social e legal. Recentemente, a Tech Matters lançou a iniciativa Better Deal for Data, uma proposta de governança de dados leve, que estabelece um conjunto simples de compromissos para organizações do setor social. Primeiro, essas organizações se comprometem a proteger os dados das comunidades que atendem, além de garantir que esses dados não sejam vendidos para empresas privadas. Segundo, a iniciativa busca facilitar o processo de combinar dados de várias organizações em conjuntos únicos, de forma a acelerar o desenvolvimento de conhecimento e de modelos de IA voltados para o bem social.

Governos e formuladores de políticas também estão caminhando nessa direção. A Estratégia Nacional de IA do Quênia estabelece três pilares centrais: infraestrutura digital de IA, dados e inovação em pesquisa de IA. O segundo pilar está focado em enfrentar o desafio da falta de dados, garantindo que os modelos de IA possam ser adequadamente adaptados à realidade queniana. O objetivo final desse pilar é alcançar melhorias em qualidade, usabilidade, compartilhamento e soberania dos dados, por meio da criação de um robusto sistema de governança, do desenvolvimento de protocolos seguros para compartilhamento, acesso e interoperabilidade, além da promoção da criação de conjuntos de dados abertos e de alta qualidade.

Quando a interoperabilidade radical é bem executada, podemos desbloquear o potencial dos dados para todas as aplicações, sem comprometer a soberania, a propriedade ou a privacidade de indivíduos, organizações ou países. Trata-se de compartilhar de uma forma que proteja os direitos individuais e coletivos, em vez de explorar usuários que, muitas vezes, concordaram em ceder seus dados sem nem perceber, apenas clicando em um termo de aceite. O caminho para criar conjuntos de dados interoperáveis exige conhecimentos específicos, e os líderes do setor social precisam investir na construção cuidadosa e intencional de ecossistemas de dados. Plataformas como a Data Commons permitem a interoperabilidade de dados entre fontes fragmentadas, sem necessidade de limpeza ou junção manual de dados. Abordagens baseadas em padrões, como essa, viabilizam análises mais robustas e melhores insights orientados por dados.

Ao reunir dados que se encontram fragmentados, podemos obter respostas melhores para resolver os problemas que enfrentamos em escala global.

Construir juntos: como as aplicações de IA prosperam

Desenvolver soluções de IA ainda é algo muito difícil e caro, e adotar uma abordagem isolada só leva ao desperdício de recursos. Muitas empresas sociais já estão envolvidas em iniciativas de IA que, embora não sejam necessariamente duplicadas, poderiam se beneficiar muito se estivessem reunidas sob uma mesma estrutura. Financiadores precisam liderar esse movimento, criando e investindo em infraestruturas comuns e centros de colaboração.

Uma única rede colaborativa de IA poderia, por exemplo, reunir conjuntos de dados relevantes, pesquisadores, organizações sem fins lucrativos, governos e outros atores para acelerar o desenvolvimento de IA em um conjunto específico de casos de uso dentro de uma área. Ao reunir dados, identificar lacunas, compartilhar ou até construir modelos coletivamente, o trabalho colaborativo em soluções de IA pode gerar impacto em todo um ecossistema. Por exemplo, dados e modelos de bioacústica e de análise de armadilhas fotográficas podem ser aplicados na detecção de espécies, na estimativa de populações, na preservação de florestas tropicais, no combate à caça ilegal e na redução da poluição sonora nos oceanos. Nesse campo, organizações já vêm formando parcerias para desenvolver ferramentas de IA construídas a partir de grandes conjuntos de dados compartilhados, como Wildlife Insights e Arbimon. O Wildlife Insights, por exemplo, surgiu como uma coalizão de organizações de conservação que desenvolveram uma infraestrutura compartilhada, permitindo que qualquer instituição fizesse o upload de fotos de armadilhas fotográficas, acessasse modelos de identificação de espécies, realizasse análises de dados e, de forma coletiva, construísse tanto uma visão mais abrangente da biodiversidade global quanto modelos de IA melhores.

Qualquer área que tenha objetivos comuns e grandes volumes de dados espalhados por diversas organizações pode se beneficiar da construção de soluções de IA compartilhadas. Devemos fazer os cálculos difíceis uma única vez, em vez de repetir os mesmos esforços para criar modelos semelhantes do zero várias vezes, e, assim, focar nos verdadeiros desafios de transformar os resultados e os insights da IA em ações concretas.

Conclusão

Para maximizar o potencial da IA para o bem social, organizações multilaterais, fundações e entidades sem fins lucrativos precisam trabalhar em conjunto. E os financiadores devem liderar esse processo, criando e financiando iniciativas sustentáveis de coleta de dados, bem como infraestruturas de dados compartilhadas, que incluam:

  • infraestrutura tecnológica, como serviços de nuvem, conectividade digital, softwares interoperáveis e ferramentas de coleta de dados; e

  • infraestrutura social, como desenvolvimento de competências, rotinas, normas éticas e mecanismos de financiamento.

Ao reunir organizações com objetivos semelhantes em esforços coletivos para impulsionar soluções baseadas em IA, mais instituições poderão se beneficiar dessa tecnologia.

Em uma entrevista para a Harvard Business Review, Bryan Catanzaro, vice-presidente de Pesquisa Aplicada em Deep Learning da NVIDIA, expressou uma crença bastante comum: “os dados mais úteis para a IA sempre serão os dados mais secretos”.

Talvez essa lógica faça sentido para empresas orientadas pelo lucro. Mas, no setor social, podemos e devemos abandonar uma abordagem competitiva. Na verdade, para resolver os problemas complexos que enfrentamos, precisamos inverter esse modelo. Os dados mais úteis para a IA aplicada ao impacto social serão justamente aqueles que forem compartilhados, garantindo que tenhamos bases suficientemente grandes, atualizadas e precisas para enfrentar os maiores desafios da humanidade.

Agir agora, de forma concreta, para coletar dados melhores, integrar informações dispersas e colaborar no desenvolvimento de inovações em IA permitirá que o setor social colha os benefícios do poder emergente da IA em prol do bem coletivo.

OS AUTORES

Nithya Ramanathan é cofundadora e CEO da Nexleaf Analytics.

Jim Fruchterman é fundador e CEO da Tech Matters.

*Artigo publicado originalmente no site da Stanford Social Innovation Review com o título Gather, Share, Build.

Leia também: Como parcerias podem ajudar ONGs a trabalhar com IA

Mantenedores Institucionais

Apoio institucional