Principais conclusões
- Um novo coletivo de desenvolvedores está construindo modelos de IA de código aberto.
- O grupo usa modelos massivos de treinamento de idiomas que serão lançados sob licenças abertas.
- A IA de código aberto pode ajudar a tornar o poder potencialmente revolucionário da nova tecnologia menos propenso a vieses e erros.
Este é o caminho
Os primórdios da EleutherAI foram humildes. No ano passado, um pesquisador independente de IA chamado Connor Leahy postou a seguinte mensagem em um servidor Discord: “Ei pessoal, vamos [SIC] dar a OpenAI uma corrida pelo seu dinheiro como nos bons velhos tempos.” E assim, o grupo foi formado. Agora tem centenas de colaboradores que postam seu código no repositório de software online GitHub. Os esforços de IA de código aberto não são novos. Na verdade, a plataforma de gerenciamento de fluxo de trabalho Airflow do Airbnb e o mecanismo de descoberta de dados do Lyft são os resultados do uso de ferramentas de código aberto para permitir que as equipes de dados trabalhem melhor com os dados, apontou Ali Rehman, gerente de projeto da empresa de software CloudiTwins em uma entrevista por e-mail com Lifewire . “Assim como a revolução do código aberto levou a uma transformação do desenvolvimento de software, também tem impulsionado o desenvolvimento e a democratização da ciência de dados e da inteligência artificial”, disse Rehman. “O código aberto tornou-se um facilitador crítico de dados corporativos soluções científicas, com a maioria dos cientistas de dados usando ferramentas de código aberto.”
Abrindo a porta
O desenvolvimento de IA de código aberto pode ajudar a tornar o poder potencialmente revolucionário da nova tecnologia menos propenso a vieses e erros, argumentam alguns observadores. A pesquisa de IA agora acontece principalmente ao ar livre, com quase todas as empresas, laboratórios de pesquisa e universidades apresentando seus resultados imediatamente em publicações acadêmicas, disse Kush Varshney, pesquisador de IA da IBM, à Lifewire em uma entrevista por e-mail. “Esta comunidade aberta é essencial, pois fornece níveis aprimorados de verificações e contrapesos para garantir que a IA esteja sendo pesquisada, criada, implantada e aplicada com responsabilidade”, acrescentou Varshney. “Isso é especialmente crítico em situações em que esses sistemas podem influenciar a vida de nossos membros mais vulneráveis da sociedade. Essa abertura se aplica não apenas a algoritmos gerais de aprendizado de máquina e aprendizado profundo, mas também a elementos de IA confiáveis”. Rehman disse que uma das diferenças críticas entre software proprietário e de código aberto é a flexibilidade e a personalização. A pesquisa proprietária de IA terá problemas com segurança, atualizações e otimizações.