• IA e Software Livre: Um ecossistema possível

  • Voltar
6 de fevereiro de 2025 by 

Por William Fonseca

No dia 27 de janeiro o mercado de IA foi abalado com o anúncio da ferramenta de IA DeepSeek, desenvolvida pela empresa de mesmo nome situada em Hangzhou na China. A DeepSeek chegou desbancando lideranças já consolidadas no mercado de IA, como o ChatGPT da OpenAI e a Gemini da Google. 

O mais importante de se notar não é somente a eficiência do modelo, mas também a tecnologia usada, os investimentos gastos no projeto (pouco mais de 6 milhões de dólares) e o tempo que a empresa levou da criação até a finalização do produto (2 anos).

Isso tudo foi possível graças a utilização prioritária de softwares livres e modelos open-source em sua base de dados. O professor Marcelo Finger, da USP, em entrevista ao canal do UOL no YouTube pontuou: “É importante enfatizar uma coisa: a DeepSeek subiu no ombro de gigantes, exatamente por estar usando uma tecnologia de software livre.

Ela pegou produtos de software livre que já vem sendo desenvolvidos e treinados há anos – como o modelo Llama da Meta, que é disponibilizado livremente –  teve algumas boas ideias de como melhorar o produto, e melhorou[…]””, “”[…] e, por ser um produto de software aberto, a DeepSeek também liberou o seu código, seus pesos e tudo que ela fez com o treinamento, e ela também fez isso de forma aberta […]”. Isso pode representar um passo significativo para as IAs de código aberto uma vez que tanto seus códigos e base de dados livres estejam disponíveis para qualquer pessoa ou grupo poder estudar, aprimorar e distribuir. Isso garante que não haja mais apenas um único monopólio do conhecimento sobre o funcionamento da tecnologia ou a dependência direta de uma única empresa que controla o código do serviço de IA.

Subindo no ombro de gigantes

Além de modelos de código aberto como os modelos deepseekv3 da própria DeepSeek e do Llama da meta, existem centenas de modelos de IA utilizados para, desde geração de imagens, como os modelos usados pela Stable Diffusion e Flux, a modelos como o BLOOM, que foi criado visando democratizar o acesso ao estudo sobre IA fazendo frente as Big Techs do Vale do Silício. Tais modelos, devido a sua natureza baseada em software livre, tem suas bases abertas para que novos modelos de IA e projetos possam ser construídos em cima deles.

O fato de aproveitar ou fazer uso de tecnologias livres permitiu que a DeepSeek pudesse rapidamente criar um produto altamente eficiente, mesmo com investimento limitado, diferente dos bilhões de dólares que empresas como Google e OpenAI investiram em seus produtos. Além de ter organizado e melhorado diversos LMMS, a empresa também aprimorou e disponibilizou gratuitamente as melhorias feitas em seus modelos para toda a comunidade. Futuramente, com o surgimento de novas empresas que sigam o mesmo modelo de trabalho que a DeepSeek, isso pode gerar um efeito dominó: empresas estudam modelos, os aprimoram para serem usados em seus serviços e os disponibilizam. Assim outras empresas podem continuar repetindo o mesmo processo e aprimorar a eficiência e a qualidade de um modelo sucessivamente, como pode ser entendido na entrevista concedida pelo professor Marcelo Finger.

Where is Brazil on it?

No Brasil também há um serviço de inteligência artificial criado a partir do modelo Llama conhecido como Maritaca. Essa IA foi criada pelo professor da Unicamp, Rodrigo Nogueira, e feita predominantemente em Python, a um custo muito mais baixo que o da DeepSeek, onde a sua versão mais recente, o Sábia3, consegue ter um desempenho similar ao GPT4 com um custo menor em reais. Considerado o primeiro chatbot 100% brasileiro, o projeto surgiu durante o doutorado de Nogueira em Nova York. Ao voltar para o Brasil, Nogueira percebeu que Chatbots, na época, tendiam a funcionar melhor no idioma em que foram treinados. Por conta disso, um assistente de IA brasileiro teria um melhor desempenho em nossa língua que modelos estrangeiros.

A existência de um projeto como esse só mostra que mesmo países que não possuem tantos investimentos governamentais em desenvolvimento de IA podem, sim, criar seus próprios sistemas, graças ao uso de modelos de código aberto e/ou baseados em software livre.

Onde posso encontrar facilmente modelos de IA de código aberto para estudar e usar?

A Hugging Face é uma plataforma que promete ser o GitHub dos modelos de código aberto, com mais de 1.3 milhões de modelo disponíveis gratuitamente. Ela promete ser como “um oasis no deserto dos modelos de IAs”, permitindo que qualquer usuário possa pegar qualquer modelo, criar um assistente de IA e hospedá-lo na própria plataforma para ser usado gratuitamente até atingir uma certa quantidade de processamento. O que a torna uma importante ferramenta para estudar modelos de IA, encontrar serviços que possam ser úteis em projetos e poder estudar mais a fundo a tecnologia de forma mais prática. A Hugging Face conta com diversos cursos e materiais complementares para estudo sobre IA que podem ser muito úteis para quem deseja contribuir para algum projeto ou aprender sobre seu funcionamento.

IAs livres são mais seguras que as proprietárias?

Assim como qualquer tecnologia, IAs não estão livres de falhas, vieses ou apropriação para interesses perversos, porém, ao optar por fazer uso de uma tecnologia de código aberto há várias camadas de proteção extra adicionadas. Como a possibilidade de monitoramento do uso da tecnologia e seu código pela comunidade que a utiliza e desenvolve, a impossibilidade de se criar um monopólio sobre o serviço e a constante capacidade dos devs de identificarem e corrigirem bugs que as podem conduzir a cometer erros (ou alucinações).

Sendo assim, as únicas utilizações indevidas da ferramenta ficam restritas a camada do usuário que pode a utilizar para criar bots de spam, criação de deepfakes com o rosto de pessoas anônimas ou públicas com intuito de aplicar golpes, ou propagar mentiras. Em tal nível, as únicas formas de proteger indivíduos contra o uso indevido ficam a cargo de ensinar profundamente as pessoas a identificarem tais “fakes”, como as IAs funcionam e quais ferramentas podem ser utilizadas para identificar se tal material foi produzido por IA.

Conclusão

O sucesso da DeepSeek serviu para mostrar à comunidade que IAs baseadas em software livre possuem, sim, grande potencial para gerar serviços de alta qualidade a um custo muito mais acessível que IAs de código fechado, só é necessário que os governos e organizações da sociedade civil colaborem com investimentos e apoio educacional para os desenvolvedores. Futuramente, com o fomento do desenvolvimento de IAs livres, será possível criar uma rede de desenvolvimento de modelos de linguagem e códigos que poderão ser livremente melhorados, estudados e utilizados para criar serviços de IA cada vez mais seguros e eficientes.

William Fonseca é designer gráfico e militante do Movimento Software Livre.
Perfil no Fediverso: @williamfonseca@bolha.us.

Referências

https://tecnoblog.net/noticias/bloom-e-um-modelo-de-ia-com-codigo-aberto-que-promete-ser-mais-democratico

https://en.wikipedia.org/wiki/Hugging_Face

https://github.com/deepseek-ai/DeepSeek-V3/blob/main/LICENSE-CODE

https://epocanegocios.globo.com/tecnologia/noticia/2024/08/conheca-o-maritalk-chatgpt-brasileiro-criado-por-pesquisadores-da-unicamp.ghtml

Você deve fazer login para publicar um comentário.