O Brasil não faz feio diante de gigantes como Open AI com seu ChatGPT, financiado pela Microsoft; o Google com seu modelo Gemini com o seu Claude; a francesa Mistral, a chinesa Baidu, com Ernie Bot entre outras.
Há 6 anos, um grupo de pesquisadores da Universidade Estadual de Campinas (Unicamp), vem estudando e se especializando em inteligência artificial (IA). A startup foi criada um mês antes do lançamento do ChatGPT, da OpenAI.
O resultado deste esforço se materializou no MariTalk, o chatbot de IA 100% brasileiro, que está disponível de graça na internet. Assim como o ChatGPT, da OpenAI, é treinado para auxílio em algumas tarefas, como resolver uma prova do Enem, até compreender aspectos da legislação brasileira. E, tudo isso nativo no idioma português brasileiro.
Esse grupo, liderado pelo doutor em Ciências da Computação e professor voluntário da Unicamp, Rodrigo Nogueira, com seu colega Ramon Pires, além dos pesquisadores Hugo Abonizio e Thales Almeida, formam a startup Maritaca AI, uma empresa 100% nacional que tem a ambição de ser uma OpenAI brasileira.
O líder e fundador da startup tem um objetivo claro, transformar a Maritaca numa referência internacional em inteligência artificial, assim como a Embraer é referência na aviação mundial
Rodrigo Nogueira começou a trabalhar com IA em 2012, quando estava na área de imagens, onde foi o primeiro grande boom de IA. Ali, tivemos sucesso de conseguir identificar se uma impressão digital é verdadeira ou falsa. Isso se transformou num produto que é especial para várias empresas. Foi deste instante que comecei a gostar cada vez mais dessa área.
Em 2018, começarmos a trabalhar com um modelo de linguagem. Na época, não eram grandes, mas pequenos modelos de linguagem. A gente lançou o primeiro modelo de linguagem brasileira, pegado no português, o nome dele é BERTimbau. Hoje, tem mais de 10 milhões de downloads no site, no nosso repositório, que armazena todos esses modelos.
Sou formado nos Estados Unidos, depois voltei para o Brasil e trabalhei numa série de outras empresas. Todo time que está aqui comigo eram pessoas que trabalhavam nas outras empresas e então tomei a decisão de criar a Maritaca, convenci o pessoal de trabalhar com a gente.
O importante foi a percepção de criar a empresa antes do lançamento do ChatGPT. A gente já via que o turbilhão estava se formando.
A gente ganhou um Ad Grants do Google de US$ 1 milhão, para gastar no Google Cloud. O Google também deu para a gente acesso aos computadores deles para treinar. Foi o grande impacto.
A gente continua recebendo cada vez mais Ad Grants do Google. Tenho que agradecer à empresa, que cedeu parte da computação para a gente treinar esses grandes modelos de linguagem.
Isso culminou no Sabiá-2, que está chegando a um desempenho melhor que o GPT 3,5 Turbo. Mas, diferente do GPT 4, porque, com a especialização no português, a gente consegue serviços envolvendo algo muito melhor.
A gente está muito feliz com esse progresso, é uma tecnologia nacional, como você pode ver. Estamos tateando a área faz um tempão e tem que acertar a mão sempre.
A gente sempre trabalhava com as inteligências artificiais, elas sempre funcionavam bem até cerca de 2021. Daí, em 2022, esses modelos tiveram um salto de potencial e melhorou muito a qualidade.
A gente já fazia a pesquisa no português e vi que, ao especializar essas linguagens para o português, o desempenho melhorava ainda mais. E foi daí que tive essa fagulha. Praticamente todos nós somos de vertente acadêmica, de pesquisa. Mas, esse negócio não é simplesmente uma curiosidade científica, será uma coisa que impactará todo mundo.
O que a gente faz hoje é algo bem parecido com o que a OpenIA oferta. Por exemplo, no ChatGPT, você faz perguntas e o chatbot dá as respostas. Por exemplo, se você fizer uma pergunta cuja resposta está em diversos documentos, é muito difícil fazer o gerenciamento da pesquisa no Google. Com a IA, você faz diversas consultas, agrega os resultados.
O GPT-4 já consegue agregar essas respostas, dar uma resposta mais concisa.
Hoje, prefiro perguntar ao chatbot direto, verificar a resposta sobre aquilo que procuro, do que ficar varrendo a documentação no [buscador] Google.
Mas, em termos de produto, é algo bem semelhante à OpenAI ou à Mistral. Todas essas são as nossas concorrentes e digo isso com uma certa intimidade.