O recente lançamento da DeepSeek, inovadora startup de inteligência artificial (IA) desenvolvida por cientistas chineses, surpreendeu analistas e especialistas internacionais, desafiando a compreensão ocidental sobre a dinâmica global e o futuro da tecnologia.
Projetada para levar a IA a um nível de capacidade cognitiva mais próximo ao dos seres humanos, a DeepSeek pegou os países ocidentais de surpresa, já que gigantes renomados como Google, Amazon e Microsoft competem pelo domínio desse mercado promissor, no qual a OpenAI, com seu Chat GPT, está triunfando por enquanto.
No entanto, além de demonstrar sólidos avanços tecnológicos, o DeepSeek superou seu rival ao se tornar o aplicativo gratuito mais baixado na App Store dos Estados Unidos na segunda-feira.
O que faz o DeepSeek se destacar?
Uma das principais características que distingue o chatbot chinês de concorrentes como as ferramentas da OpenAI é que seus modelos são de código aberto.
Isso significa que qualquer pessoa pode acessar e modificar seus componentes, embora a empresa não tenha divulgado os dados usados para treiná-los.
Treinados em chips Nvidia H800, que não são os de mais alto desempenho, os modelos da DeepSeek levaram a uma revelação: talvez um hardware mais sofisticado e caro não seja necessário para o desenvolvimento de IA de ponta.
Na semana passada, a equipe da startup chinesa apresentou seu modelo mais recente, o R1, com habilidades avançadas de "raciocínio" e capacidade de repensar sua própria abordagem.
Mais um importante recurso de distinção do DeepSeek em relação a outras plataformas de IA é a capacidade de realizar aprendizado autônomo contextual:
"Em vez de ensinar explicitamente ao modelo como resolver um problema, simplesmente fornecemos a ele os incentivos certos, e ele desenvolve estratégias avançadas de resolução de problemas de forma autônoma", explicaram seus criadores.
Em outras palavras, o chatbot chinês pode aprender de forma mais eficiente com a experiência e adaptar-se rapidamente a novos ambientes usando sua própria linha de raciocínio para treinamento adicional sem intervenção humana constante e a necessidade de alimentá-lo com novas fontes de dados, permitindo que ele opere com um alto grau de flexibilidade e autonomia.
O 'Sputnik' da IA
Graças ao sucesso do DeepSeek, a China alcançou um avanço tecnológico em uma área até então considerada essencialmente monopólio das potências ocidentais.
"O DeepSeek R1 é o momento Sputnik da IA", escreveu no X o capitalista de risco Marc Andreessen, que aconselhou Donald Trump sobre política tecnológica, alertando-o sobre as armadilhas da regulamentação excessiva do governo dos EUA sobre o setor de IA.
Assim como o lançamento do icônico satélite soviético em 1957, que desencadeou a corrida espacial entre a URSS e os EUA, o DeepSeek surgiu como um concorrente sério no mercado de IA, onde tem uma chance real de assumir a liderança.
Outro destaque é o seu processo de treinamento, que foi muito barato para os padrões do setor. Segundo os relatos, custou apenas US$ 5,58 milhões (cerca de R$ 32 milhões), 89 vezes menos do que o orçamento para o treinamento do modelo o1 da OpenAI, que, segundo rumores, foi de cerca de US$ 500 milhões (cerca de R$ 2 bilhões).
Nirgunan Tiruchelvam, da consultoria Aletheia Capital, sediada em Singapura, observou que o produto da DeepSeek levanta sérias questões sobre a tese de que "os gastos significativos de capital e os custos operacionais em que o Vale do Silício incorreu são a maneira mais adequada de lidar com a tendência da IA".
Como observa o JP Morgan, a poderosa mensagem da DeepSeek para o setor de IA é que "mais investimento não significa mais inovação".
O que mais a China tem?
Assim como os EUA, a China está investindo bilhões de dólares no desenvolvimento de IA, e a DeepSeek não está a única tentativa de conquistar uma posição sólida nesse mercado. Aqui estão alguns dos outros modelos de IA que estão sendo criados no gigante asiático:
Qwen-2.5-Max da Alibaba Cloud
A Alibaba Cloud lançou o Qwen-2.5-Max, que conseguiu superar o modelo anterior do DeepSeek, o V3. Os desenvolvedores estão trabalhando para melhorar ainda mais seus recursos de raciocínio.
Os modelos da série Qwen2.5 da Alibaba Cloud são destinados principalmente a desenvolvedores e clientes corporativos, como montadoras, bancos, fabricantes de jogos e varejistas, como parte do desenvolvimento de produtos e da formação de experiências do cliente. Também está disponível o chatbot Qwen, conhecido na China como Tongyi Qianwen.
Ernie Bot 4.0 do Baidu
O Ernie Bot 4.0, criado pela Baidu, foi o primeiro chatbot de IA feito na China disponível ao público. A empresa disse que lançou o modelo publicamente a fim de coletar seus enormes dados de feedback humano para aumentar sua capacidade. Em junho de 2024, o Ernie Bot 4.0 tinha mais de 300 milhões de usuários.
Doubao 1.5 Pro, da ByteDance
O Doubao 1.5 Pro foi lançado na semana passada pela empresa controladora do TikTok e é atualmente um dos chatbots mais populares da China, com 60 milhões de usuários ativos mensais.
A ByteDance afirma que o Doubao 1.5 Pro é melhor que o ChatGPT-4o em retenção de conhecimento, programação, raciocínio e processamento do idioma chinês. De acordo com a empresa, o modelo também é rentável e envolve custos menores de hardware em comparação com outros modelos de idiomas, graças à sua arquitetura otimizada, que equilibra o desempenho com demandas computacionais reduzidas.
Kimi k1.5, da Moonshot AI
O Kimi k1.5 da Moonshot AI é uma startup sediada em Pequim, avaliada em mais de US$ 3 bilhões após sua última rodada de captação de recursos. Seus criadores afirmam que ele supera o modelo o1 da OpenAI em matemática, programação e na capacidade de compreender texto e informações visuais, como fotos e vídeos.
Com informações da AP