DeepSeek apresenta novo modelo de IA com novas capacidades de raciocínio

DeepSeek: a inteligência artificial que pensa antes de responder — DeepSeek – Créditos: depositphotos.com / AdriaVidal

Por: Felipe Farias

21/04/2025 14:05

O avanço dos modelos de linguagem de grande escala (LLMs) tem sido um dos pilares da inteligência artificial moderna. A DeepSeek, em colaboração com a Universidade de Tsinghua, está explorando novas abordagens para aprimorar o raciocínio desses modelos. Recentemente, a empresa publicou um artigo que introduz a modelagem de recompensa generativa (GRM) e o ajuste por crítica auto-orientada (SPCT) como métodos promissores para melhorar a performance dos LLMs.

Essas técnicas foram destacadas em um artigo publicado no arXiv, que sugere que o uso de SPCT pode aumentar significativamente a qualidade e a escalabilidade dos GRMs. A pesquisa destaca que esse sistema é capaz de alinhar os modelos de linguagem com as preferências humanas, um aspecto crucial para o desenvolvimento de IA que interage de forma mais natural e eficaz com os usuários.

Como a modelagem de recompensa generativa transforma LLMs?

A modelagem de recompensa generativa (GRM) é uma abordagem inovadora que busca guiar os modelos de linguagem em direção a respostas que sejam mais alinhadas com as expectativas humanas. O sistema funciona atribuindo recompensas a saídas que se aproximam de critérios pré-estabelecidos, permitindo que o modelo aprenda a priorizar essas respostas.

O ajuste por crítica auto-orientada (SPCT) complementa essa abordagem ao permitir que o modelo avalie suas próprias saídas, ajustando-se de acordo com um conjunto de princípios auto-impostos. Isso não apenas melhora a qualidade das respostas, mas também aumenta a capacidade do modelo de se adaptar a diferentes contextos e tarefas.

Quais são os desafios e perspectivas futuras para o DeepSeek-GRM?

Apesar dos avanços significativos, o DeepSeek-GRM ainda enfrenta desafios em algumas tarefas específicas. Os pesquisadores acreditam que esses obstáculos podem ser superados com o desenvolvimento de sistemas de recompensa mais generalistas, que permitiriam uma maior flexibilidade e adaptabilidade dos modelos de linguagem.

Celular com app DeepSeek - Créditos: depositphotos.com / Mojahid_Mottakin — Celular com app DeepSeek – Créditos: depositphotos.com / Mojahid_Mottakin

A expectativa é que o modelo seja lançado em código aberto, embora uma data específica ainda não tenha sido divulgada. A comunidade de IA aguarda ansiosamente por esse lançamento, especialmente em meio às expectativas para o próximo modelo de linguagem da DeepSeek, o R2, que promete avanços em codificação e raciocínio em múltiplos idiomas.

Impacto global e inovações em IA

O desenvolvimento de modelos de linguagem avançados não é uma exclusividade da DeepSeek. Instituições ao redor do mundo têm contribuído significativamente para o avanço da inteligência artificial. Por exemplo, o MIT CSAIL desenvolveu um sistema de diagnóstico de câncer de mama baseado em IA, reduzindo erros em 15%. O Google AI, por sua vez, revolucionou o aprendizado profundo com o AlphaGo, o primeiro programa a derrotar um campeão mundial de Go.

Outras inovações incluem o AlphaFold do DeepMind Lab, que impactou a biologia molecular ao prever estruturas de proteínas com precisão sem precedentes, e o sistema de reconhecimento de voz Deep Speech do Baidu Research Lab, que alcançou uma precisão de 97% na transcrição de áudio. Esses avanços destacam o potencial transformador da IA em diversas áreas.

O futuro da inteligência artificial e modelos de linguagem

O campo da inteligência artificial continua a evoluir rapidamente, com inovações que prometem transformar a forma como interagimos com a tecnologia. A pesquisa da DeepSeek e da Universidade de Tsinghua é um exemplo de como a colaboração entre academia e indústria pode impulsionar o desenvolvimento de tecnologias mais sofisticadas e alinhadas com as necessidades humanas.

Com o lançamento iminente do modelo R2, a DeepSeek espera não apenas manter sua posição de liderança, mas também abrir novas possibilidades para a aplicação de LLMs em contextos globais. A evolução contínua desses modelos promete um futuro onde a interação homem-máquina seja cada vez mais fluida e natural.

Siga a gente no Google Notícias