Claude 3.7 Sonnet da Anthropic mira na OpenAI e DeepSeek na próxima grande batalha da IA

Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saiba mais
A Anthropic acaba de disparar um tiro de advertência para a OpenAI , DeepSeek e toda a indústria de IA com o lançamento do Claude 3.7 Sonnet , um modelo que dá aos usuários controle sem precedentes sobre quanto tempo uma IA gasta “ pensando ” antes de gerar uma resposta. O lançamento, junto com a estreia do Claude Code , um agente de codificação de IA de linha de comando, sinaliza o avanço agressivo da Anthropic no mercado de IA empresarial — um que pode remodelar a forma como as empresas criam software e automatizam o trabalho.
As apostas não poderiam ser maiores. No mês passado, a DeepSeek surpreendeu o mundo da tecnologia com um modelo de IA que correspondia aos sistemas dos EUA por uma fração do custo , fazendo com que as ações da Nvidia caíssem 17% e levantando alarmes sobre a liderança da IA dos EUA. Agora, a Anthropic está apostando que o controle preciso sobre o raciocínio da IA — não apenas velocidade bruta ou economia de custos — lhe dará uma vantagem.

“Nós apenas acreditamos que o raciocínio é uma parte essencial e um componente essencial de uma IA, em vez de algo separado que você tem que pagar separadamente para acessar”, disse Dianne Penn, que lidera o gerenciamento de produtos para pesquisa na Anthropic, em uma entrevista com a VentureBeat. “Assim como os humanos, a IA deve lidar tanto com respostas rápidas quanto com pensamento complexo. Para uma pergunta simples como 'que horas são?', ela deve responder instantaneamente. Mas para tarefas complexas — como planejar uma viagem de duas semanas à Itália enquanto acomoda necessidades alimentares sem glúten — ela precisa de um tempo de processamento mais extenso.”
“Não vemos raciocínio, planejamento e autocorreção como capacidades separadas”, ela acrescentou. “Então, essa é essencialmente nossa maneira de expressar essa diferença filosófica… Idealmente, o próprio modelo deve reconhecer quando um problema requer pensamento mais intensivo e ajuste, em vez de exigir que os usuários selecionem explicitamente diferentes modos de raciocínio.”

Os dados de referência respaldam a visão ambiciosa da Anthropic. No modo de pensamento estendido, o Claude 3.7 Sonnet atinge 78,2% de precisão em tarefas de raciocínio de nível de pós-graduação, desafiando os modelos mais recentes da OpenAI e superando o DeepSeek R1.
Mas as métricas mais reveladoras vêm de aplicações do mundo real: o modelo pontua 81,2% no uso de ferramentas focadas no varejo e mostra melhorias significativas no cumprimento de instruções (93,2%) — áreas em que os concorrentes tiveram dificuldades ou não publicaram resultados.
Enquanto o DeepSeek e o OpenAI lideram em benchmarks matemáticos tradicionais , a abordagem unificada do Claude 3.7 demonstra que um único modelo pode alternar efetivamente entre respostas rápidas e análises profundas, eliminando potencialmente a necessidade de as empresas manterem sistemas de IA separados para diferentes tipos de tarefas.
O momento do lançamento é crucial. O surgimento do DeepSeek no mês passado enviou ondas de choque pelo Vale do Silício, demonstrando que o raciocínio sofisticado de IA poderia ser alcançado com muito menos poder de computação do que se pensava anteriormente. Isso desafiou suposições fundamentais sobre os custos de desenvolvimento de IA e requisitos de infraestrutura. Quando o DeepSeek publicou seus resultados, as ações da Nvidia caíram 17% em um único dia — investidores de repente questionando se chips caros eram realmente essenciais para IA avançada.
Para as empresas, os riscos não poderiam ser maiores. As empresas estão gastando milhões integrando IA em suas operações, apostando em qual abordagem dominará. O modelo híbrido da Anthropic oferece um caminho intermediário atraente: a capacidade de ajustar o desempenho da IA com base na tarefa em questão, desde respostas instantâneas de atendimento ao cliente até análises financeiras complexas. O sistema mantém o preço anterior da Anthropic de US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída, mesmo com recursos de raciocínio adicionais.

“Nossos clientes estão tentando atingir resultados para seus clientes”, explicou Michael Gerstenhaber, chefe de plataforma da Anthropic. “Usar o mesmo modelo e solicitar o mesmo modelo de maneiras diferentes permite que alguém como a Thompson Reuters faça pesquisa jurídica, permite que nossos parceiros de codificação como Cursor ou GitHub sejam capazes de desenvolver aplicativos e atingir essas metas.”
A abordagem híbrida da Anthropic representa tanto uma evolução técnica quanto uma jogada estratégica. Enquanto a OpenAI mantém modelos separados para diferentes capacidades e a DeepSeek foca na eficiência de custos , a Anthropic está buscando sistemas unificados que podem lidar tanto com tarefas de rotina quanto com raciocínio complexo. É uma filosofia que pode remodelar a forma como as empresas implementam a IA, eliminando a necessidade de fazer malabarismos com vários modelos especializados.
A Anthropic também revelou hoje o Claude Code , uma ferramenta de linha de comando que permite que desenvolvedores deleguem tarefas complexas de engenharia diretamente à IA. O sistema requer aprovação humana antes de comprometer alterações de código, refletindo o foco crescente da indústria no desenvolvimento responsável de IA.

“Você realmente ainda tem que aceitar as mudanças que Claude faz. Você é um revisor com as mãos no volante”, observou Penn. “Existe essencialmente uma espécie de lista de verificação que você tem que aceitar para que o modelo tome certas ações.”
Os anúncios vêm em meio a uma competição intensa no desenvolvimento de IA. Pesquisadores de Stanford criaram recentemente um modelo de raciocínio de código aberto por menos de US$ 50, enquanto a Microsoft acaba de integrar o modelo o3-mini da OpenAI no Azure. O sucesso do DeepSeek também estimulou novas abordagens para o desenvolvimento de IA, com algumas empresas explorando técnicas de destilação de modelos que poderiam reduzir ainda mais os custos.

Penn ilustrou o progresso dramático nas capacidades de IA com um exemplo inesperado: “Temos pedido a diferentes versões de Claude para jogar Pokémon… Esta versão chegou até Vermilion City , capturou vários Pokémon e até mesmo se esforça para subir de nível. Ela tem o Pokémon certo para batalhar contra rivais.”
“Acho que vocês nos verão continuar a inovar e impulsionar a qualidade do raciocínio, impulsionar coisas como raciocínio dinâmico”, explicou Penn. “Sempre pensamos nisso como uma parte essencial da inteligência, em vez de algo separado.”
O verdadeiro teste da abordagem da Anthropic virá da adoção empresarial. Embora jogar Pokémon possa parecer trivial, ele demonstra o tipo de inteligência adaptável que as empresas precisam: IA que pode lidar tanto com operações de rotina quanto com decisões estratégicas complexas sem alternar entre modelos especializados. Versões anteriores do Claude não conseguiam navegar além da cidade inicial de um jogo. A versão mais recente cria estratégias, gerencia recursos e toma decisões táticas — capacidades que refletem a complexidade dos desafios empresariais do mundo real.
Para clientes corporativos, isso pode significar a diferença entre manter vários sistemas de IA para diferentes tarefas e implementar uma solução única e mais capaz. Os próximos meses revelarão se a aposta da Anthropic no raciocínio unificado de IA remodelará o mercado corporativo ou se tornará outro experimento na rápida evolução do setor.
Se você quer impressionar seu chefe, o VB Daily tem o que você precisa. Nós damos a você informações privilegiadas sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights para obter o máximo de ROI.
Leia nossa Política de Privacidade
Obrigado por assinar. Confira mais boletins informativos do VB aqui .
Ocorreu um erro.

venturebeat