Alibaba abre o código do Qwen3 e agita o mundo da IA, Musk responde com Grok 3.5, guerra global de modelos de linguagem começa

Em 29 de abril de 2025, a gigante chinesa Alibaba lançou e abriu o código de sua nova geração do modelo de linguagem Qwen3 (通义千问). Como foi o desempenho deste novo modelo?

De acordo com informações públicas, o modelo predecessor Qwen1.5-110B teve excelente desempenho em diversos testes de benchmark, estando no mesmo nível do Llama3-70B da Meta.

A versão atualizada do Qwen3 introduz um mecanismo de raciocínio híbrido, combinando a capacidade generativa tradicional dos modelos de linguagem com uma capacidade dinâmica de raciocínio. Isso melhora o desempenho do modelo em tarefas complexas, especialmente aquelas que exigem raciocínio lógico e dedução em múltiplas etapas. Avaliações demonstram que o Qwen3 superou modelos de ponta como o DeepSeek-R1 e o OpenAI-o1 em benchmarks de codificação, matemática e habilidades gerais — consolidando-se como um dos modelos de linguagem abertos mais poderosos do momento.

Quais são os destaques mais esperados do Qwen3 lançado pela Alibaba?

Suporte multilíngue e compatibilidade multiplataforma:
Além do suporte ao chinês e ao inglês, o Qwen3 agora também abrange alemão, japonês, francês e outras línguas — totalizando mais de 29 idiomas. Isso mostra sua capacidade de uso cruzado de idiomas, além de ser compatível com múltiplas plataformas, facilitando sua implantação em diferentes sistemas operacionais e ambientes de hardware.

Capacidade de raciocínio híbrido:
O Qwen3 introduz os modos “pensante” e “não-pensante”, combinando geração de linguagem com raciocínio dinâmico, o que o torna especialmente eficaz em tarefas complexas que exigem lógica e múltiplas etapas.

O poder do código aberto:
A Alibaba liberou toda a série Qwen3 (incluindo o modelo principal) sob a licença Apache 2.0. Esta iniciativa é significativa para a democratização e o avanço da tecnologia de IA.

Alto custo-benefício:
O Qwen3 oferece desempenho de ponta com custos de implantação reduzidos. Por exemplo, o modelo principal Qwen3-235B-A22B pode ser implantado com apenas 4 placas H20, enquanto o DeepSeek-R1, de desempenho semelhante, requer 8 ou mais. A Huawei também declarou que suas plataformas Ascend MindSpeed e MindIE sempre ofereceram suporte aos modelos Qwen, e que o Qwen3 já está disponível com suporte imediato (0Day) nessas plataformas.

Logo após o lançamento do Qwen3 pela Alibaba, Elon Musk, fundador da Tesla, publicou no X:

Next week, Grok 3.5 early beta release to SuperGrok subscribers only. It is the first AI that can, for example, accurately answer technical questions about rocket engines or electrochemistry.

O que será que o Grok 3.5 trará de novo?

Coincidentemente, também hoje, a Meta realizou sua primeira conferência “LlamaCon” — um evento voltado a desenvolvedores de IA com foco em promover seu modelo de linguagem open-source Llama. O objetivo é atrair mais desenvolvedores para o ecossistema open-source e impulsionar o desenvolvimento da IA generativa.

Ainda hoje, a Duolingo — plataforma com centenas de milhões de usuários — anunciou sua transformação para uma empresa “AI-first”. A empresa está abraçando totalmente a inteligência artificial, planejando utilizá-la amplamente em áreas como recrutamento, avaliação de desempenho e alocação de pessoal, buscando maior eficiência operacional.

A inteligência artificial está tendo um impacto global cada vez maior. Gigantes e empresas emergentes não querem perder essa onda. Mas afinal, quem será o vencedor?

 

A criação de conteúdo exige esforço — para mais artigos de qualidade sobre IA, acesse: https://iaiseek.com/news

Autor: IAISEEK AI Editorial TeamHora de Criação: 2025-04-29 16:17:10
Leia mais