Nas últimas 24 horas, o setor de IA passou por mudanças significativas. O aumento na demanda global por inferência de IA, a parceria entre IBM e AMD para computação quântica centrada e o crescimento financeiro do MongoDB impulsionado por IA — juntos, esses três movimentos mostram os avanços mais recentes em infraestrutura de IA, inovação em computação e ecossistemas de banco de dados.
Os dados mostram que o Google processou mais de 980 trilhões de tokens em julho de 2025, o dobro do volume registrado em maio do mesmo ano. A Microsoft, por sua vez, processou mais de 500 trilhões de tokens por meio de sua Foundry API no ano fiscal de 2025 (até junho), um crescimento de 7 vezes em relação ao ano anterior. A ByteDance atingiu uma média diária de consumo de 16,4 trilhões de tokens até o final de maio de 2025. Até o final de junho, o consumo diário de tokens na China chegou a 30 trilhões, um aumento de 300 vezes em comparação com o início de 2024.
Comentário:
O consumo de tokens na fase de inferência supera amplamente o da fase de treinamento, o que indica que os modelos de IA estão passando rapidamente da pesquisa para aplicações reais. As APIs de inferência têm margens de lucro de até 70%, gerando receitas substanciais para empresas como Google e Microsoft. A receita do Google Cloud no 2º trimestre de 2025 atingiu US$ 13,6 bilhões, enquanto a do Azure AI cresceu 5 vezes.
Novas tecnologias da NVIDIA, como o Spectrum-XGS Ethernet e o Jetson Thor, também impulsionarão a eficiência. Atualmente, o Microsoft Azure atende empresas como a OpenAI, enquanto o Google reporta que mais de 85.000 empresas já utilizam o Gemini, confirmando a enorme demanda por capacidades de inferência. Só em maio, o consumo de tokens da ByteDance chegou a quase 500 trilhões, mostrando sua força em aplicações de IA e sua relevância na competição global por infraestrutura de IA. No entanto, o processamento de tokens em grande escala levanta questões críticas sobre privacidade e regulamentação.
A IBM e a AMD firmaram uma parceria para desenvolver uma arquitetura de supercomputação quântica centrada (quantum-centric supercomputing), que combina computação quântica com computação de alto desempenho (HPC) e infraestrutura de IA. Nesta abordagem, computadores quânticos trabalharão de forma integrada com CPUs, GPUs e outros mecanismos de computação para gerenciar cargas de trabalho complexas de IA de maneira eficiente.
Comentário:
Os computadores quânticos são altamente eficazes na simulação de comportamentos moleculares complexos, enquanto o HPC e a IA são mais adequados para a análise de grandes volumes de dados. A colaboração entre as duas tecnologias pode resolver problemas impossíveis para a computação tradicional.
A parceria fortalece a confiança na indústria, mas a computação quântica ainda está em fase inicial. Há também sinais de uma bolha de investimentos envolvendo IA e computação quântica. Caso a IBM e a AMD consigam integrar com sucesso IA e computação quântica, isso pode abrir caminho para avanços disruptivos no futuro.
O MongoDB registrou uma receita total de US$ 591,4 milhões no 2º trimestre do ano fiscal de 2026, um aumento de 24% em relação ao ano anterior. A receita de assinaturas foi de US$ 572,4 milhões (+23%) e os serviços geraram US$ 19 milhões (+33%). O lucro bruto do trimestre foi de US$ 420 milhões, com uma margem de 71%, ligeiramente inferior aos 73% do ano anterior. O lucro bruto não-GAAP foi de US$ 436,4 milhões, com margem de 74%. As perdas operacionais caíram para US$ 65,3 milhões, enquanto a receita operacional não-GAAP atingiu US$ 86,8 milhões, um aumento de 65% em relação ao ano anterior. Até 31 de julho de 2025, o MongoDB possuía US$ 2,3 bilhões em caixa e equivalentes.
Comentário:
A estratégia de IA do MongoDB impulsionou o rápido crescimento do banco de dados em nuvem Atlas. No 2º trimestre, 74% da receita total veio do Atlas, um crescimento anual de 29%. O número de clientes atingiu 59.900, com 2.800 novos clientes adicionados somente neste trimestre.
O banco de dados de documentos NoSQL do MongoDB se destaca por sua flexibilidade e alto desempenho, sendo ideal para cargas de trabalho de IA, como busca vetorial, armazenamento de dados para IA generativa e inferência em tempo real.
A explosão na demanda por inferência também acelerou o crescimento do MongoDB. No entanto, a expansão da infraestrutura de nuvem e o desenvolvimento de novos recursos de IA elevaram os custos operacionais. Competir com gigantes como Google, AWS e Microsoft continuará sendo um desafio, exigindo que o MongoDB adote estratégias inovadoras para manter sua vantagem competitiva.
Para mais insights sobre IA, tendências de tecnologia e análises de negócios, acesse:
https://iaiseek.com
Leia também os principais acontecimentos no mundo da IA nas últimas 72 horas: