2025年1月28日·24小时AI动态:英伟达“非核心”牵手英特尔、DeepSeek-OCR 2冲击RPA、Qwen3-Max-Thinking破万亿、云厂商涨价宣告价格战退场

今天的四条信息,指向同一个结论:AI 产业正在从“拼模型参数”进入“拼供应链韧性、企业可用性与成本曲线”的阶段。芯片制造要分散风险,OCR 要能落地到流程自动化,大模型要跑出可复用的商业闭环,云厂商则开始把 AI 资源拉回“价值定价”。

1. 英伟达预计 2028 年 Feynman 架构将与英特尔合作,采取“量少、低阶、非核心”策略

点评:
这更像英伟达的“供应链韧性 + 谈判筹码”工程,而不是对核心制造路线的迁移。Feynman 的核心 GPU Die 仍由台积电代工,而 I/O Die 则部分采用英特尔 18A 或 14A 制程。
英伟达用有限合作满足合规与多元化需求,但把决定长期竞争力的关键环节仍牢牢握在自己手里。对英特尔而言,即便是小量、非核心合作,也很关键:这是一张“被顶级客户选择”的验证名片,有利于后续争取更高端客户。
不过要放大成规模订单,英特尔必须持续兑现良率、交付稳定性、成本与生态配套;这些维度目前与台积电仍存在差距。英特尔能把这种“样板合作”做成可复制订单吗?

2. DeepSeek 发布 DeepSeek-OCR 2:视觉编码器与“视觉因果流”机制升级

点评:
DeepSeek-OCR 2 的看点不只是识别率,而是其新视觉编码器 DeepEncoder V2 及引入的“视觉因果流”(Visual Causal Flow)机制——试图让模型从“像素扫描机”走向具备初步语义推理能力的“类人阅读者”。
如果它能把结构化输出与引用定位做扎实,将显著降低人工校对成本,直接抬高 RPA/Agent 工作流的可用性:文档、表格、票据、合同等场景会首先受益。
但是否称得上“重大突破”,最终要看三件事:复杂版式能否稳、低质输入能否扛、结构化输出能否长期可靠。你更看重 OCR 的准确率,还是“可引用、可结构化、可落地”的工程能力?

3. 阿里发布 Qwen3-Max-Thinking:总参数破 1T,内置 Thinking Mode

点评:
Qwen3-Max-Thinking 把总参数量推到 1T,预训练数据达 36T tokens,并强调内置“思考模式”:显式生成多步推理与自我校验后再输出结论。
但大模型进入“超大规模”后,真正的门槛不在发布时的指标,而在长期运行:激活成本能否压住、推理稳定性是否可信、以及能否在阿里生态与企业场景里跑出可复用闭环价值。
另外,“不分上下”的对标叙事很容易引发预期管理问题——市场最终会用可复现评测、真实工作负载与单位成本来重新定价。你更愿意为“更强推理”付更高成本吗?

4. 谷歌云宣布涨价并跟进 AWS:全球云价格战进入分层时代

点评:
谷歌云宣布将于 2026 年 5 月 1 日起上调全球数据传输价格:北美费率翻倍(0.04→0.08 美元/GiB),欧洲与亚洲涨幅分别约 60% 与 42%。在训练/推理带来跨区域流量激增、HBM 价格大幅上涨、高端 GPU 紧张、数据中心电力与液冷投入攀升的背景下,云厂商很难再用旧的价格战模式维持利润。
更关键的是,这不是单纯“成本转嫁”,而是 AI 时代云计算商业逻辑重构的信号:AI 相关资源进入价值定价与供给管理;通用云则可能以更隐蔽、合同化的方式维持竞争。
下一个会跟进上调的,会是微软云吗?

结尾:
把四条放在一起看,你会发现 AI 的竞争重心正在迁移:从“发布更大模型”转向“用更稳的供应链、更低的单位成本、更强的企业可用性”把能力交付出去。接下来,最值得盯的不是谁又发了新模型,而是谁能把模型与算力变成可规模化、可盈利、可持续的长期供给。

延伸阅读(过去72小时最重要的AI事件):

作者: Aedi创作时间: 2026-01-28 06:59:33
阅读更多