金吾财讯

金吾财讯 | 第一上海发研报指，近期，阿里巴巴(09988)正式发布新一代Qwen-3系列大模型，在性能和推理效率上均进行了优化，满足从边缘端到服务器端不同场景下的推理需求。DeepSeek发布DeepSeek-Prover-V2-671B模型，专注于形式化数学推理应用。小米开源其首个为推理而生的大模型Xiaomi MiMo，在数学推理和代码竞赛上取得优秀表现。此外，业界预期DeepSeek R2有望在5月亮相，预计仍将采用MoE模式，但是训练参数量将达到1.2万亿，相比R1有接近翻倍的提升。据传该大模型将由全国产算力训练完成，不依赖英伟达芯片。

该行认为，在年初DeepSeek掀起推理应用浪潮下，国产大模型在应用端的能力持续提升，AI应用有望广泛落地，推理算力需求持续强化。同时，在美国限制H20出口的情况下，国产算力成为进口替代的不二之选。该行继续看好国产算力的替代机会。建议关注后续互联网大厂，以及金融、电信等行业的招标情况。