新闻 发表于 2025-3-8 14:43

2025年3月AI领域双突破:DeepSeek加速R2发布,阿里开源高性能推理模型

作者:微信文章
DeepSeek-R2模型或提前上线

国产AI企业DeepSeek原计划5月发布的新一代模型R2正加速推进,预计将提前面世。该模型聚焦编程能力与多语言推理优化,特别是提升英语以外语言的理解与生成能力,有望缩小国产大模型与海外竞品的差距,并推动国产芯片适配及AI一体机市场增长。不过,幻方量化相关人士回应称“以官方消息为准”,凸显企业对技术落地的审慎态度。



阿里通义千问QwQ-32B登顶开源社区

阿里巴巴于3月6日开源推理模型QwQ-32B,以320亿参数量实现与DeepSeek-R1(6710亿参数)相媲美的性能,尤其在数学推理与编程任务中表现突出。其突破性支持消费级显卡本地部署(如Mac Mini),大幅降低应用成本,并集成工具调用与动态推理能力,成为全球最大AI开源社区Hugging Face榜首模型。



行业影响

两大技术进展共同推动“小参数量、高性能”趋势,加速AI普惠化。DeepSeek-R2或重塑开发者工具生态,阿里开源策略则进一步降低企业技术门槛,为国产AI生态注入活力。

页: [1]
查看完整版本: 2025年3月AI领域双突破:DeepSeek加速R2发布,阿里开源高性能推理模型