萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 189|回复: 0

前行者|中软国际金融AI实验室主任简仁贤:DeepSeek将推动AI Agent生态爆发

[复制链接]
发表于 2025-2-17 19:14 | 显示全部楼层 |阅读模式
作者:微信文章

“计算机技术的发展史告诉我们,当更多的计算能力交到开发者手中时,他们总能发掘出新的应用场景和更多的任务去解决以前所解决不了的问题,或者是更高程度的优化以前的Solution。”
——中软国际金融AI实验室主任简仁贤
近日,中软国际金融AI实验室主任简仁贤接受凤凰卫视直播访问,对deepseek突破创新及对产业影响发表观点

小执:‍‍

欢迎简总做客《前行者》访谈栏目!最近DeepSeek迅速出圈火爆全球,前不久您也刚接受了凤凰卫视直播间访问。请问DeepSeek到底好在哪里?又会带来怎样的影响?

简仁贤:DeepSeek凭借低成本、高效能的全开源模式,打破了训练大语言模型需巨额投入,和大语言模型只有闭源模型才能够做得最好的迷思。DeepSeek-V3基础模型通过混合精度优化、混合专家模型等技术,将训练成本降低至十分之一甚至二十分之一;R1推理模型则通过多阶段训练大幅降低推理成本,显著降低了AI模型开发的门槛。全开源优势让开发者可直接基于现有成果微调,无需从零训练。这些技术使DeepSeek以不到600万美元成本训练出与上亿美元模型相当的性能,掀起了一场AI革命。
今年,DeepSeek带来的几个重大的趋势会更为明显。闭源模型(如OpenAI)主导的"黑盒时代"正在终结,开源模型将成为主流;高端训练芯片需求增长放缓,推理芯片市场爆发;AI Agent将进一步繁荣,以及由此带来的对数据中心和GPU计算资源的需求将持续上升。

小执:

您能具体阐释下DeepSeek带来的这几点影响吗?
简仁贤:DeepSeek的技术架构显著降低了对高端硬件的依赖。传统大模型训练需数千块高端GPU,而DeepSeek通过优化算法,使得中小机构甚至可用消费级显卡(如NVIDIA 4090)进行微调。低功耗、低成本显卡(如未来NVIDIA 5090/6090)将成为主流,Mac mini等设备已能流畅运行DeepSeek 7B/14B模型。芯片毛利率或从当前的92%高位回落,推动硬件普惠化。由此,DeepSeek-R1增强技术进一步释放潜力:通过注入领域专家数据(如医疗、法律、金融的链式思考数据),开发者能快速训练出专业级模型,每个企业都可拥有专属智能体。软件架构开始深度集成开源模型生态,DeepSeek的开源模式和多模态分析技术也将催生更多创新应用,一些缺乏透明度的闭源公司可能面临泡沫化风险,被迫转向开源架构或垂直场景。企业可企业通过云端算力资源与本地化部署结合,自主部署本地模型,摆脱对云端模型API的依赖,实现"模型自由"。预计全球将有超10万家企业基于其模型开发定制化智能体(如投资分析Agent、医疗诊断Agent),中小型企业首次获得与大厂对等的AI能力。软件行业迎来模型应用定制化服务红利期。结合低训练成本与开源生态,可负担的通用人工智能(Affordable AGI)将成为现实。DeepSeek通过创新的技术整合(如混合专家模型、混合精度计算等),在保持强大推理能力的同时,大幅降低了AI模型的训练和推理成本,降幅达50-60倍,调用价格也降低了96.3%。尽管单次计算成本下降,根据杰文斯悖论,技术效率提升往往会刺激需求增长。随着AI在各行各业的广泛应用(如医疗、教育、金融等),更多的场景模型和AI智能体将涌现,带动数据中心、边缘及端侧算力建设,驱动算力整体需求增长。

小执:

基于以上改变,您对政府/企业决策者有什么建议?
简仁贤:从微软、亚马逊、英伟达等科技巨头,到Perplexity等企业都已经上线DeepSeek,再到600万美元训练顶尖模型的成本突破,这场由开源力量驱动的变革,正在重构全球AI产业格局,从芯片、软件到商业模式的未来的软件的范式将因此革新。全球AI正实现从“主权AI”到平权AI”,开启一个前所未有的创新爆炸时代。对于决策者而言,理解DeepSeek的技术贡献与逻辑至关重要,在技术层,优先采用开源架构,建立本地化模型部署能力,避免受制于闭源服务商;在战略层,聚焦高质量领域数据积累,利用R1推理能力打造垂直场景护城河;在生态层,参与开源社区协作,推动模块化Agent开发,抢占AI软件新生态的先机。

小执:

对此,中软国际有什么举措?
简仁贤:目前,中软国际已将自主研发的JointPilot人工智能平台接入DeepSeek-R1,中软国际模型工场基于昇腾云、DeepSeek模型,推出升级版一站式AI解决方案服务。例如,在金融领域,可助力智能风险评估、精准客户营销;在制造业,可赋能设备故障预测、生产流程优化;在医疗领域,可实现智能诊断、辅助治疗决策等,进一步提升企业生产效率、打造新质生产力。中软国际科创中心以“DeepSeek+昇腾”为引擎,将DeepSeek全参模型满血版部署在全国产化智算环境中,实现671B参数的DeepSeek模型稳定运行,并面向社会提供DeepSeek的昇腾迁移、模型部署、模型蒸馏、模型精调、SAAS应用、Agent开发等多样化AI服务。未来,中软国际也将帮助企业和开发者把更多以DeepSeek-R1为代表的推理模型接入实际应用场景,更广泛的满足生产级、高要求场景的业务提效需求,并助力各个领域提供服务,各行各业推出更多适配场景的AI应用和服务。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-3-11 20:09 , Processed in 0.058305 second(s), 16 queries , MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表