我爱免费 发表于 2025-6-30 18:05

AI大模型:基于Tokens调用量和付费变化的分析,判断AI大模型商业化的进展和应用趋势

作者:微信文章


幻影视界今天分享的是计算机行业GenAI系列(十二):《基于Tokens调用量和付费变化的分析,判断AI大模型商业化的进展和应用趋势》,报告由广发证券发布。

本报告共计:51页。完整版PDF电子版报告下载方式见文末。
研究报告内容摘要如下

基于Tokens使用量来收费的各类AI应用给模型厂商贡献营收快速增长。

我们以谷歌Gemini和豆包大模型作为典型案例,分析其tokens和用户量的增长趋势并对产品可实现的营收进行敏感性分析。(1)Gemini大模型tokens调用带来的月度收入由2024年的千万美元级别有望提升到了2025年的亿美元级别,增长幅度有望达3-5倍。(2)豆包大模型tokens调用带来的月度收入由2024年的百万人民币级别有望提升到了2025年的千万至亿人民币级别,增长幅度有望达10-20倍。


从分析结果来看,以上两个大模型2025年营收规模较2024年有望大幅提升。这反映了AI应用商业化落地给模型厂商贡献的营收呈快速增长趋势。但另一方面,AI大模型tokens的调用带来营收的绝对金额以及占相关公司总体营收比例仍然较小。此外,为了支持tokens的调用,科技公司的资本开支仍需要维持在高位。2025Q1,谷歌资本开支172亿美元。随着用户数量和tokens规模的增加,算力的投入需要持续,这给科技公司短期ROI带来了一定挑战。






AI大模型的代码生成、高阶推理等功能在下游应用的重要性持续提升。2025 年以来,开发类需求呈现出快速增长的趋势。截止2025 年5 月,使用Gemini API 接口开发各类AI 应用的开发者已超过700 万,是去年同期开发者数量的5 倍。从ChatGPT 的使用趋势我们也观察到同样的情况,2025 年5 月,通用型的研究、科学研究、代码辅助等场景占ChatGPT 的使用比例分别为36.5%、18.4%和14.5%,高于邮件撰写和文案写作等场景。总体而言,代码生成、视觉理解、高阶推理等能够解决下游用户实际问题的功能在下游用户使用频次和用户数量都呈快速增长趋势。





豆包大模型Tokens 量价分析和营收测算

字节跳动多线布局AI大模型,Tokens调用量居国内AI大模型首位。根据火山引擎官微数据,2024年5月,豆包大模型日均tokens使用量为1200亿,到2025年5月增至16.4亿,居国内AI大模型行业首位。我们认为,公司在AI大模型实现了从模型层到平台层再到应用层全栈布局,这是使得其调用量持续攀升的主要原因。在模型层,主要集中在机器翻译、智能语音、视频图像和多模态四个领域;在平台层,火山引擎发布了机器学习平台升级版,在数据管理、资源管理、流程和模型三大领域具备核心优势;在应用层,火山方舟和豆包能提供智能创作、智能体验以及智能营销等服务,辅助在字节的内容和娱乐体系内推动客户业务增长。






AI 大模型幻觉持续下降,B 端AI 应用的接受度有望提升。AI 幻觉是导致AI 大模型较难在医疗、制造业等领域应用的主要原因。各家厂商尝试了多种方法来降低AI 大模型的幻觉。RLHF(基于人类反馈的强化学习)、MoE(混合专家)架构等新的训练方法的采用有效降低了AI 大模型的幻觉,在通用问题方面的回答效果显著提升。随着训练路径与模型架构的不断优化,各大模型“幻觉”有望持续下降,有望拓展和深化各 行业应用场景。



OpenAI的用户规模呈现稳定增长的趋势。OpenAI推出的o3、GPT-4o等模型性能持续提升,功能不断丰富,从而驱动其用户规模持续增长。OpenAI月活用户数量由2024 年5月的3.7亿人,增长至2025年5月的5.2亿人。根据Intelliarts的数据,截止2025年1月,目前已有超92%的全球500强企业接入ChatGPT API,涵盖金融、医疗、制造等核心领域,包括可口可乐、Shopify、Snapchat、PwC、Quizlet、Canva和Zapier 等知名公司。



根据SimilarWeb的数据,在各类AI大模型的应用中,2025年以来,增速最快的是代码编程和软件开发。软件开发本身高度标准化、流程化,代码编写、测试、调试、文档生成等环节工作量大且重复性高,AI大模型能够提升开发效率,减少人工投入。其次,AI与开发工具的适配性较强,代码编辑器、IDE等工具可以低成本地嵌入大模型功能,易于落地。当前,在AI大模型赋能软件的相关应用主要分为两大类,一类是以GitHub Copilot为代表,在既有的IDE软件上加上AI代码生成功能的模块;另一类是以Cursor为代表AI代码生成功能突出的IDE工具。



AI模型厂商和互联网公司AI大模型的商业化策略不同。我们对比OpenAI和谷歌两家厂商AI大模型的商业化策略,可以发现明显差异。OpenAI的业务以大模型为主,较为单一,其商业化则主要依赖于Tokens调用规模以及价格。因此,保持AI大模型在功能和性能的绝对领先地位尤其重要。OpenAI凭借o3、GPT-4o等模型在功能和性能上的优势,不仅可以定较高的tokens的调用价格来推动商业化,还巩固了其生态优势和市场地位。从SimilarWeb的访问量数据来看,OpenAI的大模型日均访问量远超过其他厂商大模型访问量的总和,领先优势明显。而Gemini大模型的调用价格在行业中并不高,这或许与其在谷歌AI产品商业推广战略的定位不同有关。一方面,Gemini作为效率工具,对内赋能各业务线推动产品升级和成本节省,截止2025年5月,Gemini已应用于谷歌旗下15款用户量超5亿的产品中;另一方面,Gemini作为谷歌AI产品商业化的入口,引导下游用户使用Vertex AI 和AI Studio中的AI工具带动云业务的商业化。根据谷歌财报,25Q1,谷歌云营收122.6亿美元,同比增长28.1%。这与此前计算的Gemini大模型tokens调用量的营收在亿美元级别形成了鲜明对比。我们认为,由Gemini大模型撬动整体AI相关收入的增长或许是更符合谷歌整体AI商业化拓展的策略。



国内视频生成类AI 大模型持续迭代,可灵AI 用户规模快速提升

视频生成AI大模型用户规模快速增长。随着扩散模型和Transformer模型技术的逐渐成熟,国内外视频生成类大模型持续迭代。2024年2月,OpenAI发布首款视频生成模型Sora,可实现一分钟时长视频的自动生成。2024年6月,快手也推出了视频生成类AI大模型可灵。根据快手官网,可灵AI自2024年6月上线至2025年4月的10个月时间里,月活用户数量增长25倍,全球用户规模已突破2200万。这些用户在可灵AI 的平台上创作了1.68亿个视频和3.44亿张图片。根据SimilarWeb的数据,2025年以来,可灵AI在全球视频生成大模型中的访问量居全球首位。



AI 大模型幻觉持续下降,B 端AI 应用的接受度有望提升

生成内容的“幻觉率”是决定其能否在更多垂直领域落地的关键指标。不同行业对于AI大模型幻觉率的接受程度不同。在医疗领域,其与生命安全密切相关的行业特殊性决定了医疗行业用户对幻觉容忍度较低;在制造业领域,生产制造环节对于数据精度的高要求也使得该行业客户对幻觉的容忍度较低。我们认为,AI幻觉是导致AI大模型较难在医疗、制造业等领域应用的主要原因。采用过程监督的强化学习或某一特定领域数据训练等方式有效降低AI大模型的幻觉,幻觉率下降到一定程度后,有望拓展和深化各行业应用场景。



AI大模型生成内容的“幻觉”持续下降。根据测评机构SuperCLUE的数据,深度求索公司25年5月28日推出的DeepSeek-R1-0528较25年1月2日推出的R1大模型的幻觉比率下降了7.16个百分点,降低至13.86%。且新版DeepSeek-R1在文本摘要、阅读理解、多问本回答和对话补全四个基准任务上的幻觉现象均有不同程度的改善。其中,文本摘要和阅读理解任务的幻觉率降低最为显著,分别降低了9.27%和14.49%。随着训练路径与模型架构的不断优化,各大模型“幻觉”有望持续下降,这为国内 大模型在各场景的商业化拓展奠定了较好的基础。



幻影视界整理分享报告原文节选如下:





















本文仅供参考,不代表我们的任何投资建议。幻影视界整理分享的资料仅推荐阅读,用户获取的资料仅供个人学习,如需使用请参阅报告原文。幻影视界行业报告资源库,每天分享实用资源。扫描下方二维码加入后,直接搜索下载,海量的历史资料随时查看、随意下载。

免责声明:以上报告均系本平台通过公开、合法渠道获得,报告版权归原撰写/发布机构所有,如涉侵权, 请联系我们及时删除;内容为推荐阅读,仅供参考学习,如对内容存疑,请与原撰写/发布机构联系。

戳“阅读原文”下载报告。
页: [1]
查看完整版本: AI大模型:基于Tokens调用量和付费变化的分析,判断AI大模型商业化的进展和应用趋势