新闻 发表于 2025-2-8 06:38

AI「视觉图灵」时代来了;国家超算互联网正式上线DeepSeek;OpenAI首个智能体提前曝光丨AI速递

作者:微信文章






Hi,

FUTURE

AIGC周报

Weekly AI NewsExpress

数字未来事务所

DIGITAL FUTURE AGENCY

2025.02.02-2025.02.06

本周AI行业前沿速递



PART.01

AI「视觉图灵」时代来了

字节跳动推出了OmniHuman-1

DFA

‍‍‍‍‍‍‍‍字节跳动推出的OmniHuman技术,仅需一张图片和一段音频,就能生成高质量的人物视频。该技术能够支持任意尺寸和人物占比的图片输入,无论是肖像、半身还是全身,都能通过单个模型生成与音频匹配的动作,包括演讲、唱歌、乐器演奏等。

OmniHuman采用Omni-Conditions Training混合多模态训练策略,逐步加入文本、图像、音频和姿态等模态进行训练,从而扩大可训练数据规模。此外,OmniHuman在手势生成方面相比现有方案有显著提升,还支持动漫和3D卡通等非真人图片输入,生成的视频能够保持输入图片的特定风格和运动模式。目前,OmniHuman技术已落地即梦AI,并即将开启内测。‍



video: https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3844267469266419713



PART.02

国家超算互联网

正式上线DeepSeek

DFA

国家超算互联网平台近期上线了DeepSeek系列多款大模型,供全民使用。此次上线的模型包括基于Qwen的7B、14B和32B三个蒸馏版本,以及DeepSeek-R1、V3、Coder等多个系列。这些模型支持一键推理服务,无需本地下载,用户还可根据私有化需求引入专有数据进行定制化训练。

国家超算互联网平台通过连接各地超算中心,组建生态系统并实现智能调度,能够将全国算力资源进行统一调配。平台将分散的计算力资源整合共享,突破算力上限,极大地降低了企业和个人使用AI算力服务的门槛。







PART.03

OpenAI首个智能体提前曝光

DFA

据外媒爆料,OpenAI暗藏的首个智能体项目「Operator」即将发布。这款AI智能体将与ChatGPT深度集成,能够接管用户的屏幕,自动化完成各种任务。此外,OpenAI还在秘密研发一款高级AI编码智能体,其能力有望媲美L6级软件工程师。L6级工程师通常需要10年以上的工作经验,能够解决复杂的系统优化、代码重构等任务。这款高级AI编码智能体不仅可以处理复杂的编程任务,还能通过工具(如Slack)与工程师交互,而不仅仅是简单地输出代码。

AI编码智能体被认为是大模型最具前景的领域之一。亚马逊曾表示,通过AI编码技术,他们节省了相当于4500人年的开发量。然而,尽管AI编码技术在某些方面取得了显著进展,但在处理复杂任务时仍存在局限性。







PART.04

谷歌发布Gemini 2.0 Pro

DFA

近日,谷歌发布Gemini 2.0 Flash Thinking加强版,在多个关键性能上实现重大突破。该模型支持1M token长上下文理解,极大拓宽了处理信息的范围,同时强化了自我纠错能力,能更精准地输出内容。在综合能力测评中,Gemini 2.0 Flash Thinking成绩斐然,再次登顶 Chatbot Arena排行榜。其数学、科学和多模态推理能力显著提升,数学成绩较之前提升了54%,在推理过程中还能保持连贯思维,灵活运用上下文信息,为用户提供更智能、更准确的交互体验。

不仅如此,谷歌还推出Google AI Studio统一平台,整合了API、开发和调优功能,旨在打造全面均衡的通用模型,为开发者提供一站式服务,助力AI应用的高效开发。同时,谷歌通过Project Mariner项目,持续增强多模态交互能力,推动AI在多领域的融合与创新,为用户带来更丰富、更自然的交互体验。







PART.05

OpenAI 发布的全新智能体

Deep Research

DFA

2月3日,OpenAI在东京举行特别活动,正式发布了其最新研究成果——Deep Research(深度研究)。这一功能旨在利用多步骤互联网研究能力,彻底革新知识工作,并为实现通用人工智能(AGI)愿景迈出关键一步。

Deep Research是一种能够进行多步骤互联网研究的模型。它能够自主地发现内容、整合内容,并基于内容进行推理。在信息不断涌现的过程中,Deep Research可以动态调整研究计划。该模型基于OpenAI即将推出的o3模型的优化版本构建,专门针对网页浏览和数据分析进行了优化。

Deep Research的推出将深刻变革知识工作,助力企业流程优化,提升员工效率,并最终惠及广大消费者。它能够在短时间内(通常5-30分钟)完成高质量的研究报告,适用于金融分析、学术研究、政策解读等多个领域。





PART.06

OpenAI免费开放ChatGPT搜索

无需注册

DFA

2月6日消息,OpenAI宣布向所有用户开放ChatGPT搜索功能,无需注册。ChatGPT强大的搜索功能直接威胁了谷歌搜索。ChatGPT搜索可以更快抓取网络信息,能实现分钟级别的解析。

付费订阅者、SearchGPT候补名单上的用户将获得可联网的实时对话信息能力,免费用户、企业用户和教育用户也将在未来几周内陆续获得访问权限。





FUTURE



PART.07

Figure机器人公司宣布

宣布终止与OpenAI的合作

DFA

近日,硅谷人形机器人公司Figure宣布终止与人工智能巨头OpenAI的合作。Figure表示,OpenAI的通用大模型并不适合具身智能的需求,而公司需要构建一个端到端的垂直整合AI系统。此外,OpenAI近期重组了机器人团队,并申请了与人形机器人相关的商标,其在人形机器人领域的“多点下注”策略引发了与Figure的竞争关系,促使Figure寻求独立。

Figure声称已在端到端AI技术上取得了重大突破,并计划在未来30天内展示一些“人形机器人上从未见过的东西”。目前,Figure的估值已达到26亿美元,且累计融资15亿美元,这些资金将支持其加速自主研发



图片素材出自互联网   版权归原作者所有 #数字未来事务所# 整合编译   欢迎分享至朋友圈 投稿/合作请留言 或 公众号菜单栏添加微信

https://mmbiz.qpic.cn/mmbiz_png/ZfQy6sNMuhQ8CwfMv0iagUlaZSLAeuFD62QAfIiaInKYIlc2KwEMB8vxvqJSniaayEia9a1xua4DytqEY0ZiciaWNvBA/640?wx_fmt=other&wxfrom=5&wx_lazy=1&wx_co=1&tp=webp







https://mmbiz.qpic.cn/mmbiz_png/ZfQy6sNMuhRZcHNBeOQ5HwIzsfApUjEIUX8dwL4opcWMM6v5V8nwr9DP7Tvo6ovQkUpORsiabkpIPics5Qd2FGhw/640?wx_fmt=other&from=appmsg&wxfrom=5&wx_lazy=1&wx_co=1&tp=webp
页: [1]
查看完整版本: AI「视觉图灵」时代来了;国家超算互联网正式上线DeepSeek;OpenAI首个智能体提前曝光丨AI速递