【AI「视觉图灵」时代来了;国家超算互联网正式上线DeepSeek;OpenAI首个智能体提前曝光丨AI速递】萍聚社区-德国热线-德国实用信息网人工智能

新闻发表于 2025-2-8 06:38

AI「视觉图灵」时代来了;国家超算互联网正式上线DeepSeek;OpenAI首个智能体提前曝光丨AI速递

作者：微信文章

Hi,

FUTURE

AIGC周报

Weekly AI NewsExpress

数字未来事务所

DIGITAL FUTURE AGENCY

2025.02.02-2025.02.06

本周AI行业前沿速递

PART.01

AI「视觉图灵」时代来了

字节跳动推出了OmniHuman-1

DFA

‍‍‍‍‍‍‍‍字节跳动推出的OmniHuman技术，仅需一张图片和一段音频，就能生成高质量的人物视频。该技术能够支持任意尺寸和人物占比的图片输入，无论是肖像、半身还是全身，都能通过单个模型生成与音频匹配的动作，包括演讲、唱歌、乐器演奏等。

OmniHuman采用Omni-Conditions Training混合多模态训练策略，逐步加入文本、图像、音频和姿态等模态进行训练，从而扩大可训练数据规模。此外，OmniHuman在手势生成方面相比现有方案有显著提升，还支持动漫和3D卡通等非真人图片输入，生成的视频能够保持输入图片的特定风格和运动模式。目前，OmniHuman技术已落地即梦AI，并即将开启内测。‍

video: https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3844267469266419713

PART.02

国家超算互联网

正式上线DeepSeek

DFA

国家超算互联网平台近期上线了DeepSeek系列多款大模型，供全民使用。此次上线的模型包括基于Qwen的7B、14B和32B三个蒸馏版本，以及DeepSeek-R1、V3、Coder等多个系列。这些模型支持一键推理服务，无需本地下载，用户还可根据私有化需求引入专有数据进行定制化训练。

国家超算互联网平台通过连接各地超算中心，组建生态系统并实现智能调度，能够将全国算力资源进行统一调配。平台将分散的计算力资源整合共享，突破算力上限，极大地降低了企业和个人使用AI算力服务的门槛。

PART.03

OpenAI首个智能体提前曝光

DFA

据外媒爆料，OpenAI暗藏的首个智能体项目「Operator」即将发布。这款AI智能体将与ChatGPT深度集成，能够接管用户的屏幕，自动化完成各种任务。此外，OpenAI还在秘密研发一款高级AI编码智能体，其能力有望媲美L6级软件工程师。L6级工程师通常需要10年以上的工作经验，能够解决复杂的系统优化、代码重构等任务。这款高级AI编码智能体不仅可以处理复杂的编程任务，还能通过工具（如Slack）与工程师交互，而不仅仅是简单地输出代码。

AI编码智能体被认为是大模型最具前景的领域之一。亚马逊曾表示，通过AI编码技术，他们节省了相当于4500人年的开发量。然而，尽管AI编码技术在某些方面取得了显著进展，但在处理复杂任务时仍存在局限性。

PART.04

谷歌发布Gemini 2.0 Pro

DFA

近日，谷歌发布Gemini 2.0 Flash Thinking加强版，在多个关键性能上实现重大突破。该模型支持1M token长上下文理解，极大拓宽了处理信息的范围，同时强化了自我纠错能力，能更精准地输出内容。在综合能力测评中，Gemini 2.0 Flash Thinking成绩斐然，再次登顶 Chatbot Arena排行榜。其数学、科学和多模态推理能力显著提升，数学成绩较之前提升了54%，在推理过程中还能保持连贯思维，灵活运用上下文信息，为用户提供更智能、更准确的交互体验。

不仅如此，谷歌还推出Google AI Studio统一平台，整合了API、开发和调优功能，旨在打造全面均衡的通用模型，为开发者提供一站式服务，助力AI应用的高效开发。同时，谷歌通过Project Mariner项目，持续增强多模态交互能力，推动AI在多领域的融合与创新，为用户带来更丰富、更自然的交互体验。

PART.05

OpenAI 发布的全新智能体

Deep Research

DFA

2月3日，OpenAI在东京举行特别活动，正式发布了其最新研究成果——Deep Research（深度研究）。这一功能旨在利用多步骤互联网研究能力，彻底革新知识工作，并为实现通用人工智能（AGI）愿景迈出关键一步。

Deep Research是一种能够进行多步骤互联网研究的模型。它能够自主地发现内容、整合内容，并基于内容进行推理。在信息不断涌现的过程中，Deep Research可以动态调整研究计划。该模型基于OpenAI即将推出的o3模型的优化版本构建，专门针对网页浏览和数据分析进行了优化。

Deep Research的推出将深刻变革知识工作，助力企业流程优化，提升员工效率，并最终惠及广大消费者。它能够在短时间内（通常5-30分钟）完成高质量的研究报告，适用于金融分析、学术研究、政策解读等多个领域。

PART.06

OpenAI免费开放ChatGPT搜索

无需注册

DFA

2月6日消息，OpenAI宣布向所有用户开放ChatGPT搜索功能，无需注册。ChatGPT强大的搜索功能直接威胁了谷歌搜索。ChatGPT搜索可以更快抓取网络信息，能实现分钟级别的解析。

付费订阅者、SearchGPT候补名单上的用户将获得可联网的实时对话信息能力，免费用户、企业用户和教育用户也将在未来几周内陆续获得访问权限。

FUTURE

PART.07

Figure机器人公司宣布

宣布终止与OpenAI的合作

DFA

近日，硅谷人形机器人公司Figure宣布终止与人工智能巨头OpenAI的合作。Figure表示，OpenAI的通用大模型并不适合具身智能的需求，而公司需要构建一个端到端的垂直整合AI系统。此外，OpenAI近期重组了机器人团队，并申请了与人形机器人相关的商标，其在人形机器人领域的“多点下注”策略引发了与Figure的竞争关系，促使Figure寻求独立。

Figure声称已在端到端AI技术上取得了重大突破，并计划在未来30天内展示一些“人形机器人上从未见过的东西”。目前，Figure的估值已达到26亿美元，且累计融资15亿美元，这些资金将支持其加速自主研发

图片素材出自互联网版权归原作者所有 #数字未来事务所# 整合编译欢迎分享至朋友圈投稿/合作请留言或公众号菜单栏添加微信

https://mmbiz.qpic.cn/mmbiz_png/ZfQy6sNMuhQ8CwfMv0iagUlaZSLAeuFD62QAfIiaInKYIlc2KwEMB8vxvqJSniaayEia9a1xua4DytqEY0ZiciaWNvBA/640?wx_fmt=other&wxfrom=5&wx_lazy=1&wx_co=1&tp=webp

https://mmbiz.qpic.cn/mmbiz_png/ZfQy6sNMuhRZcHNBeOQ5HwIzsfApUjEIUX8dwL4opcWMM6v5V8nwr9DP7Tvo6ovQkUpORsiabkpIPics5Qd2FGhw/640?wx_fmt=other&from=appmsg&wxfrom=5&wx_lazy=1&wx_co=1&tp=webp

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI「视觉图灵」时代来了;国家超算互联网正式上线DeepSeek;OpenAI首个智能体提前曝光丨AI速递