【AI日报 | 2025年06月04日星期三】萍聚社区-德国热线-德国实用信息网人工智能

我爱免费 发表于 2025-6-4 22:56

AI日报 | 2025年06月04日星期三

作者：微信文章
技术革新日新月异，全球AI动态一手掌握！

1. 🤖 OpenAI编程神器Codex大升级！

- 联网操作：开发者开启权限后，Codex可自动安装依赖包、运行外部测试（默认关闭保障安全）；

- 语音输入：动动嘴即可布置编程任务，提升交互效率；

- 开放范围扩大：原仅限企业用户，现ChatGPT Plus会员（$20/月）可用；

- 底层优化：PR自动更新、错误提示优化，任务差异限制提升至5MB。

*👉 程序员生产力再飞跃！*

2. 🎬 智源开源Video-XL-2：单卡处理万帧视频！

- 性能突破：编码2048帧视频仅需12秒，效率提升显著；

- 开源领先：在MLVU、Video-MME等长视频评测中超越同级模型，接近720亿参数大模型表现；

- 应用场景：影视分析、安防监测、游戏直播总结等长时序任务潜力巨大。

*🚀 开源视频理解迈入新纪元！*

3. 👁️ 谷歌Gemini Live登陆iOS！实时看懂你的屏幕

- 功能上线：支持实时视频解读（如识别陶器釉料颜色）及屏幕共享分析；

- 地区限制：目前仅限美国用户免费体验，安卓版已全面开放；

- 对标竞品：直接挑战OpenAI高级语音模式的视频对话功能。

*📱 手机交互进入“所见即所得”时代~*

4. 💻 英伟达特供中国芯片B30曝光！

- 定制策略：基于Blackwell架构，支持多GPU扩展构建计算集群；

- 性价比路线：采用GDDR7显存（非HBM），预计定价$6500-$8000，较H20降价30%；

- 技术悬念：多GPU互联或依赖ConnectX-8 SuperNICs技术（非NVLink）。

*🇨🇳 中国市场争夺战再升级！*

5. ⚡ 英伟达Fast-dLLM：推理提速最高27.6倍！

- 技术亮点：通过块状KV缓存+置信度解码策略，解决扩散模型并行生成质量衰退问题；

- 实测数据：在GSM8K数学推理任务（1024 token）中加速27.6倍，准确率76%；

- 零训练成本：即插即用兼容LLaDA、Dream等扩散模型。

*🔥 自回归模型迎来强劲对手！*

6. 🎥 微软Bing推出Sora视频创作工具！

- 移动端友好：支持生成5秒竖屏短视频，适配社交平台传播；

- 免费额度：非订阅用户可创建10个视频片段；

- 生态整合：依托OpenAI Sora模型，降低AI视频创作门槛。

*✨ 人人都是短视频导演~*

7. 🎧 Hume AI语音模型EVI 3：情感交互天花板

- 多维优化：在情感识别、自然对话、响应速度等7项指标超越GPT-4o；

- 实时智能：对话中同步调用工具搜索答案，延迟低至300毫秒；

- 个性化定制：10万语音样本库支持生成“老派喜剧演员”等特色声线。

*❤️ 让AI真正“懂”你的情绪！*

🔍 今日话题

> *哪项技术最可能改变你的工作/生活？欢迎留言讨论！*

> `AI编程` `多模态模型` `芯片国产化` `语音交互革命`

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI日报 | 2025年06月04日 星期三

AI日报 | 2025年06月04日星期三