我爱免费 发表于 2025-6-4 23:56

AI日报 | 2025年06月04日 星期三 

作者:微信文章
技术革新日新月异,全球AI动态一手掌握!



1. 🤖 OpenAI编程神器Codex大升级!

   - 联网操作:开发者开启权限后,Codex可自动安装依赖包、运行外部测试(默认关闭保障安全);

   - 语音输入:动动嘴即可布置编程任务,提升交互效率;

   - 开放范围扩大:原仅限企业用户,现ChatGPT Plus会员($20/月)可用;

   - 底层优化:PR自动更新、错误提示优化,任务差异限制提升至5MB。

   *👉 程序员生产力再飞跃!*

2. 🎬 智源开源Video-XL-2:单卡处理万帧视频!

   - 性能突破:编码2048帧视频仅需12秒,效率提升显著;

   - 开源领先:在MLVU、Video-MME等长视频评测中超越同级模型,接近720亿参数大模型表现;

   - 应用场景:影视分析、安防监测、游戏直播总结等长时序任务潜力巨大。

   *🚀 开源视频理解迈入新纪元!*

3. 👁️ 谷歌Gemini Live登陆iOS!实时看懂你的屏幕

   - 功能上线:支持实时视频解读(如识别陶器釉料颜色)及屏幕共享分析;

   - 地区限制:目前仅限美国用户免费体验,安卓版已全面开放;

   - 对标竞品:直接挑战OpenAI高级语音模式的视频对话功能。

   *📱 手机交互进入“所见即所得”时代~*

4. 💻 英伟达特供中国芯片B30曝光!

   - 定制策略:基于Blackwell架构,支持多GPU扩展构建计算集群;

   - 性价比路线:采用GDDR7显存(非HBM),预计定价$6500-$8000,较H20降价30%;

   - 技术悬念:多GPU互联或依赖ConnectX-8 SuperNICs技术(非NVLink)。

   *🇨🇳 中国市场争夺战再升级!*

5. ⚡ 英伟达Fast-dLLM:推理提速最高27.6倍!

   - 技术亮点:通过块状KV缓存+置信度解码策略,解决扩散模型并行生成质量衰退问题;

   - 实测数据:在GSM8K数学推理任务(1024 token)中加速27.6倍,准确率76%;

   - 零训练成本:即插即用兼容LLaDA、Dream等扩散模型。

   *🔥 自回归模型迎来强劲对手!*

6. 🎥 微软Bing推出Sora视频创作工具!

   - 移动端友好:支持生成5秒竖屏短视频,适配社交平台传播;

   - 免费额度:非订阅用户可创建10个视频片段;

   - 生态整合:依托OpenAI Sora模型,降低AI视频创作门槛。

   *✨ 人人都是短视频导演~*

7. 🎧 Hume AI语音模型EVI 3:情感交互天花板

   - 多维优化:在情感识别、自然对话、响应速度等7项指标超越GPT-4o;

   - 实时智能:对话中同步调用工具搜索答案,延迟低至300毫秒;

   - 个性化定制:10万语音样本库支持生成“老派喜剧演员”等特色声线。

   *❤️ 让AI真正“懂”你的情绪!*

🔍 今日话题

> *哪项技术最可能改变你的工作/生活?欢迎留言讨论!*

> `AI编程` `多模态模型` `芯片国产化` `语音交互革命`
页: [1]
查看完整版本: AI日报 | 2025年06月04日 星期三