今日AI资讯 |快手发布全球首部 AI 单元故事集《新世界加载中》,开启 AIGC 微短剧 2.0 新纪元
作者:微信文章2025.6.29
·谷歌推出开源AI编程工具Gemini CLI,标志着AI编程领域的重大进展
·小米发布首款AI智能眼镜,拓展智能穿戴设备的应用场景
·科大讯飞升级AI声音复刻技术,进一步巩固全球语音领域的领导地位
·快手开源Kwai Keye-VL模型,实现视频理解领域的新突破
·快手首映全球首部AI单元故事集《新世界加载中》,推动AI与影视行业的深度融合
世界新技术
谷歌推出开源AI编程工具Gemini CLI
谷歌于2025年6月26日推出开源且免费的AI编程工具Gemini CLI,允许用户在终端中访问Gemini,支持100万上下文窗口、每分钟60次请求和每日1000次上限。该工具不仅能编程,还可生成视频和处理多模态任务,迅速引发热议,GitHub标星暴增至10.8k。如何利用Gemini CLI进行多模态任务处理成为关注的焦点。Gemini CLI的功能包括代码理解、文件操作和动态故障排除,遵循Apache 2.0协议,标志着谷歌在AI编程领域的重大进展。AI开源工具的推出进一步推动了技术的发展。
小米发布首款AI智能眼镜小米于2025年6月26日发布了首款AI智能眼镜,定位为年轻人的个人智能设备,支持语音通话、拍照录像,重量约40克。AI智能眼镜的功能与应用场景包括美观与实用的设计,提供电致变色镜片选项,续航可达8.6小时,售价1999元起。小米还与多个平台合作,实现直播功能,进一步拓展了智能眼镜的应用场景。此产品标志着小米在智能穿戴设备领域的重要进展。
科大讯飞升级AI声音复刻技术科大讯飞于2025年6月26日升级其AI声音复刻技术,推出新一代音色、停顿和口头禅的准确复刻能力,用户仅需10秒音频即可创建个性化的AI发音人。这项技术在智能驾驶中的应用也备受关注,已在讯飞开放平台上线,支持多种语言和方言,广泛应用于智能驾驶和教育等领域。科大讯飞在语音技术上屡获国家级奖项,进一步巩固其在全球语音领域的领导地位。
AI新奇事
快手Kwai Keye-VL开源,视频理解新突破
快手推出的多模态大语言模型Kwai Keye-VL于2025年6月26日正式开源,展现出卓越的视频理解和逻辑推理能力,充分体现了AI在视频理解中的应用与优势。该模型能自动解析图像并生成销售方案,支持动态分辨率输入,融合文本、图像和视频信息。Kwai Keye-VL如何利用AI提升多模态信息处理能力,在高考数学卷中获得140分,且在多项Benchmark测试中表现优异,超越同类模型,推动视频理解领域的技术革新。
快手首映AI单元故事集《新世界》
2025年6月25日,快手在北京首映全球首部AI单元故事集《新世界加载中》,标志着AIGC领域的里程碑。该剧集由快手可灵AI与异类Outliers团队制作,包含7部多元题材的短剧,总时长180分钟。可灵AI的应用不仅提升了创作效率和艺术表现力,还展示了AI如何提升影视内容创作效率,推动AI与影视行业的深度融合,开启了AI影视内容创作的2.0时代。展望2025年AI单元故事集的发展趋势,未来,快手将持续支持AIGC微短剧的创新与发展。
本文章内容及图片部分来源于网络,如有侵权请联系删除。
页:
[1]