我爱免费 发表于 2025-5-6 14:04

乌鸦AI日报:iOS18.6或为中国用户启用AI功能;OpenAI同意以30亿美元收购AI编码助Windsurf

作者:微信文章


知名苹果爆料人Mark Gurman透露,苹果AI有望在iOS 18.6系统中首次在中国大陆启用部分功能,背后将由阿里巴巴(BABA.US)和百度(BIDU.US)提供技术支持。

OpenAI近期宣布以约30亿美元收购人工智能编码助手Windsurf,此交易是其迄今为止最大的一笔收购,显示出其在AI领域的雄心和实力。

过去一天,国内外AI行业还有更多热点可以关注,乌鸦君带你一起看看。

/ 01 /

大模型

1)英伟达全新开源自动语音识别模型 Parakeet-TDT-0.6B-V2,语音转录能力再提升

英伟达推出的Parakeet-TDT-0.6B-V2模型在自动语音识别领域取得了显著进展。该模型结合开源理念与商业应用,提升了转录效率,能够在一秒内完成60分钟音频的转录,且其词错误率接近市场领先水平。

通过支持多种开发环境及优化多款GPU硬件,该模型为开发者提供了强大的工具,助力多样化的语音应用场景。

2)Suno v4.5正式上线,仅限付费用户使用,生成歌曲延长至8分钟

Suno音乐生成平台推出了其最新模型v4.5,专为Pro和Premier付费用户设计,显著提升了音质、风格多样性和用户体验。新版本支持更广泛的音乐风格,增强了声线表现和音效层次,同时延长了歌曲生成时长至8分钟。

尽管部分用户对付费限制表示遗憾,但也有人认为这一创新值得订阅。

3)Freepik 发布“F Lite”:一个为版权安全而构建的开放 AI 图像模型

Freepik最近推出了其文本到图像生成模型“F Lite”,旨在为因版权问题而备受争议的生成器提供合法且安全的替代方案。F Lite基于Freepik自有的商业授权图像库进行训练,拥有约100亿个参数。

尽管在生成插图和矢量风格作品方面表现出色,但在生成照片级逼真图像时仍存在不足。

/ 02 /

AI应用

1)iOS18.6或为中国用户启用AI功能 国行苹果AI或由阿里百度技术支持

知名苹果爆料人Mark Gurman透露,苹果AI有望在iOS 18.6系统中首次在中国大陆启用部分功能,背后将由阿里巴巴(BABA.US)和百度(BIDU.US)提供技术支持。

据悉,百度的文心一言大模型将作为中国市场苹果AI的核心云端智能引擎。与此同时,为确保AI内容符合国内法规,苹果还将引入由阿里巴巴提供的审查机制,对AI生成内容进行本地合规审核。

2)Excel MCP Server上线 可通过Claude等客户端直接操作Excel文件

一款名为Excel MCP Server的开源工具近日引发热议。这款基于MCP模型开发的服务器,允许用户通过AI助手直接操作Excel文件,无需安装微软Excel软件即可实现高效的表格处理。

该工具功能强大,支持创建、读取、修改Excel数据,生成图表和透视表,极大地方便了用户的表格处理工作。

3)谷歌Gemini聊天机器人全新升级:支持多图上传和图像编辑功能

谷歌的Gemini聊天机器人最近进行了重要的更新,新增了多图上传和AI图像编辑功能。该更新目前已向部分用户开放,允许在网页端同时上传多张图片,并对AI生成的图像进行编辑。

尽管这些功能尚未在所有账户中完全开放,但它们为用户提供了更大的创作灵活性,提升了整体用户体验。

4)新一代唇形同步工具KeySync发布:突破表情泄漏与遮挡难题

近日,一款名为KeySync的创新唇形同步工具正式亮相,迅速引发了视频内容创作领域的广泛关注。

KeySync是一款创新的唇形同步工具,成功解决了AI唇形同步中的表情泄漏和嘴部遮挡问题。其独特的两阶段框架设计使得唇部动作更加自然和精准,适用于影视制作、动画、虚拟主播等多个领域。

KeySync不仅支持高分辨率视频处理,还能自动生成与音频匹配的唇部动画,大幅提升工作效率。

5)Runway发布图像一致性参考功能 Gen-4References 支持提取人物、场景或风格特征及多图混合

Runway最近推出的Gen-4References功能为其AI视频生成模型增添了图像一致性参考能力,使创作者能够通过上传参考图像来提取人物、场景或风格特征,从而在生成内容中保持高度一致性。

这一功能支持多张图像的混合生成,为视频创作提供了更大的控制力与创意自由,极大地简化了设计流程,推动了AI在影视制作领域的应用。

6)Midjourney V7推出全新功能 “Omni-Reference”,让图像生成更灵活

Midjourney最近推出的“Omni-Reference”功能为图像生成带来了革命性的变化。它允许用户对图像元素进行精确控制,支持多种对象生成和灵活的权重调整,从而提升创作的自由度和一致性。

此功能不仅适用于艺术创作,还能在游戏开发、广告设计等多个领域发挥重要作用,展示出广泛的应用潜力。

7)Claude AI将升级:网页版酝酿支持MCP定制链接

近日,科技媒体TestingCatalog报道,Anthropic旗下的Claude网页应用将通过引入Model Context Protocol(MCP)进行重大升级。这一新协议旨在打破Claude在谷歌服务方面的限制,预计将为用户提供更灵活的使用体验。

MCP作为一种开放标准,将简化大型语言模型与外部数据源和工具之间的通信,提升AI助手的集成能力。

8)Claude 移动应用即将推出语音模式,支持多种声音选项

Claude 移动应用即将进行重要升级,推出备受期待的语音模式功能。该模式采用推按式对话,支持多种声音选项,并具备网页搜索能力,搜索结果以要点形式呈现,便于用户理解和跟进。

此外,用户可以上传文件作为上下文参考,提升了交互体验。

/ 03 /

投融资情报

1)OpenAI同意以30亿美元收购AI编码助Windsurf

OpenAI近期宣布以约30亿美元收购人工智能编码助手Windsurf,此交易是其迄今为止最大的一笔收购,显示出其在AI领域的雄心和实力。

Windsurf的技术在开发者社区中备受推崇,此次收购可能会引发行业内的广泛讨论,尤其是在OpenAI与其他AI编码助手之间的竞争关系上。

2)OpenAI 重返非营利模式,终止营利性实体控制机制

OpenAI 宣布重返非营利模式,结束营利性实体的控制,重组为公益公司。这一变动回应了外界对其商业化的担忧,尤其是来自埃隆·马斯克的批评。

新的治理结构将确保社会效益透明,同时允许继续吸引风险投资。OpenAI 计划利用这一模式成为全球最大的慈善实体之一,预计2024年营收将突破20亿美元。

整理/宇霁

PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。

页: [1]
查看完整版本: 乌鸦AI日报:iOS18.6或为中国用户启用AI功能;OpenAI同意以30亿美元收购AI编码助Windsurf