AI日报—— 一年之约已到 OpenAI 仍未发布其语音克隆工具 微软试图抛弃OpenAI?自研MAI模型并探索替代其方案
作者:微信文章Microsoft加码AI研发,自研MAI模型并探索替代OpenAI方案
据悉,目前微软正加速推进其AI战略,试图在与其长期合作伙伴OpenAI的竞争中占据主动。微软不仅自主研发了强大的AI模型,还在探索替代方案,以驱动其Copilot机器人等产品的技术升级。
▍MAI模型:
自研“推理”模型:微软已开发出可与OpenAI o1及o3-mini媲美的AI“推理”模型。据了解,OpenAI拒绝向微软分享o1模型的技术细节,导致双方关系紧张,促使微软加速自研步伐。MAI模型家族:微软内部研发的MAI系列模型性能已接近OpenAI的领先技术水平。据Bloomberg报道,微软计划于今年晚些时候通过API形式对外开放这些模型,供开发者使用,进一步扩展其AI生态影响力。多元替代测试:为减少对OpenAI技术的依赖,微软正测试来自xAI、Meta、Anthropic及DeepSeek的AI模型,评估其作为Copilot技术替代方案的可行性。
OpenAI Voice Engine预览期延长一年未上线
去年3月末,OpenAI宣布推出AI语音服务Voice Engine的小规模预览版,宣称仅需15秒语音样本即可克隆人类声音。然而,时隔近一年,该工具仍停留在预览阶段,OpenAI未透露具体上线计划,甚至可能无限期推迟发布。
▍技术与进展
据悉,Voice Engine能够生成自然流畅的语音,高度贴近原始说话者的音色,支持文本转语音功能,并已应用于OpenAI的文本转语音API及ChatGPT的语音模式。据OpenAI 2024年6月的博客介绍,该模型通过学习说话者在给定文本中的发音规律,可生成多样化的语音表达,适配不同口音与风格。OpenAI声称,该技术自2022年起研发,并在2023年夏季向全球高级政策制定者展示过其潜力与风险。
目前,Voice Engine仅向少数“可信伙伴”开放测试,包括初创公司Livox,后者致力于为残障人士开发通信设备。Livox CEO Carlos Pereira向TechCrunch表示,该技术在语音质量与多语言支持上“令人印象深刻”,但因需在线运行而无法满足其离线客户需求。他透露,OpenAI尚未提供上线时间表或收费计划,测试阶段也未收取费用。
▍延迟原因与安全考量OpenAI原计划于2024年3月7日通过API推出Voice Engine(当时称Custom Voices),向100名“可信开发者”开放优先访问权,并设定定价:标准语音每百万字符15美元,高清语音30美元。然而,发布前夕计划搁浅,最终仅在3月末公布预览版,限制访问至约10家2023年底合作的开发者。OpenAI在公告中表示,希望通过小规模测试与利益相关者对话,评估“合成语音的负责任部署”。其6月博客进一步暗示,推迟发布部分源于2024年美国大选期间的滥用风险。为降低隐患,Voice Engine内置水印追踪音频来源,要求开发者获得说话者明确同意并披露AI生成性质,但具体执行机制尚未公开。此外,OpenAI计划开发语音认证系统及“禁声名单”,以防止生成与名人相似的语音。这些技术目标虽具前瞻性,但实现难度较高,若失误可能加剧外界对其安全投入不足的质疑。
Crogl推出AI“钢铁侠战衣” 获3000万美元融资助力网络安全革命
近日,总部位于美国新墨西哥州阿尔伯克基的初创公司Crogl推出了一款面向网络安全研究人员的自主AI助手,旨在帮助分析每日网络警报并解决安全事件。这款被Crogl首席执行官兼联合创始人Monzy Merza称为安全分析师“钢铁侠战衣”的产品,已在多家大型企业和组织中完成部署。同日,Crogl宣布完成总计3000万美元的融资。
▍产品亮点:Crogl的AI平台通过“知识引擎”驱动,针对网络安全运营中的核心痛点——警报过载与分析效率低下。Merza指出,安全分析师每天最多处理约24个警报,而企业可能面临高达4500个警报的洪流。现有工具往往通过减少警报数量解决问题,但Crogl反其道而行,认为每个警报都应被分析,以增强团队的“反脆弱性”。其平台不仅能标记可疑活动,还能通过学习组织独特流程与数据,识别趋势并支持自然语言查询,极大提升了安全运营的深度与广度。
Cursor拟以100亿美元估值融资
近日,据Bloomberg报道,AI编程助手Cursor的开发公司Anysphere正与风险投资机构谈判,计划以近100亿美元的估值筹集新一轮资金。
▍行业热潮Anysphere并非孤例。2月,AI编码编辑器Windsurf的开发公司Codeium正以近30亿美元估值融资,由Kleiner Perkins领投,其40亿美元ARR对应约70倍估值。此外,Poolside等AI编程公司近期也频获投资者青睐。据投资者观察,AI在编码工具中的应用速度远超销售、法律和医疗等领域,成为当前技术投资的风口。▍背景与竞争Anysphere由MIT学生于2022年创立,旗下Cursor因其代码自动补全与任务生成能力深受开发者欢迎。该公司此前通过OpenAI加速器崭露头角,累计融资金额已超1.7亿美元,投资者包括a16z、OpenAI创业基金及Stripe联合创始人Patrick Collison等。Cursor在竞争激烈的AI编程市场中,与Codeium、Poolside及微软GitHub Copilot等玩家角逐,凭借快速增长的用户基础与营收表现脱颖而出。▍要闻点评Cursor估值从25亿美元跃升至近100亿美元,仅用三个月时间,反映了AI编码工具市场的爆炸式增长与资本追逐。然而,高达66倍的ARR倍数也引发讨论:投资者是否过于乐观?相比之下,Codeium的70倍估值显示市场对AI编程潜力的普遍高预期。未来,Anysphere需证明其技术与商业模式的可持续性,以支撑这一天价估值。
页:
[1]