多客科技 发表于 2025-1-19 17:34

AI业界焦点:探寻2024年12月AI领域的重大进展与洞见

作者:微信文章


AI行业资讯分享

大观察小思考





卷首语:积累一些发现,串成一个故事,挖掘一套方法,创造一片天地





01
闪极发布AI拍拍镜



概要:12月19日,闪极发布新款 AI 智能眼镜闪极 AI「拍拍镜」,该产品支持头部相机、耳边音箱、智能助手、录音笔等功能,支持 1600 万像素三重拍摄交互、123° 沉浸视角,号称"随时开拍"。

评论:AI眼镜因靠近人类感官器官,具有独特优势,但续航性与轻便时尚性难以兼顾,对国内近视用户也不够友好。尽管如此,Meta与雷朋合作的Ray-Ban Meta眼镜销量已超百万且2025年有望成AI眼镜元年。百度、小米、华为,Vivo等纷纷布局,CES 2025上将发布多款新品。不过,AI眼镜目前仍处发展初期,芯片性能、显示技术等存瓶颈,其作为手机辅助设备短期内难取代手机。

02

DeepSeek v3发布



概要:12月26日,杭州深度求索发布了DeepSeek-V3开源版本,包含6710亿参数,采用专家混合架构(MoE),基于14.8T token的预训练数据。该模型在多项基准测试中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,接近当前顶尖的Claude-3.5-Sonnet。其训练仅用2048个H800 GPU,总训练GPU卡时为2788千小时,仅为GPT-4的1/6。训练提效得益于低精度计算、小参数量和高质量数据,尤其是数据蒸馏技术生成的优质数据,显著提升了训练效率。这标志着AI领域在开源模型研发及训练效率提升方面取得了重大突破。

评论:DeepSeek V3 以更低的成本和开源策略,打破了闭源模型在高端市场的垄断,冲击了美国科技巨头的主导地位,促使更多企业重新评估技术策略,推动AI生态向开放发展。从能源节约属性看,大规模部署方向必然向能力往资源性价比方向平衡。可能导致算力的需求进一步打折。另外,DeepSeek是否有持续突破性的迭代能力值得关注,而不是优化复刻其他模型,这些壁垒性较低的策略。

03
小红书突破种草量化方法


概要:12月18日,在2025年WILL商业大会上,小红书正式发布“AIPS人群资产模型”,该模型将品牌的人群资产拆分为五类:Awareness认知人群,Interest兴趣人群,TI(True Interest)深度兴趣人群,Purchase购买人群,Share分享人群,并通过打通电商平台三方数据的种草联盟、与品牌直接进行的一方数据合作,从种草的过程度量、结果度量两个维度,首次完整发布小红书种草的度量解决方案。
评论:自2019年小红书商业化开始后,如何量度种草,这个问题已经被品牌、商家和代理商们问了6年。“小红书种草玄学”在这六年里也被很多人提起——品牌投放后,虽然体感上有效果,也能拿到一些种草和生意的相关性指标,但种草具体的效果如何,该怎样去优化,品牌们似乎也没有明确的评估体系。直至2024年时,小红书种草的度量难题似乎有了它的答案。小红书通过种草联盟量化品牌转化效率,形成了种收一体的新生态。种草联盟打通了淘宝、京东、唯品会等电商平台的数据,使品牌能精准触达目标用户,提升转化效率。

04

《自主论》新书发布智能体



概要:12月1日,AIGCxChina发起人倪考梦的新书《自主论:何为自主以及何以自主》正式出版。书中提出了“自主三角形”理论模型,结合古典哲学、心理科学与前沿技术,全面解析了自主的定义、价值及实现路径,是意愿、能力与资源三者平衡的结果。与此同时,《自主论》智能体也随即上线,为读者和研究者提供了更直观的互动体验。

评论:对于我们启示到并不是《自主论》本身,而是随书发布《自主论》智能体的上线,标志着未来新书配套可能更加多元化,不仅需要纳入富媒体元素,还包含智能化元素。这种融合为读者提供了更丰富的互动体验,也预示着AI技术在出版领域的深度应用,为知识传播和思想交流开辟了新途径。

05

全球首位AI程序员开工



概要:2024年12月11日,全球首个AI程序员Devin由Cognition Labs正式全面开放。订阅费用为每月500美元,订阅服务不仅包括了Devin的核心功能,还额外提供了Slack集成、IDE扩展以及专业的技术支持。对于大型企业,Cognition Labs还提供了定制化的企业版解决方案。Devin被设计为可以独立完成编程任务,能够熟练运用多种编程语言,独立完成网站和应用程序的构建与部署工作,甚至还能自主发现并修复代码中的缺陷。据官方透露,Devin已经成功通过了多家AI公司的实践性工程师面试,并在Upwork等自由职业平台上完成了多个实际项目,展现出了其卓越的工作能力和实战价值。
评论: Devin的出现引发了对程序员替代的担忧。其能独立完成编程任务,甚至在Upwork等平台完成项目,似乎预示着部分基础编程工作可能被取代。但程序员行业并非只有编码,还包括需求分析、架构设计等复杂环节。Devin或许能分担部分工作,但完全替代程序员还为时尚早,程序员们应不断提升综合能力,以应对AI带来的挑战。

06

亚马逊投入AGI Lab



概要:2024年12月10日,亚马逊宣布在旧金山设立新的研发实验室——Amazon AGI SF Lab,这是该公司在人工智能领域的又一重大战略布局。该实验室由AI创业公司Adept的联合创始人David Luan领导,旨在开发能够在数字和物理世界中“采取行动”的AI代理。实验室的初期研究重点包括:使AI代理能够执行真实世界的任务、从人类反馈中学习、自主纠正错误以及推断用户意图。此外,实验室将由David Luan与知名机器人研究专家Pieter Abbeel共同运营,计划招募来自量化金融、物理和数学领域的数十名研究人员。
评论: AI Agent在真实世界/物理世界如果产生杠杆,则可以发挥更大的生产力。与人形机器人不同,AI代理更侧重于通过软件和算法实现任务自动化,而非物理交互,与此同时,微软的AI Copilot和谷歌的Mariner也在推进类似技术。尽管亚马逊可能在某些方面落后于竞争对手,但其定制芯片优势和Bedrock服务为其在AI模型训练和推理中提供了成本效益,使其在AI代理赛道上既有挑战也有机遇。

07

OpenAI发布o1/o3



概要:2024年12月6日,OpenAI正式推出其新的AI推理大模型o1“满血版”及全新的ChatGPT Pro订阅服务,定价每月200美元;12月20日发布进阶版o3模型,在推理能力和多任务处理上表现出色,提供更精准的答案。该模型不仅提升了文本生成的流畅性和准确性,还在数学推理、代码生成等方面有显著提升。ChatGPT Pro则提供更高级的服务,包括更快的响应时间、更高的使用限额和优先支持。
评论: OpenAI此次产品发布巩固了OpenAI的行业领导地位,其高价或成行业风向标,为其他AI公司提供利润空间,促使其在技术和成本控制上创新。同时,OpenAI的持续烧钱模式虽有短期成本压力,但有助于保持技术领先,推动AI发展,为行业提供长期战略参考。

08

OpenAI发布Sora



概要:2024年12月12日,OpenAI正式发布了其新一代AI模型Sora。这一模型在多模态生成和交互方面取得了显著进展,能够生成高质量的图像、视频和文本内容,并在实时交互中表现出色。Sora的发布标志着OpenAI在AI技术上的又一次重大突破,展示了其在多模态生成和交互领域的强大能力。这一模型不仅提升了生成内容的质量,还为开发者提供了更广泛的应用场景,如虚拟助手、内容创作和教育工具等。Sora的推出进一步巩固了OpenAI在AI领域的领先地位,为未来的技术发展和应用拓展奠定了坚实基础。
评论: Sora不仅能够生成高质量的视频,还能在实时交互中理解用户的指令并生成相应的视频内容。与竞争对手相比,Sora可能视频的颗粒度、连贯性和交互性上更为出色。国内视频AI平台在近年来也取得了显著进展,但性价比更高。从负面角度来看,Sora似乎没有达到大家的预期,其高性能可能带来更高的计算成本和资源需求,这对资源有限的用户和企业可能是一个挑战。

09

国内AGI普及至18%



概要:中国互联网信息中心近日发布的第55次《中国互联网络发展状况统计报告》,截至2024年底,中国的生成式人工智能产品用户规模已达到2.49亿人,占全国总人口的17.7%。77.6% 的用户利用生成式人工智能产品来回答问题,45.5% 的用户将其作为办公助手,用于生成会议纪要、制作 PPT 等工作。
评论: 这一数据表明,生成式人工智能在中国的应用和普及已初具规模,似乎让人看到如智能手机以及互联网的广泛普及的前夕。生成式AI的广泛应用得益于技术进步和供需推动。需求端,AI在多场景高效应用激发广泛需求,加速了生成式AI普及,为AI产业发展注入动力。

10

Google发布可解释性强模型



概要:12月20日,谷歌DeepMind推出全新测试模型Gemini 2.0 Flash Thinking。这一模型不仅在推理能力上表现出色,还通过可视化的方式展示了整个思维链过程,为AI模型的透明度和可解释性树立了新的标杆。
在过去,许多AI模型被批评为“黑箱”操作,即它们的内部工作机制和决策过程对于用户来说是不可见的,这种不透明性导致了人们对AI系统的不信任和担忧。如今,通过引入逐步推理的过程展示,Google的最新模型为用户提供了一个窗口,可以窥见模型的内部工作原理。这种透明度不仅有助于用户更好地理解模型的行为,同时增加用户与模型之间的信任,更加理解AI给出结果。
评论: 扩展种透明度/可解释性不仅有助于用户更好地理解模型的行为,还增加了用户与模型之间的信任,为监管机构提供了一个工具,以评估和监督AI系统的公平性和合规性,“透明度”可能成为一个新趋势与新需求。对国内模型是否也将够逐步实现这种透明度/可解释性拭目以待。

END

扫描获取更多精彩



页: [1]
查看完整版本: AI业界焦点:探寻2024年12月AI领域的重大进展与洞见