社交媒体巨头Meta传出在AI竞争中发力的最新消息,反映其在战略重心从开源模式转向追求前沿盈利模型的转变。
美东时间18日周四媒体报道,Meta的首席AI官Alexandr Wang在上周四的内部问答会上披露,Meta正在开发代号为Mango的新一代图像和视频AI模型,以及代号为Avocado的下一代大语言模型(LLM),预计将于2026年上半年发布。
Wang表示,Avocado模型的重点之一是提升编程能力,同时公司正处于研究开发世界模型的早期阶段。世界模型是一种通过吸收视觉信息来学习环境的AI技术。
这一消息进一步印证了Meta在AI领域的战略调整。上周华尔街见闻就提到,有报道称,Meta正在开发新的前沿AI模型Avocado,训练模型时采用了使用了阿里巴巴的通义千问(QWEN)等第三方模型进行优化,且可能采用专有而非开源模式。这与Meta此前主推的开源Llama系列形成鲜明对比。
为推动AI研发,Meta在今年夏天重组了AI团队,聘请Alexandr Wang领导新成立的超级智能部门Superintelligence Labs。CEO扎克伯格还亲自从OpenAI挖走了20多名研究人员,组建了一支超过50人的AI专家团队。
双模型布局:图像生成与语言能力并进
据本周四的报道,Meta正在同步推进两个核心AI模型的开发。图像和视频模型Mango旨在增强Meta在生成式AI领域的竞争力,而文本模型Avocado则专注于提升编程等关键能力。
图像生成已成为大型AI公司竞争的关键战场。
谷歌今年8月末推出了基于Gemini 2.5 Flash模型的AI图像生成及编辑工具——Nano Banana,推动Gemini月活跃用户从7月的4.5亿增至10月底的超6.5亿。
Meta9月25日推出了与Midjourney合作开发的AI视频生成器Vibes,不到一周,OpenAI就发布了自己的视频生成应用Sora。
OpenAI CEO Sam Altman在上周与记者会面时强调了AI图像生成对消费者的重要性,称这是许多用户的主要兴趣点,也是让他们持续回访的"粘性"功能。
战略转向:从开源到专有模式
据上周的报道,Meta的AI战略正在发生重大转变。公司内部许多人原本预计Avocado模型会在今年年底前发布,但计划已推迟至2026年第一季度。
报道称,Avocado可能采用专有模式,这意味着外部开发者无法自由下载其权重和相关软件组件。此举若最终实施,将标志着该公司长期以来坚持的开源战略发生显著转变,其做法将更接近谷歌与OpenAI等主要竞争对手的模式。
报道称,这一转变的催化剂之一是Llama 4在4月发布后未能赢得开发者青睐。此外,中国AI新星DeepSeek发布的R1模型采用了Llama架构的部分内容,这让Meta部分员工感到不满,进一步凸显了开源策略的风险。
扎克伯格去年曾预测Llama系列将成为"业内最先进"的模型,并在今年1月的财报电话会议上专门讨论了Llama。但在10月的最新财报会议上,他仅提及该品牌一次。
Meta今年6月豪掷143亿美元投资Scale AI,挖来了这家独角兽的创始人汪韬(Alexandr Wang),并在10月末公布三季报时将今年的公司资本支出指引上调至700亿至720亿美元。
世界模型:AI理解物理世界的新前沿
澎湃新闻此前介绍,世界模型的灵感源于人类的世界心智模型,人类通过感官获取的抽象信息在大脑中被转化为对周围世界的具象理解,基于这些模型,大脑对世界进行预测,从而影响感知和行动。
英伟达指出,世界模型是用于理解现实世界动态的神经网络,包括物理属性和空间属性。它们可以使用文本、图像、视频和运动等输入数据来生成模拟实际物理环境的视频,能够为人工智能提供理解真实三维物理世界的能力,对具身智能的实现具有重大意义。
不过,世界模型面临显著的技术挑战。与目前用于生成式模型的计算量相比,训练和运行世界模型需要庞大的算力。世界模型也存在幻觉问题,并会内化训练数据中的偏见。如果这些障碍被克服,世界模型可以为机器人技术和AI决策带来突破,使AI能够对所处情境形成理解并推理出可能的解决方案。