社交媒体巨头 Meta 关于其 AI 竞赛努力的最新消息反映了其战略重点从开源模式转向追求创新收入模式的转变。据媒体周四报道,美国东部时间18日,Meta首席AI官Alexandr Wang在周四的内部问答会上透露,Meta正在开发代号为Mango的新一代图像和视频AI模型,以及代号为Avocado的下一代大语言模型(LLM),预计将于2026年上半年发布,并表示其中Avoca模型是Wangca的重点。编程能力强,公司正处于世界模型研发的早期阶段。世界模型是一种通过吸收视觉信息来学习环境的AI技术。这一消息进一步印证了Meta在AI领域的战略调整。上周,《华尔街日报》援引报道称,Meta 正在开发新的尖端人工智能模型 Avocado。在训练模型时,它使用第三方模型如阿里巴巴的QWEN(QWEN)进行优化,并且可能使用专有模型而不是开源模型。这与Meta之前推广的开源Llama系列形成鲜明对比。为了推动人工智能研发,Meta今年夏天重组了人工智能团队,并聘请Alexandr Wang领导新成立的超级智能部门Superintelligence Labs。 CEO扎克伯格还亲自从OpenAI挖来了20多名研究人员,组建了一支50多名AI专家的团队。双模型布局:共同发展图片和语言能力。据周四报道,Meta 立即推动了人工智能的两个主要模型的发展。图像和视频模型Mango旨在提高Meta在生成AI领域的竞争力,而文本模型Avocado则专注于提高编程等核心能力。图像生成已成为人工智能大公司争夺的主要战场。在今年8月底,谷歌推出了基于Gemini 2.5 Flash模型的AI图像生成和编辑工具Nano Banana,推动Gemini的月活跃用户从7月份的4.5亿增加到10月底的6.5亿以上。 9 月 25 日,Meta 推出了与 Midjourney 合作开发的 AI 视频生成器 Vibes。一周之内,OpenAI 发布了自己的视频生成应用程序 Sora。 OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)在上周与记者会面时强调了人工智能对消费者形象塑造的重要性,称这是许多用户的关键兴趣点,也是吸引他们回头的“粘性”功能。战略转变:从开源到专有模式据上周报道,Meta 的人工智能战略正在发生重大转变。公司内部许多人预计 Avocado 车型将在年底前发布,但计划已推迟至 2026 年第一季度。有报道称,Avocado 可能会在今年年底前发布。使用专有模型,这意味着外部开发人员不能。其权重和相关软件组件可免费下载。此举如果最终实施,将标志着该公司长期坚持的开源战略的重大转变,这将使其方法更接近谷歌和 OpenAI 等主要竞争对手的模式。据报道,这次转让的原因之一是《骆驼4》在4月份发布后未能赢得开发商的青睐。此外,中国AI后起之秀DeepSeek发布的R1模型采用了部分Llama架构,这让一些Meta员工感到不满,也进一步凸显了开源方式的危险性。扎克伯格去年预测 Llama 系列将成为业内“最先进”的车型,并在一月份的财报电话会议上专门讨论了 Llama。但在 10 月份的最近一次财报电话会议上,他只提到了该品牌一次。 Meta 6 月向 Scale AI 投资 143 亿美元他挖来了独角兽创始人亚历山大·王(Alexandr Wang),并在10月底公布第三季度业绩时将公司今年的资本支出指引从700亿美元上调至720亿美元。世界模型:人工智能理解物理世界的新领域。论文之前介绍过,世界模型的灵感来自于人类对世界的心理模型。人们通过感官获得的抽象信息在大脑中转化为对周围世界的具体理解。基于这些模型,大脑预测世界,从而影响感知和行动。 Nvidia指出,世界模型是一种神经网络,用于理解现实世界的动态,包括物理属性和空间特征。他们可以使用文本、图像、视频和运动等输入数据来生成模仿实际物理环境的视频。他们可以提供能够理解真实情况的人工智能三维物理世界,这对于嵌入式智能的实现具有重要意义。然而,世界模型面临着重大的技术挑战。与当前用于生成模型的计算量相比,训练和运行世界模型需要大量的计算能力。世界模型还存在可视化问题,并在训练数据中引入偏差。如果这些障碍能够克服,世界模型可能会带来机器人和人工智能决策方面的突破,使人工智能能够发展情境理解并推理可能的解决方案。
特别声明:以上内容(无论何处均包括图片、视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(如有,包括照片和视频)由网易号用户上传发布,网易号为社交媒体平台,仅提供信息存储服务。