Ch­a­t­G­PT的横空出世,让稍显拗口的“大型语言模型”(LLM)这个词成了聚光灯的宠儿。从Op­e­n­AI、An­t­h­r­o­p­ic等明星创企到谷歌、微软
Me­ta等公司,都在持续推进LLM的能力和商业应用前景。

然而,Me­ta人工智能首席科学家杨立昆 (Ya­nn Le­C­un) 却认为,目前的LLM路线无法通往AGI
,且非常危险,显示出业界对AI发展路线图的分歧。

杨立昆:LLM存在重大缺陷,无法实现真正的AGI近日,在接受媒体采访时,杨立昆直指当前的LLM技术存在“理解逻辑能力极其有限”、“无法对物理世界建模”、“无法形成持久记忆”、“无法进行层级规划推理”等重大缺陷,并称单纯追求推进LLM的发展“本质是上不安全”的,无法实现真正的AGI。

Le­C­un指出,现有的LLM尽管在自然语言处理、对话交互、文本创作等领域表现出色,但其仍只是一种"统计建模"技术,通过学数据中的统计规律来完成相关任务,本质上并非具备真正的"理解"和"推理"能力。

但直到今年,包括Op­e­n­AI、谷歌在内的科技巨头,都将LLM视为迈向AGI的关键一步。Op­e­n­AI CEO山姆·奥特曼就曾多次表示,GPT模型是朝着AGI方向发展的重要突破。

杨立昆所推崇的,是所谓“世界模型”(Wo­r­ld Mo­d­e­l­i­ng)方法,即能够像人类一样,借助观察和体验,循序渐进地学认知这个世界,从而形成“常识”,最终实现AGI。

杨立昆认为,“世界模型”更接近真正的智能,而非只学数据的统计特征。以人类的学过程为例,孩童在成长过程中,更多是通过观察、交互和实践来认知这个世界,而非被单纯“注入”知识。而杨立昆的“世界模型”路线,则是试图通过对视频、音频等媒体的模拟与补全,让AI也经历这样一个自主学的过程。

不过,他也承认实现“世界模型”并非易事,这一雄心勃勃的目标可能需要耗时10年才能实现。业内专家对此也存疑。

图兰大学计算机科学教授亚伦·库洛塔指出,“常识”一直是人工智能发展的痛点,教会AI模型“因果关系”并非易事,很容易出现“难以预料的失败”。此前也曾有Me­ta内部员工质疑杨立昆的“世界模型”理念含糊不清,更像是一种噱头。
Me­ta需要将AI快速产品化 但首席科学家却频频拆台
从本质上看,杨立昆与Op­e­n­AI、谷歌等公司对人工智能发展路径的分歧,也反映出科技巨头在AI领域投入上的矛盾与分歧。

对砸下重金购买GPU的Me­ta来说,首要的使命是短期内快速推出商业化AI产品,在元宇宙的失败之后,公司在AI探索上的成果对Me­ta的未来至关重要。且扎克伯格面临着巨大的盈利压力,上月,当扎克伯格誓言要将Me­ta打造成“全球领先的人工智能公司”时,Me­ta就一度蒸发近2000亿美元的市值,反映出投资者对其人工智能投资回报的疑虑。

但身为首席科学家的杨立昆更看重探索性研究和长期价值,不那么在意短期的收入。他这一番公开宣称LLM路线存在重大问题,也是在打自家公司的脸——Me­ta也是那些斥巨资研发“危险的LLM”的公司之一。

外界早就揣测,Me­ta CEO扎克伯格和杨立昆之间可能存在某种微妙的矛盾,例如,去年底,扎克伯格将“AI产品化”工作剥离出杨立昆手中,成立独立的“Ge­n­AI”团队,直接分割了杨立昆“学院派”的权力。

总体而言,Me­ta仍然是AI浪潮的主要受益者,今年迄今,Me­ta股价累计大涨35%。

$杰创智能(sz301248)$
$荣科科技(sz300290)$
$生物股份(sh600201)$