語言模型透過流暢的語言表達與自信的判斷,給人留下知識豐富的印象。但流利地說話並不代表理解,能夠有說服力的表達也不等於能夠感知現實。為了理解當代人工智慧的根本限制,回顧一個已有兩千多年歷史的哲學思想是很有幫助的。柏拉圖在其教義中描述了人們被鎖在地下室,只能看到牆上的影子。這個比喻完美反映了大型語言模型的狀況。## 語言模型的限制:文本取代真實經驗語言模型無法直接看到世界。它們聽不到聲音,感受不到質地,也無法與物體互動。它們所有的知識都建立在文本資料上:書籍、文章、貼文、評論、語音轉錄——這是人類在歷史與網路上的自我表達的巨大檔案。文本是它們獲取資訊的唯一渠道。那麼,語言模型對世界了解多少?只有它們通過人類語言篩選後獲得的資訊。而人類語言本身並不完美:它反映的不是現實本身,而是對現實的觀念——這些觀念常常是不完整的、偏見的、扭曲的。人們用自己的信念、無知、文化盲點甚至明顯的謊言來描述世界。網路充滿了偉大的思想,也充斥著陰謀論、宣傳與虛構。當我們用文本訓練語言模型時,並未讓它們接觸到真實世界。我們只提供了它們的映像——柏拉圖牆上的影子。這不僅是可以修正的缺陷,而是根本的架構缺陷。## 為何擴大規模並不能解決根本問題長期以來,人工智慧的發展策略一直相信:擴大規模可以解決一切。更多資料、更強大的模型、更高的參數數量、更密集的計算。但大量的影子並不會轉化為對現實的理解。語言模型的訓練目標是預測下一個最可能的詞。它們能產生看似合理的文本,但無法可靠地理解因果關係或預測行動的真實後果。因此,幻覺(hallucinations)並非可以通過更新來消除的錯誤,而是純粹建立在語言基礎上的系統的結構性特徵。正如楊·勒昆多次強調,僅靠文本基礎不足以創造真正的智能。## 轉向世界模型:未來的架構研究人員與工程師的注意力正越來越多地轉向所謂的世界模型——這些系統能建立對環境機制的內部表徵,通過互動學習,並能在採取行動前模擬結果。世界模型不僅限於文本。它們整合時間序列資料、感測器數據、反饋循環、ERP系統資訊、表格與模擬結果。它們不再只問「下一個詞最可能是什麼?」而是轉向更強大的問題:「如果我們做這個,會發生什麼?」這一轉變——從統計預測文本到因果關係建模——徹底改變了系統的能力。## 世界模型已在實際商業場景中應用對企業領導者與分析師來說,這不僅是理論爭論。世界模型已在某些領域展現出來,這些領域單靠文本分析不足以應付。**物流與供應鏈管理。** 語言模型可以撰寫故障報告或描述問題,但世界模型能預測港口封閉、燃料價格上漲或供應商失效對整個供應鏈的影響。它可以在公司投入數百萬資金前測試不同方案。**保險與風險管理。** 語言模型能幫助解釋保單條款,但世界模型能分析風險隨時間的演變、模擬極端情況,並評估不同情境下的連鎖損失——這是純文本系統無法做到的。**生產與運營。** 工廠的數字雙生(digital twin)是世界模型的早期應用。它們不僅描述流程,更模擬機器、材料與時間參數的互動,幫助企業預測設備故障、優化產能,並在虛擬環境中測試變更,而不影響實體設備。## 企業如何準備進入世界模型時代討論從文本系統轉向世界模型,提出了一個實際問題:企業如何從現在開始準備這一變革?挑戰在於,雖然世界模型目前仍在實驗室和特定應用中發展,但理解其原理需要實驗與探索。不能在不了解現狀的情況下構建未來。嘗試不同的人工智慧方法——從語言模型到更複雜的架構。利用現有工具測試假設。不要拘泥於單一資訊來源,要保持彈性與探索的心態。這樣才能幫助企業理解即將到來的變革機制。## 從語言模型到未來的混合架構這並非呼籲放棄語言模型,而是重新思考它們在整體系統中的角色。**在未來的人工智慧發展階段:**語言模型將成為人與系統之間的界面——助手與翻譯。世界模型則提供「落地」——理解世界的運作、預測與規劃的能力。語言將建立在這些以現實為基礎的系統之上,這些系統從真實中學習,而非僅僅依賴描述。正如柏拉圖的寓言中,囚徒不是通過更仔細地研究影子而獲得解放,而是轉身看到影子的源頭,最終走出洞穴,迎向真實世界。人工智慧正朝著類似的時刻邁進。早早意識到這一點的企業,將不再將令人信服的話語當作真正理解的標誌,而是投入資源建立能模擬自身現實的系統——世界模型。這些公司不僅會打造會說話的AI,更會打造真正理解世界運作的AI。你的企業準備好迎接這一轉變了嗎?它能建立起屬於自己現實的世界模型嗎?
為何語言模型無法理解現實:從柏拉圖的洞穴到全球模型的旅程
語言模型透過流暢的語言表達與自信的判斷,給人留下知識豐富的印象。但流利地說話並不代表理解,能夠有說服力的表達也不等於能夠感知現實。為了理解當代人工智慧的根本限制,回顧一個已有兩千多年歷史的哲學思想是很有幫助的。柏拉圖在其教義中描述了人們被鎖在地下室,只能看到牆上的影子。這個比喻完美反映了大型語言模型的狀況。
語言模型的限制:文本取代真實經驗
語言模型無法直接看到世界。它們聽不到聲音,感受不到質地,也無法與物體互動。它們所有的知識都建立在文本資料上:書籍、文章、貼文、評論、語音轉錄——這是人類在歷史與網路上的自我表達的巨大檔案。文本是它們獲取資訊的唯一渠道。
那麼,語言模型對世界了解多少?只有它們通過人類語言篩選後獲得的資訊。而人類語言本身並不完美:它反映的不是現實本身,而是對現實的觀念——這些觀念常常是不完整的、偏見的、扭曲的。人們用自己的信念、無知、文化盲點甚至明顯的謊言來描述世界。網路充滿了偉大的思想,也充斥著陰謀論、宣傳與虛構。
當我們用文本訓練語言模型時,並未讓它們接觸到真實世界。我們只提供了它們的映像——柏拉圖牆上的影子。這不僅是可以修正的缺陷,而是根本的架構缺陷。
為何擴大規模並不能解決根本問題
長期以來,人工智慧的發展策略一直相信:擴大規模可以解決一切。更多資料、更強大的模型、更高的參數數量、更密集的計算。但大量的影子並不會轉化為對現實的理解。語言模型的訓練目標是預測下一個最可能的詞。它們能產生看似合理的文本,但無法可靠地理解因果關係或預測行動的真實後果。
因此,幻覺(hallucinations)並非可以通過更新來消除的錯誤,而是純粹建立在語言基礎上的系統的結構性特徵。正如楊·勒昆多次強調,僅靠文本基礎不足以創造真正的智能。
轉向世界模型:未來的架構
研究人員與工程師的注意力正越來越多地轉向所謂的世界模型——這些系統能建立對環境機制的內部表徵,通過互動學習,並能在採取行動前模擬結果。世界模型不僅限於文本。
它們整合時間序列資料、感測器數據、反饋循環、ERP系統資訊、表格與模擬結果。它們不再只問「下一個詞最可能是什麼?」而是轉向更強大的問題:「如果我們做這個,會發生什麼?」這一轉變——從統計預測文本到因果關係建模——徹底改變了系統的能力。
世界模型已在實際商業場景中應用
對企業領導者與分析師來說,這不僅是理論爭論。世界模型已在某些領域展現出來,這些領域單靠文本分析不足以應付。
物流與供應鏈管理。 語言模型可以撰寫故障報告或描述問題,但世界模型能預測港口封閉、燃料價格上漲或供應商失效對整個供應鏈的影響。它可以在公司投入數百萬資金前測試不同方案。
保險與風險管理。 語言模型能幫助解釋保單條款,但世界模型能分析風險隨時間的演變、模擬極端情況,並評估不同情境下的連鎖損失——這是純文本系統無法做到的。
生產與運營。 工廠的數字雙生(digital twin)是世界模型的早期應用。它們不僅描述流程,更模擬機器、材料與時間參數的互動,幫助企業預測設備故障、優化產能,並在虛擬環境中測試變更,而不影響實體設備。
企業如何準備進入世界模型時代
討論從文本系統轉向世界模型,提出了一個實際問題:企業如何從現在開始準備這一變革?
挑戰在於,雖然世界模型目前仍在實驗室和特定應用中發展,但理解其原理需要實驗與探索。不能在不了解現狀的情況下構建未來。
嘗試不同的人工智慧方法——從語言模型到更複雜的架構。利用現有工具測試假設。不要拘泥於單一資訊來源,要保持彈性與探索的心態。這樣才能幫助企業理解即將到來的變革機制。
從語言模型到未來的混合架構
這並非呼籲放棄語言模型,而是重新思考它們在整體系統中的角色。
在未來的人工智慧發展階段:
語言模型將成為人與系統之間的界面——助手與翻譯。世界模型則提供「落地」——理解世界的運作、預測與規劃的能力。語言將建立在這些以現實為基礎的系統之上,這些系統從真實中學習,而非僅僅依賴描述。
正如柏拉圖的寓言中,囚徒不是通過更仔細地研究影子而獲得解放,而是轉身看到影子的源頭,最終走出洞穴,迎向真實世界。
人工智慧正朝著類似的時刻邁進。早早意識到這一點的企業,將不再將令人信服的話語當作真正理解的標誌,而是投入資源建立能模擬自身現實的系統——世界模型。這些公司不僅會打造會說話的AI,更會打造真正理解世界運作的AI。
你的企業準備好迎接這一轉變了嗎?它能建立起屬於自己現實的世界模型嗎?