AI的智力不如貓 楊立昆 20241111

AI的智力不如貓 楊立昆 20241111

AI的智力不如貓 楊立昆 20241111,今天談 AI智力不如貓,這是AI頂級學者楊立昆先常提到的論點。他針對AI智力的不足,提出了建立「世界模型」等多個概念,包括探討語言模型的問題、修改現有的模型架構,甚至是對硬體架構進行大幅改動,才能讓AI智力真正達到像貓一樣的水準。

AI的智力不如貓 楊立昆 20241111

AI的智力不如貓 楊立昆 影片

AI的智力不如貓

AI的智力不如貓 楊立昆 20241111
  • 楊立昆常講的論述
  • 討論建立世界模型
  • 「最佳拍檔」技術解釋
  • 關注提升AI的適應性
  • 讓AI更聰明的方法

【人工智能】现在AI智能水平还不如一只猫?

今天來談「AI的智力不如貓」。這句話其實之前已經聽過很多次了,最近才知道原來這是,AI頂級學者楊立昆先生常提到的一個論點。他針對AI智力的不足,提出了建立「世界模型」等多個概念,包括探討語言模型的問題、修改現有的模型架構,甚至是對硬體架構進行大幅改動,才能讓AI智力真正達到像貓一樣的水準。

這次是透過「最佳拍檔」的影片來了解這些內容,並進行了更深入的理解。如果有興趣深入了解學術層面的內容,可以去看下方連結裡的影片,這邊就不多講。

在這次的內容中,我會著重在一個概念上:為什麼說AI的智力不如貓?這背後有什麼原因?還有對於這個說法的反駁意見。最後我們來聊聊,如果要改變這個問題,可能的處理方式。

Yann LeCun

AI的智力不如貓 楊立昆 20241111
  • 楊立昆為法國AI專家
  • 創立卷積神經網路CNN
  • 曾獲得圖靈獎等多項榮譽
  • 專注下一代智能模型開發
  • 強調多模態和世界模型

https://zh.wikipedia.org/zh-tw/%E6%9D%A8%E7%AB%8B%E6%98%86

楊立昆其實是法國人不是華人,他的法國名字是Yann LeCun,目前的翻譯則多為「楊立昆」。出生於法國並取得博士學位。之後在紐約大學和Meta(前Facebook)都有工作過,現在也是Meta的技術主管之一。

在深度學習領域,楊立坤開創了非常重要的技術【卷積神經網路CNN】,
是現今圖像辨識和任務處理的基礎之一,因此稱他為AI的奠基者之一毫不為過。他獲得過很多榮譽,其中最重要的是獲得了「圖靈獎」,這是計算機科學領域的最高榮譽。

即使到現在,楊立昆依然在Meta繼續推動新的任務。根據最新的演講,目前的重心已經不再優化,現有的Transformer模型等語言結構,而是專注於開發更具通用智能的下一代模型。他提出要導入多模態的概念、建立「世界模型」、強化語言結構,甚至改變硬體架構,以達到更接近人類智慧的目標。

楊立昆並不認為通用人工智慧會很快實現,他認為這仍需要相當長的時間。他目前最清晰的論點之一是,AI的智慧還遠遠落後於生物智能。今天我們就來聊聊他的這些見解。

語言模型的限制

AI的智力不如貓 楊立昆 20241111
  • 現今AI依賴文字訓練
  • 無法真正理解文字意義
  • 缺乏空間與時間認知
  • 無法體驗人類情緒感覺
  • 智慧與感知能力落後動物

李忠謙專欄:ChatGPT其實沒有多厲害?

楊立昆對目前AI的評價認為,現有的AI主要是基於文字訓練的聊天機器人,智力的來源依賴於大量的文字數據。雖然AI能夠和我們進行對話,但它並不是真的理解文字背後的意義,更多的是根據上下文進行推理。

舉例來說,AI可以生成一篇論文或講述一個故事,但它無法真正理解故事的情節,甚至不知道自己在模擬什麼內容。所有的推論都是基於文字與文字之間的關聯,而非真正的理解。比如說目前的語言模型,並不理解「上下左右」的真實概念,也無法體驗時間的感覺。

再深入一點,AI無法理解人類情感的深層意涵。它們只能從人類的外在表徵中,去模仿這些情緒,但「喜怒哀樂」究竟是什麼,它們並不知道。它們也無法理解為什麼小貓摸起來那麼柔軟,不懂擁抱的溫度,更無法理解「愛」與「恨」的真實意義,這些對AI而言依然遙不可及。

甚至一隻小貓或小狗,雖然不像人類擁有那麼複雜的智慧,但它們對愛、恨、時間、空間都有基本的感知。AI對於情感的理解,以及對世界的直觀反應仍遠不如動物。所以AI距離真正的理解和感知,還有很長的路要走。

世界模型

AI的智力不如貓 楊立昆 20241111
  • 楊立昆提出AI需世界模型
  • 動物具備簡單的環境認知
  • 分辨事物合理與不合理
  • 動物簡單練習即可學會
  • AI需大量訓練才會基礎動作

AI 智力不如貓?AI 科學家楊立昆試圖打破 AGI 迷思

在這裡楊立昆特別提出了一個概念,就是AI缺乏「世界模型」。在貓的大腦中,或者在其他哺乳類動物的大腦裡,通常都有一個簡單的世界模型。即使是動物,也具備這樣的模型,可以預測物體的運動、理解空間,甚至感知時間的流逝,並對環境的變化做出反應。

牠們能分辨哪些東西是不合常理的,所以在人或動物進行辨別時,我們的注意力會自動集中在那些「超出常理」的事物上,對於合理的事物則自動略過,不會進行過多計算。

然而,目前的AI無法建立這種基本的世界模型,這使得AI在學習任何事物時,都需要大量的訓練才能掌握。例如,要讓AI學會摺棉被,可能需要反覆訓練和觀察,才能指導機器人完成這項任務。但對一個青少年來說,學習摺棉被是一件簡單的事,因為他們早就具備了基本的世界模型。

同樣道理,如果要訓練一隻狗學會握手的動作,通常只需教幾次牠就會了,而且學會之後無論在什麼地方、什麼情境下都可以握手。可是對AI來說,學會握手需要大量的訓練才行。即使AI最終學會了,也只能在固定的情境中使用,缺乏靈活應對能力。

而狗一旦學會握手後,不論是坐著、站著、躺著,甚至在空中,或是洗澡時都能握手,因為牠們擁有世界模型,能靈活地適應不同情境。而AI缺乏世界模型無法觸類旁通,對於許多生活中的基本任務,也無法舉一反三地應用。

模型缺乏長期記憶

AI的智力不如貓 楊立昆 20241111
  • 貓具有持久記憶能力
  • AI語言模型缺乏長期記憶
  • 語言模型訓練後難以更新
  • 大腦神經元同時計算與記憶
  • 硬體限制使AI模擬生物困難

How memory augmentation can improve large language model efficiency and flexibility

語言模型缺乏持久記憶。相比之下,一隻貓能夠記住主人,記住路線,記住牠不喜歡的事情,也能記住牠喜歡的氣味。牠能夠感知時間、記住光影的變化,甚至能分辨出過去對牠好或不好的人。貓會選擇性地記住牠認為重要的事情,這些記憶能幫助牠在生活中更靈活應對。

然而,AI目前的語言模型缺乏這種長期記憶。語言模型一旦訓練完成後,就成為一個固定的系統。除非再啟動訓練模式,且投入大量資源和運算力,進行成千上萬次的調整,否則AI的模型一旦訓練完畢,便無法再自行更新或改變。

貓則不同牠擁有長期記憶,可以隨著時間累積知識,並且能隨時微調已經學會的模式,靈活地應用在新的環境中。雖然貓無法記住大量的文字或數字,但牠能牢記許多重要的生活技能。

在這方面有一個關鍵的原因是,大腦神經元能夠同時進行計算與儲存。每一個大腦神經元既可以計算,也可以記憶,而且大腦有幾乎無限的神經元,這讓我們的記憶可以隨著新知識,不斷改朝換代和累積資訊。

當前的計算機硬體架構中,CPU、記憶體和硬碟是分開的,即便是AI訓練卡也是有限的,難以模擬這種神經元式的長期記憶。硬體限制使得AI,無法真正模仿生物的記憶機制,因此只能透過軟體方式來部分模擬,但效果仍然遠不如生物大腦的靈活與效率。

無法真正推理規劃

AI的智力不如貓 楊立昆 20241111
  • AI無法即時靈活應對環境
  • 動物有世界模型與記憶系統
  • 記憶系統隨使用自動更新
  • 生物大腦知道運行的規則
  • 依照基本常識推理與預測

Clues to Enhancing Artificial Intelligence Found in Brain Science

語言模型(LLM)無法進行真正的推理與規劃。相比之下,貓會學習,牠會在不同情境中利用已有知識或推理,靈活地應對環境。舉例來說,當貓從三層樓高的地方掉下來,雖然可能是牠第一次掉落,但牠知道如何運用自己的身體柔軟度,或者利用空氣阻力來減緩衝擊。

然而,這樣自然而然的適應能力,對AI來說卻難以實現。如果是一個AI控制的機器貓,要從三樓掉下來而不受傷,可能得掉幾千幾萬次,才能在大量訓練後,學會如何不讓自己分身碎骨。

這正好說明了AI無法像動物一樣,即時靈活應對環境,無法適應多變的環境。為什麼會這樣呢?原因就在於,動物的大腦擁有額外的訊息儲存「世界模型」。不僅如此,我們很多時候還記得夢境、虛幻的事物,甚至是情緒和哲學,如愛和恨這些難以量化的資訊。

這些資訊並非集中儲存在某個區域,而是散佈在大腦的神經網路中,並隨著使用頻率而改變。如果經常使用,這些記憶就會被強化;如果很少使用,則可能會慢慢被遺忘。我們的記憶系統因此具備自動更新和強化的能力。

對於生物大腦而言,因為已經有了對於世界的基本認知,在面對未知事情的時候,
可以利用對以熟悉的世界模型,推理出可能的結果,所謂萬變不離其宗,這個世界上大多數的事情,都有一個類似的因果關係,而利用基本的原理原則,就能進行一般的推理和大致準確的預測。

只有語言勝過貓

AI的智力不如貓 楊立昆 20241111

AI在語言處理上表現較佳
語言外其他能力落後於貓
貓在視覺動作感知強於AI
可利用按鈕表達簡單語句
動物具備基礎語言能力

貓咪自學人類語言!「按鈕使喚主人」

目前AI在語言處理上確實很強大,但在其他領域卻相對薄弱。雖然現今的AI模型在語言上超越了貓,但在其他方面,AI絕對無法與貓匹敵。

如今我們能透過AI模型模擬這種語言能力,但除此之外,在其他能力上,AI依然遠遠落後於貓。語言之外的其他感知、反應和適應能力,AI還無法趕上貓的水準。

貓不懂語言,但牠們在視覺理解、動作協調、重力規則等感知方面卻相當出色。延伸來說,現在也有一些訓練貓進行表達的嘗試,比如貓的「語言按鈕」。雖然貓無法像我們一樣說話,但牠們依然可以表達想要傳達的意思,甚至可以組成簡單的語句,提出問題或命令。

或許可以這樣說,動物的大腦結構中內建基本的語言能力,這種能力足以讓牠們,和人類進行簡單的互動。因此動物其實也具備語言系統,只是與人類的語言系統不同。相關的連結我會放在下方,供大家參考。

楊立昆的方案

AI的智力不如貓 楊立昆 20241111
  • 楊立昆提出目標驅動AI
  • 世界模型助AI適應世界
  • 放棄單純依賴文字訓練
  • 建立多模態認知基礎
  • AI世界模型可適應日常事務

Meta首席科學家楊立昆:分享他對人工智慧未來的深刻見解

為了解決目前AI在理解和適應上的問題,楊立昆提出了一個解決方案,那就是「目標驅動AI」。目標驅動AI的核心理念,是建立一個能夠理解物理世界、具備持久記憶和推理能力的AI系統。

為了實現目標驅動AI,我們需要構建一個「世界模型」系統。這個世界模型並不是為了,特定的任務或目的而設置的,而是要讓AI理解整個世界的運作規則,讓人工智能能夠預測行為結果,還能根據環境自行適應,並對偶然發生的例外做出反應。這樣的功能,就像貓或其他生物所擁有的基本本能。

從技術的角度來看,楊立昆認為需要放棄,單純依賴自監督學習和大語言模型的訓練,因為這些方法只能處理文字層面的資訊,目前已經走到瓶頸,即使再優化也無法讓AI真正理解世界。

接下來除了語言文字,應該讓AI接觸更多元的資訊來源,例如視覺、聲音和各種感應器。通過這些多模態的數據,逐步建立AI對於世界的基本認知。當AI具備了世界模型之後,理想狀況下,AI就能像人類或動物一樣,通過少量的學習和引導,就能適應並完成日常事務。

亞瑟的預估

AI的智力不如貓 楊立昆 20241111
  • 世界模型的建立需求
  • 目前架構難以達成目標
  • 硬體與大腦結構的差異
  • 新型硬體設計的設想
  • 當前策略與未來目標

以我自己的認知來看,目前電腦硬體架構,應該還無法達到「世界模型」的要求。要建立世界模型,需要結合動物的常識,並擁有對周遭環境的判斷能力。換句話說,視覺、觸覺、味覺、肌膚感應,甚至情感如愛、恨,再加上語言的模型,這些要素都需要輸入其中,才能構建出一個生物對世界的基本認知。

一旦有了這樣的基本認知,AI就能在面對新情境時,運用基礎知識來進行應對,並根據例外情況加強學習,將注意力集中在不同的重點上。未來會針對【世界模型】拍一部影片,講解我對這個概念的理解。不過,如果真要達到世界模型的效果,硬體勢必得進行大規模的改變。

目前電腦的運算單元、記憶單元、暫存單元等都是分開的,也就是處理器、記憶體和儲存裝置彼此獨立。但在大腦中這些功能是整合在一起的,神經元同時具備運算與儲存功能,也包含了處理、儲存和運算所需的記憶體。如果想要實現目標驅動AI的效果,我認為硬體上必須有重大的突破,這需要在半導體和硬體技術上,經歷很多次的技術革新與改變。

我們可能需要在每個運算單元旁邊,配置專屬的記憶體和硬碟,讓每個單元都能模擬,生物神經元的運作模式。只有這樣才可能,進一步建立出生物般的世界認知,向AGI(通用人工智慧)的目標邁進。

至於現在怎麼辦?當下只能一步步來,先用軟體模擬或開發一些目標導向的AI,把基礎功能做到最好,未必要過於執著於AGI的實現。然後就等台積電遇到技術瓶頸,一次次的突破人類技術極限,把下一代的人工智慧硬體逐步變出來。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

返回頂端