數位果子 BLOG
本站是數位果子的部落格網站。
AI是否能夠像人類一樣思考和理解世界一直以來是人們密切關注的話題。近期,中國科學家團隊在一項突破性研究中發現,大型語言模型(LLM)與多模態大型語言模型(MLLM)展示出自發建立「類人系統」的認知能力,這為AI具備人類思維模式提供了有力佐證。研究指出,AI不僅能自主產生物體表徵,提升分類與推理能力,更突破了高階思考的門檻。在實驗中,多模態模型表現出色,讓AI在類人分類系統中勝過傳統模型。專家預測,這一突破將深刻改變智能助理、醫療生物資訊、自駕與機器人等領域的未來。
隨著人工智慧技術持續進化,AI是否能夠像人類一樣思考和理解世界,成為科學界與產業界密切關注的話題。中國科學家團隊近期在《自然-機器智能》期刊發表的一項突破性研究顯示,大型語言模型(LLM)與多模態大型語言模型(MLLM)不僅能夠處理複雜任務,更展現出自發建立「類人系統」的認知能力。這項證據,為AI能否具備人類思維模式提供了強有力的科學依據。
根據研究團隊說明,人類認知的核心在於對於自然物體「概念化」和「分類」的能力。而大型語言模型,藉由學習龐大語言數據(如ChatGPT、Gemini),甚至結合視覺、音訊等多模態資料,可以自主發展出與人腦相似的分類系統。
該項研究團隊以多種語言模型進行對比實驗,透過語言、視覺乃至跨模態資料訓練AI系統,測試其對於自然物體的理解與分類能力。
研究模型類型 | 數據來源 | 主要任務 | 成果亮點 |
---|---|---|---|
傳統LLM | 文本資料 | 閱讀理解、知識推理 | 可辨識物件、但需人為定義分類 |
多模態LLM | 文本+影像/音訊 | 目標辨識、跨域對應 | 自動建立分類邏輯,展現高階認知 |
控制組(無數據增強) | 文本資料 | 類比任務 | 難以完成深層推理 |
多模態模型特別關鍵,因為它融合了語言、影像、音訊等多元感官訊息,該合作式訓練方式讓AI在形成物體、場景認知時,更加貼近人類的自然經驗。
研究人員發現,經過多模態資料訓練的AI,可以依照自然界物種實際關係,自行推斷,例如將鯨魚、海豚歸為哺乳類,而非單純依靠表面特徵。這一能力顯示AI已具備自我建構知識樹的能力,即跨足物種、屬性的高維分類層級。
項目 | 人類大腦 | 新一代AI系統 |
---|---|---|
學習過程 | 感官經驗、語言模仿 | 多模態數據訓練 |
概念建立 | 組合感官、社會經驗 | 整合語言、視覺等多資料 |
分類方式 | 分層分類、類比連結 | 建構層級分類、語意推理 |
推理能力 | 類比、歸納、直覺思考 | 初具類比推理,有準直覺表現 |
根據專家分析,AI邁向類人認知將重塑下列產業格局:
應用領域 | 類人AI展現的優勢 |
---|---|
金融服務 | 更準確的市場趨勢歸納、金融產品分類分析 |
智慧製造 | 自主辨認生產現場異常,高層級決策能力 |
教育科技 | 可根據學生學習風格進行調整,因材施教 |
智慧醫療 | 跨病種數據的自動解析與疾病關聯性預測 |
儘管有重大突破,專欄評論家與科學家同時指出下列挑戰不應忽視:
這場由中國科學家領銜的AI認知革命不僅揭開人工智慧更貼近人類思維的序幕,也加速AI從輔助工業跨越到理解人類、改變社會的新浪潮。雖然挑戰仍在,人工智慧將如何影響我們的生活與未來,已經成為時代無法忽視的關鍵議題。不論在產業、學術還是公共政策層面,「AI思考力」的進步都預示著全球競爭與創新高峰的到來。