從生成語言學到自然語言處理(一):LLM和人類一樣嗎?
現在的生成式人工智慧能做到的事情越來越多,也越做越好。像是ChatGPT這樣的大型語言模型應用,從一般的問答、文章翻譯、摘要到檢查,甚至程式碼的撰寫,都能幫上忙。而身為語言學研究所的學生,我對於機器和資訊系統學習人類語言這件事情感到驚奇之餘,也很好奇 LLM 和人類在「語言知識的儲存表徵與運用機制」的差異究竟在哪裡?
在修習《語言科技與複雜系統》這門課之前,對於語言與科技的關係我抱持著一種二元分立的觀點。我之前以為語言學僅能提供靜態的規則參考,而 AI 則是負責暴力運算的工具,兩者僅止於表層的應用結合。然而這學期的理論探討與程式實作,改變了我對這兩個領域互動關係的認知。
為什麼中文可以理直氣壯地省略主語、賓語(受詞),只丟出核心詞彙就能精準傳達語意,而英文卻必須補上那些看似多餘的 "I", "it" 或 "the” 呢?這種「形式與語意不對等」(form–meaning mismatch)的現象,正是句法學家劉啟明老師,在語言學界長年耕耘的核心議題。
你是否也曾困惑:because作為從屬連接詞,前面到底需不需要加上逗號?
你覺得語言的本質是什麼?還記得在語言學概論的第一堂課,討論這個問題時,許多人(包括我)都覺得:「語言是溝通的工具」。巨觀來看,語言確實是溝通的橋樑,但這篇文章將透過尼加拉瓜手語誕生的歷程,揭示人類發展出語言的能力或許不是為了溝通,而是為了創造更多組合。而這樣的發現,也許能引出更深一層的思考:若語言天生傾向於創造,那麼人類的本質,會不會也是?
大型語言模型 (LLMs) 在自然語言處理 (NLP) 領域取得了顯著的技術突破。然而,在其廣泛應用的背後,存在著一個核心問題:LLMs 是否能在所有語言中保持一致的表現?特別是對於「低資源語言」而言,LLMs 的表現及困境仍然是亟待探討的重要課題。
大型語言模型 (LLMs) 在自然語言處理 (NLP) 領域取得了顯著的技術突破。然而,在其廣泛應用的背後,存在著一個核心問題:LLMs 是否能在所有語言中保持一致的表現?特別是對於「低資源語言」而言,LLMs 的表現及困境仍然是亟待探討的重要課題。
從語言學與人工智慧的交會中,我看見了語言結構知識在實務應用上的潛力。這樣不同視角的討論不僅開闊了我的學習視野,也深化了我對語言學在 AI 發展中所能扮演角色的理解。
你覺得語言的本質是什麼?還記得在語言學概論的第一堂課,討論這個問題時,許多人(包括我)都覺得:「語言是溝通的工具」。巨觀來看,語言確實是溝通的橋樑,但這篇文章將透過尼加拉瓜手語誕生的歷程,揭示人類發展出語言的能力或許不是為了溝通,而是為了創造更多組合。而這樣的發現,也許能引出更深一層的思考:若語言天生傾向於創造,那麼人類的本質,會不會也是?
潘俊楠教授帶領的句法團隊致力於生成句法學,尤其是最簡方案、繼承語和語言接觸、少數民族語言和瀕危語言以及理論語言學框架下的心理和神經語言學等領域的研究