語言、邏輯與計算:語言學學生眼中的形式語意學與 Wolfram|Alpha (二)
在本月〈言來如此〉科技應用專欄中,本篇文章將先簡要介紹作者於書中第一篇〈ChatGPT 在做什麼?它為何能做到這些?〉中,針對 ChatGPT 運作本質及隨機性的核心觀察。而因為本文重點放在ChatGPT與語言學的關聯,內容將會略過有關大型語言模型訓練原理、過程以及神經網路技術相關的內容。接著,我會分享對於書中所提到「將自然語言轉換為計算語言」這個過程的想法並進一步討論它如何與語言學產生有意思的呼應。同樣地,此節內容將聚焦於Wolfram | Alpha 和語言學之間可能產生的連結,而不深入涉及語言學相關的理論和技術。
第二篇〈利用Wolfram | Alpha為ChatGPT賦予計算知識超能力〉
「將自然語言轉換為符號計算語言」
我們於上節中,透過作者對 ChatGPT 運作本質的說明可以了解到,ChatGPT 所生成的文本,雖然語句自然通順且「在統計上是合理的」,但並不代表其內容總是正確的。這是因為 ChatGPT 並非依據語意理解、邏輯推理或精確計算來生成回應,而是根據訓練資料中各個token 之間的機率分布,逐步預測出下一個最可能出現的 token。這樣以統計方法為基礎的預測生成機制,除了可能產生「統計合理性錯覺」之外,預測過程中所存在的「隨機性」也可能使模型在不同情況下生成不同的輸出且包含錯誤資訊。
針對上述問題,作者在書中第二篇〈利用 Wolfram | Alpha 為 ChatGPT 賦予計算知識超能力〉中提出了可能的解決方向:「讓 Wolfram | Alpha 將 ChatGPT 所生成的自然語言轉換為精確的符號計算語言,進而運用其計算知識能力」 (P.110)。我們將於本節中討論作者所提出的「將自然語言轉換為符號計算語言」的優勢,並進一步探討這一概念與語言學理論之間的呼應與關聯。如同本文章的上半部分,文章的重點將放在 Wolfram | Alpha 和語言學之間的呼應,文章中將不會涉及關於理論或技術的細節。
首先,作者以「芝加哥到東京的距離」為例 (圖2、3),說明 ChatGPT 和 Wolfram | Alpha 的差異:「如果它 (ChatGPT) 在訓練時從某個地方看到了芝加哥和東京的具體距離,他當然可以答對。但在本例中,僅僅依靠神經網路能輕鬆完成的泛化 (…) 並不夠,還需要一個實際的計算算法 (…) 而 Wolfram | Alpha 的處理方式則截然不同。它接受自然語言,然後將其轉換為精確的計算語言 (即 Wolfram 語言) (…) 城市的座標和計算距離的演算法是 Wolfram 語言內建的計算知識的一部分。」(P.113-114)

圖2:ChatGPT生成看起來通順自然,實際上卻不正確的回覆。
換句話說,針對圖中的 prompt,ChatGPT 在沒有串接 Wolfram | Alpha 的情況下,僅是預測 token 序列「How far is it from Chicago to Tokyo?」之後出現機率最高的 token,得出「The」後,再次預測 「How far is it from Chicago to Tokyo? The」之後,出現機率最高的token,如此逐步生成出圖二中的回覆。而 Wolfram | Alpha 則是先將自然語言prompt轉換成Wolfram語言 (如圖3、圖4),並實際依照 Wolfram 語言 (圖4) 程式碼邏輯及其內建知識執行「求取兩地理座標之間的距離 (即GeoDistance[ ]函式),該二座標為『Chicago CITY』和『Tokyo CITY』」的運算。

圖3:Wolfram | Alpha 將自然語言轉換成 Wolfram 語言,並依據其內建知識得出正確結果。

圖4.:Wolfram 語言的視覺化範例,即依據其內建知識得出的正確結果。
針對上述兩種方法,作者提及:「幾十年來,對AI的思考一直存在著兩極分化:ChatGPT使用的『統計方法』,以及實際上是 Wolfram | Alpha的起點的『符號方法』,(…) 將兩者結合起來,發揮出比單獨使用任何一種方法都更強大的力量」 (P.110)。事實上,統計方法的優勢在於靈活性高,能夠模擬自然語言風格、生成通順自然的文句。然而統計方法生成的結果不一定完全可靠;而與統計方法不同的是符號方法,像 Wolfram | Alpha 這樣的符號系統 (Symbolic system),或符號人工智慧 (Symbolic AI) 基於問題、邏輯和搜尋來解決問題,此類系統能精確地處理數學運算、邏輯推理和結構化知識查詢,因此在計算精度與可靠性上具有明顯優勢,但在生成自然語言的靈活性上則相對有限,兩者特性可謂互補。具體而言,所謂的「互補」體現在作者以圖五所示,ChatGPT 串接 Wolfram | Alpha 成功得出正確結果的實例中:

圖5. ChatGPT 串接 Wolfram | Alpha 得出正確回覆。
系統首先將使用者輸入的自然語言轉換成如圖 6. 上半部分所示的程式碼,將問題交予 Wolfram | Alpha 處理;在取得 Wolfram | Alpha 的回覆後 (圖 6.下半部分),再以類似圖7 的方式將結果交還給 ChatGPT 生成最終自然且正確的文本式回覆。

圖6. 將問題交予 Wolfram | Alpha 所用之程式碼。

圖7. 將 Wolfram | Alpha 所得出之正確答案交還予 ChatGPT。
將自然語言轉換為符號計算語言──形式語意學視角下的思考
雖然作者於書中並未詳細說明 Wolfram | Alpha 如何把自然語言轉換成可執行的 Wolfram 語言以及 Wolfram 語言內部的知識是如何建立的,但從上節範例中我們可以看到:透過把自然語言轉成能代表其語意的符號計算語言,再依據該語言的內部邏輯與演算法進行「基於問題、邏輯和搜尋」的運算,來避免僅依靠統計模型生成「聽起來合理」卻不一定正確的答案。而讀到這裡,身為語言學學生,「將自然語言轉換成能代表其語意的計算語言」這樣的概念,讓人聯想到語言學中一個極為重要的分支:「形式語意學 (formal semantics)」。在這一節中,我將先簡介什麼是形式語意學,接著用一個簡單範例展示其如何將自然語言轉成邏輯式表示,討論其與 Wolfram | Alpha 相呼應之處並與 ChatGPT 做比較,最後提出一些語言學與科技應用的發想。
形式語意學是語言學和哲學、邏輯學、心理學交界的一個子領域 [3],主旨在於用邏輯與數學的方法,把自然語言的「意義」(meaning) 轉換成結構化的表示式 [4][5]。這類表示式可以用邏輯、真值條件 (truth-conditions) 等工具來做分析[6]。形式語意學最核心的方法論之一是合成性 (compositionality):句子的整體意義可由其組成部分(詞、詞組)與它們的結構間的組合規則推導出來 [7]。
舉例來說,句子 “Every student passed the exam.” (每個學生都通過了考試) 可以轉換成邏輯式 ∀x[Student(x) → Passed-the-exam(x)]。其中,∀x 表示全稱量化 (universal quantifier),即「對所有個體 x」,而 x 代表某個語境下的個體 (例如:UTC+8 2025/11/5 12:00 在國立陽明交通大學光復校區內的所有個體);Student(x) 則表示這個個體具有「學生」的屬性,是量化範圍的限制;而 Passed-the-exam(x) 表示這個個體具有「通過了考試」的屬性。整體邏輯式的解讀為:在特定語境下,若某個個體是學生,那麼此個體必定通過了考試。這種使用條件符號 → 表示前提與結果的邏輯表示式,符合真值條件 (truth-condition) 的分析方法,使句子意義得以形式化並方便後續邏輯推理。
將語句轉為邏輯表示式之後,我們可以進一步用集合論方法檢驗此表示式的真假值。假定我們將 Student 定義為一個包含語境下所有擁有「學生」屬性的個體集合:Student = {John, Mary};將 Passed-the-exam 定義為包含相同語境下所有擁有 「通過了考試」 屬性的個體集合 Passed-the-exam = {John, Mary, Bill}。在此語境下,如圖六所示,若個體 Bill 通過了考試 (Bill屬於 Passed-the-exam 集合,即圖 8. 中的黑圈),但 Bill 並非學生 (Bill 不屬於 Student 集合,即圖 8. 中的紅圈),整句命題仍為真。這是因為 ∀x[Student(x) → Passed-the-exam(x)](即 “Every student passed the exam.”) 只要求「若為學生,則必通過考試」,而不限制非學生的情況,換言之,Passed-the-exam 集合包含但不限於 Student 集合。反之,若存在某個個體 x 是學生 (x 屬於 Student 集合),但沒通過考試 (x 不屬於 Passed-the-exam 集合),則命題 ∀x[Student(x) → Passed-the-exam(x)] 在此語境下的真假值則為假。

圖8.:Passed-the-exam 和 Student 兩個集合的從屬關係。
值得注意的是,邏輯的運作不會因為表層詞序或不同語言用字不同而產生變化,例如「所有學生都通過了考試」、「生徒全員が試験に合格しました」或「Todos los estudiantes aprobaron el examen」,均可轉換成相同的邏輯表示式 ∀x[Student(x) → Passed-the-exam(x)]。這也突顯了形式語意學的一個核心特點:無論語言如何不同,其基本語意結構和邏輯推導方式可以保持一致。這樣的表示方法,不僅可用於嚴謹的真假值分析,也可以與符號計算系統如 Wolfram | Alpha 「將自然語言轉換為符號計算語言」的操作方式相呼應:先將自然語言轉換為邏輯或符號形式,再依據計算語言內部邏輯進行運算或真值驗證。
對比而言,若純用 ChatGPT 的符元統計生成方法,它可能回覆:「我相信是的,根據很多教材的描述,學生通常會通過。」但這種敘述並無邏輯驗證;若反之把它交由符號系統處理,其回覆可以是基於資料庫中的資料 (縱使資料有誤,其資料也應是人類可讀且可修改的) 做確認,結果將更具可信度。
與語言學與科技應用的延伸發想
從形式語意學與 Wolfram | Alpha 的呼應,我們可以想到:在未來的語言科技應用中,如果我們能把大型語言模型的自然語言生成能力,與符號計算系統結合起來(也就是 hybrid system),將能同時兼顧「語言的流暢性」與「邏輯/資料的準確性」。
例如,在教育應用中,當學生詢問關於真實世界的問題時,系統可以先將他們的自然語言 prompt 轉換為符號邏輯表示,交由後端系統 (可能搭配一個由專業機構認證的百科資料庫) 驗證與計算,再將結果以自然語言回覆。這樣一來,不只是回答看起來像人講的話,也可以保證其計算或邏輯上的正確性。
總結來說,Stephen Wolfram 於書中指出「將自然語言轉換為符號計算語言」這個概念,在未來的語言科技應用中擁有很大的潛力,而現在我們知道,它不只是一種理論呼應,也是一種技術上可能將深度語言理解 (語意準確性) 與人性化語言互動 (自然流暢性) 結合起來的橋梁,作者亦於書中提及:「能『用數學證明』這些 (ChatGPT 內的) 函數有效嗎?,不能。因為要做到這一點,我們必須擁有一個關於人類所做的事情的數學理論。」,而形式語意學追求的,或許就是一套非常接近的理論。
註解:
[3] Partee, B. H. (2010). Formal semantics: Origins, issues, early impact. The Baltic International Yearbook of Cognition, Logic and Communication, 6, 1–52.
[4] Chierchia, G. (2006). Formal semantics. In K. Brown (Ed.), Encyclopedia of language and linguistics (2nd ed., pp. 564–579). Elsevier.
[5] Partee, B. H. (2016). Formal semantics. In M. Aloni & P. Dekker (Eds.), The Cambridge handbook of formal semantics (pp. 3–32). Cambridge University Press.
[6] Heim, I., & Kratzer, A. (1998). Semantics in generative grammar. Blackwell.
[7] Partee, B. H. (2005). Introduction to Formal Semantics and Compositionality.
文章分類
標籤
作者介紹
陽明交通大學外國語文系
國立陽明交通大學向以理工、醫學及管理見長,有鑒於科技的發展宜導以人文的關懷、博雅的精神,而資訊的流通則取決於語文的運用,因此於民國八十三年八月成立外國語文學系。
本系發展著重人文與科技之深層多元整合,以本系文學、語言學之厚實知識素養為底,再廣納本校資訊理工、管理、醫學以及其他人社領域等豐厚資源,創造多元與融合的學術環境,開拓具前瞻性及整合性之研究與學習,以培養兼具系統性思考及人本軟實力的學生,使其成為兼具在地及國際性多層次觀點與分析批判能力的未來領導者。
在研究所的規劃上,語言學方面主要是結合理論與實踐,特別重視學生在基本語言分析及獨立思考能力上的訓練。除語言各層面的結構研究外,本系也尋求在跨領域如計算機與語言的結合及語言介面上之研究 (如句法語意介面研究)能有所突破,並以台灣的語言出發,呈現出台灣語言(台灣閩南語、台灣華語、南島語)多樣性,融入社會觀察,如自閉語者聲學、聽障相關研究、社會語音學研究以及台灣語言的音變等。
相關文章
語言、邏輯與計算:語言學學生眼中的形式語意學與 Wolfram|Alpha (一)
在本月 (以及下一個月)〈言來如此〉科技應用專欄中,本篇文章將先簡要介紹作者於書中第一篇〈ChatGPT 在做什麼?它為何能做到這些?〉中,針對 ChatGPT 運作本質及隨機性的核心觀察。而因為本文重點放在ChatGPT與語言學的關聯,內容將會略過有關大型語言模型訓練原理、過程以及神經網路技術相關的內容。接著,我會分享對於書中所提到「將自然語言轉換為計算語言」這個過程的想法並進一步討論它如何與語言學產生有意思的呼應。同樣地,此節內容將聚焦於Wolfram | Alpha 和語言學之間可能產生的連結,而不深入涉及語言學相關的理論和技術。
中文系畢業的AI博士:從一介文人成為AI人的學習歷程
「It's our choices, Harry, that show what we truly are, far more than our abilities.」這是《哈利波特》中,在哈利波特疑惑著自己為什麼進到葛萊芬多學院時,鄧不利多對哈利所說的話,意思是「決定我們成為什麼樣人的,不是我們的能力,而是我們的選擇。」大學四年級,我在中文系的「中國思想史」課堂上,當時的老師也曾經對著台下作為學生的我們提到,之所以會坐在那門課堂上,其實是一種選擇。