生成式 AI 與傳統軟體的本質差異

在近期的企業諮詢與大學講課時，筆者發現無論是企業高管還是初入茅廬的學生，不少人都有把對軟件的認知，張冠李戴地套在生成式AI身上的問題。例如，大眾普遍認為：程式有漏洞（Bug）就該修復，軟件不成熟就等它更新，出了問題就找工程師排查程式碼。然而，這種源自電腦手機時代的線性思維，套用在生成式AI上，實是刻舟求劍。

前文「壓縮即智能，語言即世界」提到過傳統軟件及AI的本質差別。在傳統軟件開發過程，工程師如同戰場上的「將軍」，發出的每一條指令（Code）都是軍令，系統必須百分之百執行。而在開發生成式AI時，工程師的角色更像是「教師」。我們提供教材（訓練數據）、制定課程（演算法）和學習目標，然後讓AI在海量數據中自主尋找規律。就像老師無法規定學生大腦神經元如何連結一樣，工程師也無法完全預測AI最終會長成什麼樣子。因此生成式AI本質上是一個帶有隨機性的概率模型，而非精準的邏輯機器。

正因本質不同，我們熟悉的軟件常識在AI身上幾乎全盤失效。

首先是關於軟件除錯的迷思。傳統軟件出錯，通常源於邏輯漏洞，例如某幾行程式碼互相衝突了，工程師逐行審查即可修復。但AI的「錯誤」往往源於訓練數據本身的問題。以一個名為FineWeb的常用數據集為例，它包含約11.25萬億個單詞。若以每分鐘250詞的速度閱讀，需要超過八萬五千年才能讀完。面對這種TB級別的數據交互產生的湧現行為，工程師根本無法像審查代碼那樣審查AI的知識庫。

其次是可追溯性。傳統系統有Log（日誌）可查，但在深度學習的神經網絡黑盒中，要追溯究竟是哪一段數據導致AI說錯一句話，幾乎是不可能的任務。所以當AI犯錯時，我們並不理解導致錯誤的具體步驟，連AI的創造者也無法解釋這些「bug」從何而來。在發現問題時，AI工程師只能用更多數據重新訓練模型以抵銷壞影響，或乾脆篩選出更「乾淨」的數據集推倒重來，而無法精準解決它。

第三是難以徹底修復AI的異常行為。傳統Bug修好便永不再現，AI卻非如此。即使AI出現異常行為，你重新訓練後，它看似恢復正常，你也無法確定該異常行為已完全消失，只能說在你測試的指令（prompt）下它沒有再出現。實則完全有可能，別人用一個你沒想到的新指令，就能讓那個「已修復」的bug重新現形，此可謂「斬草不除根，春風吹又生」。

另外，AI並不具有輸入輸出的確定性。「確定性」是傳統電腦程式的基石。在同樣的環境下，輸入同樣的指令，必然得到同樣的結果。這也是企業敢於將核心業務交給電腦的原因。然而，生成式 AI 本質上是概率模型。即便是完全相同的 Prompt，只要系統設定的溫度參數（Temperature）略有不同，甚至只是在句尾多加一個問號，輸出的結果都可能天差地遠。這種不確定性雖賦予了 AI 擬人的創造力，卻也成為了導入它到標準化流程的最大阻礙。

最後是不可控性。傳統軟件是工程師意志的延伸，系統擁有的每一個功能，都是工程師預先編寫定義好的，不存在意外。但 AI 卻時常湧現出連創造者都未曾預料的能力。就像 Google 的工程師在完成訓練後才發現 AI 竟然學會了孟加拉語，或者能破解極需直覺的地理遊戲 Geoguessr，這些都不是原本計畫好的功能。正如前述，工程師只是提供教材與環境及AI的老師，無法完全預測 AI 最終會長成什麼樣子，當然也無法像控制傳統軟件那樣，百分之百掌控它的所有行為。

企業導入AI需告別「即插即用」的幻想

對企業來說，如果還抱著買 ERP 軟體的心態來導入 AI，以為付了錢就能馬上解決問題，那麼失敗是必然的。導入 AI 更像是一場內部的研發實驗，企業必須接受這是一個需要不斷試錯的動態過程。

許多高管期望 AI 能一步登天，今天導入便能完美運作，這種急功近利的心態正是項目失敗的主因。事實上，AI 需經歷數據處理、微調、提示詞工程及工作流磨合，才能從「60 分的玩具」進化為「80 分的助手」。

因此，企業應摒棄追求「一次性完美交付」的迷思，轉向「長期優化（Day Two）」思維——認知到系統上線僅是優化的起點，而非終點。同時，不要追求完全自動化，應採取「人機協作」模式，讓 AI 當副手，人類做最後把關。只有調整心態，用「做實驗」而非「做工程」的思維來面對 AI 轉型，企業才能在這波浪潮中真正獲益。

本文原刊於明報，刊登日期為 2025 年 12 月 31 日。

企業導入AI需告別「即插即用」的幻想

Sign up