在近期的企業諮詢與大學講課時,筆者發現無論是企業高管還是初入茅廬的學生,不少人都有把對軟件的認知,張冠李戴地套在生成式AI身上的問題。例如,大眾普遍認為:程式有漏洞(Bug)就該修復,軟件不成熟就等它更新,出了問題就找工程師排查程式碼。然而,這種源自電腦手機時代的線性思維,套用在生成式AI上,實是刻舟求劍。
前文「壓縮即智能,語言即世界」提到過傳統軟件及AI的本質差別。在傳統軟件開發過程,工程師如同戰場上的「將軍」,發出的每一條指令(Code)都是軍令,系統必須百分之百執行。而在開發生成式AI時,工程師的角色更像是「教師」。我們提供教材(訓練數據)、制定課程(演算法)和學習目標,然後讓AI在海量數據中自主尋找規律。就像老師無法規定學生大腦神經元如何連結一樣,工程師也無法完全預測AI最終會長成什麼樣子。因此生成式AI本質上是一個帶有隨機性的概率模型,而非精準的邏輯機器。
正因本質不同,我們熟悉的軟件常識在AI身上幾乎全盤失效。
首先是關於軟件除錯的迷思。傳統軟件出錯,通常源於邏輯漏洞,例如某幾行程式碼互相衝突了,工程師逐行審查即可修復。但AI的「錯誤」往往源於訓練數據本身的問題。以一個名為FineWeb的常用數據集為例,它包含約11.25萬億個單詞。若以每分鐘250詞的速度閱讀,需要超過八萬五千年才能讀完。面對這種TB級別的數據交互產生的湧現行為,工程師根本無法像審查代碼那樣審查AI的知識庫。
其次是可追溯性。傳統系統有Log(日誌)可查,但在深度學習的神經網絡黑盒中,要追溯究竟是哪一段數據導致AI說錯一句話,幾乎是不可能的任務。所以當AI犯錯時,我們並不理解導致錯誤的具體步驟,連AI的創造者也無法解釋這些「bug」從何而來。在發現問題時,AI工程師只能用更多數據重新訓練模型以抵銷壞影響,或乾脆篩選出更「乾淨」的數據集推倒重來,而無法精準解決它。
第三是難以徹底修復AI的異常行為。傳統Bug修好便永不再現,AI卻非如此。即使AI出現異常行為,你重新訓練後,它看似恢復正常,你也無法確定該異常行為已完全消失,只能說在你測試的指令(prompt)下它沒有再出現。實則完全有可能,別人用一個你沒想到的新指令,就能讓那個「已修復」的bug重新現形,此可謂「斬草不除根,春風吹又生」。
另外,AI並不具有輸入輸出的確定性。「確定性」是傳統電腦程式的基石。在同樣的環境下,輸入同樣的指令,必然得到同樣的結果。這也是企業敢於將核心業務交給電腦的原因。 然而,生成式 AI 本質上是概率模型。即便是完全相同的 Prompt,只要系統設定的溫度參數(Temperature)略有不同,甚至只是在句尾多加一個問號,輸出的結果都可能天差地遠。這種不確定性雖賦予了 AI 擬人的創造力,卻也成為了導入它到標準化流程的最大阻礙。
最後是不可控性。傳統軟件是工程師意志的延伸,系統擁有的每一個功能,都是工程師預先編寫定義好的,不存在意外。 但 AI 卻時常湧現出連創造者都未曾預料的能力。就像 Google 的工程師在完成訓練後才發現 AI 竟然學會了孟加拉語,或者能破解極需直覺的地理遊戲 Geoguessr,這些都不是原本計畫好的功能。正如前述,工程師只是提供教材與環境及AI的老師,無法完全預測 AI 最終會長成什麼樣子,當然也無法像控制傳統軟件那樣,百分之百掌控它的所有行為。
企業導入AI需告別「即插即用」的幻想
對企業來說,如果還抱著買 ERP 軟體的心態來導入 AI,以為付了錢就能馬上解決問題,那麼失敗是必然的。導入 AI 更像是一場內部的研發實驗,企業必須接受這是一個需要不斷試錯的動態過程。
許多高管期望 AI 能一步登天,今天導入便能完美運作,這種急功近利的心態正是項目失敗的主因。事實上,AI 需經歷數據處理、微調、提示詞工程及工作流磨合,才能從「60 分的玩具」進化為「80 分的助手」。
因此,企業應摒棄追求「一次性完美交付」的迷思,轉向「長期優化(Day Two)」思維——認知到系統上線僅是優化的起點,而非終點。同時,不要追求完全自動化,應採取「人機協作」模式,讓 AI 當副手,人類做最後把關。只有調整心態,用「做實驗」而非「做工程」的思維來面對 AI 轉型,企業才能在這波浪潮中真正獲益。
本文原刊於明報,刊登日期為 2025 年 12 月 31 日。