AI革命的標尺：得「驗證」者得天下

近來人工智能（AI）發展一日千里，人們熱議哪些工作將被取代，哪些行業會被顛覆。近月AI行業提出了「驗證者法則」（Verifier’s Rule），向社會宣示AI未來將攻克哪些領域，以及攻克的速度。簡單來說，一項任務的驗證結果的難度愈低，AI把它商品化的速度就越快。

驗證與生成的不對稱性

這個法則的核心，源於一個計算機科學的基本概念：「驗證與生成的不對稱性」。簡單來說，許多任務，「驗證」一個答案的對錯，遠比「生成」這個答案本身來得容易。

我們可以從日常經驗中找到佐證。解開一局數獨可能頗費心神，但拿到一份填好的答案，核對其是否符合規則，卻是輕而易舉。又如編寫Facebook的程式碼，雖然工程浩大，需動員數千工程師，但要驗證其功能有否問題，只需用戶瀏覽網頁、點擊功能，便能判斷其運作成效。在這兩個例子中，「生成」答案困難，「驗證」相對容易。

當然，世事並非總是如此。有些情況恰好相反。例如，寫一篇引經據典、看似頭頭是道的文章，要花的時間不多；但要逐一核實文中每項事例數據的真偽，所花費的工夫絕對遠超寫作本身。又或者，一般人花十秒鐘就能提出一個嶄新的飲食建議，如「吃白肉最健康」，但要科學地驗證此說法的成效，則需要大量樣本、長期追蹤，過程既昂貴又充滿變數。這類任務，便屬於「生成易、驗證難」的範疇。

我們可以想像一個坐標圖，X軸代表「生成解方」的難度，Y軸則是「驗證解方」的難度。數獨和編寫大型軟件，都落在「生成難、驗證易」的象限。寫作及提出科學假想，則落在「生成易、驗證難」的象限

容易驗證結果好壞的任務，終將被AI攻克

「驗證者法則」主張，訓練AI解決任務的能力，與該任務的可驗證性成正比。換言之，任何可清晰界定對錯、且易於驗證的任務，終將被AI攻克。

何謂「易於驗證」？我們可從五個維度衡量：

客觀性：是否有明確的對錯標準？
速度：驗證過程是否足夠快速？
可擴展性：能否規模化、自動化地批量驗證？
低噪音：驗證結果是否穩定、不受干擾？
連續反饋：除了「對」與「錯」，能否提供一個從0到100分的評級，衡量方案的優劣？

過去五年，幾乎所有我們熟知的AI能力測試，本身都具備高度可驗證的特性，結果它們也相對迅速地被AI逐一破解。這正是法則的體現。

要理解這法則的威力，只需看看日常生活中無處不在的物流配送。想像一下，一位速遞員要派送一百個包裹到城市不同角落。如何規劃一條最短、最省時的路線？這是一個極其複雜的組合優化問題，人腦難以找到最佳解。

但這個任務，卻是AI的絕佳舞台，因它完美符合上述五個驗證標準：路線的總公里數或總耗時，便是客觀的評分標準；電腦能快速計算出任何一條路線的總長度，並能批量比較成千上萬種方案；地圖上的距離是固定的，結果精確低噪音；路線A比路線B短1公里，優劣立判，這就是連續反饋。

AI的策略可以是：

生成（Sample）：先隨機生成大量可行的送貨路線方案。
評估（Grade）：接著，系統自動為每個方案評分（即計算總路程）。
迭代（Iterate）：然後，它會淘汰劣質路線，並從最優的幾條路線中學習特徵（例如，先走完某個區域），再生成一批可能更佳的新路線。

透過龐大算力支持，重複這個「生成—評估—迭代」循環數以百萬次，AI最終能找到一條遠勝人手規劃的最佳路線，為物流公司節省大量燃油和時間成本。

總括而言，「驗證的不對稱性」為個人與企業的未來發展，提供了一個清晰的思考框架。我們可以運用這個框架，審視自身或團隊的技能組合，判斷它們在「生成」與「驗證」難度的坐標圖上處於何種位置。「驗證者法則」的啟示是明確的：凡是易於驗證的任務，其對應的技能終將被AI攻克，並迅速商品化，失去其稀缺價值。因此，要在未來保持競爭力，關鍵在於找出並培養那些「難以驗證」、不易被量化的能力，這才是AI浪潮下，個人與組織得以持續立足的護城河。

掌握「標尺」，掌握未來

這個定律給我們帶來兩點重要啟示。

首先，在自動化的浪潮中，最先被衝擊的，將是那些驗證環節極為清晰、客觀、快速的工種。這些領域的專業知識，將率先被AI透過海量試錯與迭代所取代。

其次，未來一個極具潛力的創新方向，在於「發明衡量事物的方法」。在許多領域，如創意、美學、用戶體驗、企業文化等，我們之所以難以借助AI進行優化，根本原因在於缺乏一套客觀、快速、可擴展的評估體系。

誰能為這些看似主觀、模糊的領域，設計出一把精準的「驗證標尺」，誰就掌握了開啟AI優化大門的鑰匙。這無論對於初創企業尋找藍海，還是傳統行業尋求突破，都將是一個價值連城的機遇。所以說，在這場AI革命中，得「驗證」者，得天下。

本文原刊於明報，刊登日期為 2025 年 11 月 11 日。

驗證與生成的不對稱性

容易驗證結果好壞的任務，終將被AI攻克

掌握「標尺」，掌握未來

Sign up