理論面〉沒有一項技術可以取代專業能力 許多企業都以為,生成式AI能讓新手迅速成為專家;但研究顯示,缺乏專業知識的新手還是難成氣候,反而是專家的表現有望更上一層樓。生成式AI不是萬靈丹,前提仍需進行組織結構與文化的變革。 插圖/卡爾文.斯普拉格(Calvin Sprague)
從文案撰寫到軟體開發,領導人正寄望生成式AI能協助員工承擔更高階的職務。麻省理工學院(MIT)教授大衛.奧托(David Autor)及其他人的研究指出,生成式AI可縮短新手勝任新任務的時間。然而,對於這項技術提升員工技能的潛力,我們仍然知之甚少。這其中包括一項關鍵問題:生成式AI能否讓員工表現得像專家一樣好? 為了找到答案,史丹福大學(Stanford University)與哈佛商學院數位資料設計研究所(Digital Data Design Institute)的研究人員,進行了一項對照實驗,參與者是英國金融科技公司IGGroup的78位員工。研究人員先將員工分成3組,分別是專家組、鄰近專家的外行組、遠離專家的外行組。專家組包括經常為IG網頁撰寫文章的寫手;鄰近專家的外行組則是與寫手同一部門的行銷專員,他們沒有文章寫作經驗,但大致了解這些寫手的工作內容;遠離專家的外行組是開發人員及數據科學家,他們完全沒有行銷或寫作背景。每一組都要完成兩項任務:先構思一篇類似公司網頁上的文章,然後再寫出來。研究人員隨機分配生成式AI協助部分參與者(其他參與者則無),再由IG的高階主管,按1(最差)到5(最好)的分數,來評定每位參與者的寫作成果。
從文案撰寫到軟體開發,領導人正寄望生成式AI能協助員工承擔更高階的職務。麻省理工學院(MIT)教授大衛.奧托(David Autor)及其他人的研究指出,生成式AI可縮短新手勝任新任務的時間。然而,對於這項技術提升員工技能的潛力,我們仍然知之甚少。這其中包括一項關鍵問題:生成式AI能否讓員工表現得像專家一樣好? 為了找到答案,史丹福大學(Stanford University)與哈佛商學院數位資料設計研究所(Digital Data Design Institute)的研究人員,進行了一項對照實驗,參與者是英國金融科技公司IGGroup的78位員工。研究人員先將員工分成3組,分別是專家組、鄰近專家的外行組、遠離專家的外行組。專家組包括經常為IG網頁撰寫文章的寫手;鄰近專家的外行組則是與寫手同一部門的行銷專員,他們沒有文章寫作經驗,但大致了解這些寫手的工作內容;遠離專家的外行組是開發人員及數據科學家,他們完全沒有行銷或寫作背景。每一組都要完成兩項任務:先構思一篇類似公司網頁上的文章,然後再寫出來。研究人員隨機分配生成式AI協助部分參與者(其他參與者則無),再由IG的高階主管,按1(最差)到5(最好)的分數,來評定每位參與者的寫作成果。
在沒有生成式AI的協助下,寫手在文章構思上獲得的平均分數最高(3.82),其次是獲得3.04分的行銷專員,最後則是拿到3.02分的技術人員。這項結果顯示,專家組與其他兩組在技能上有著顯著差異。然而,當參與者有生成式AI的協助時,差異開始縮小。寫手的構思平均得到4.12分,行銷專員與技術人員則分別得到4.18與4.05分。換句話說,行銷專員在生成式AI的加持下,略勝使用AI的寫手,而且使用生成式AI的三組,表現全都超越沒有使用生成式AI的寫手。 然而,在文章寫作這個層面上,結果就不同了。在沒有生成式AI的協助下,寫手表現最佳。但即使有生成式AI的加持,非專家寫出來的文章,品質也不如專家。使用生成式AI的結果不難預料,寫手表現最佳(平均得3.96分);行銷專員緊跟其後,拿到3.92分。但有AI協助的技術人員,表現不如行銷專員;事實上,他們用或不用的分數差不多,各為3.38與3.42。 生成式AI的高牆 為何生成式AI能讓其中一項任務的表現勝過其他任務,而且對技術人員的寫作幫助很小? 訪談過參與者後,研究人員的結論是即使有生成式AI的加持,若員工愈缺乏某項任務需要的知識,他們的表現就愈難比得上具有相關專業的同事。運用生成式AI的非專家,在構思上的表現比專家還要好,這是因為構思需要的專業能力比寫作來得少(只要知道AI提出的題目夠不夠好)。然而,寫文章需要知道如何運用適當語言傳達希望傳達的訊息。一位參與者打比方說明兩者的差別:構思就如同想像參加一場馬拉松,寫作則是要真正上場跑,兩者的專業水準要求截然不同。 研究人員發現,專業能力是使用者與AI工具更有效配合的關鍵。行銷專員了解寫手常常使用的語言,他們也具備足夠的領域知識來改進生成式AI產生的內容。然而,技術人員(他們的工作與寫作無關)無法有效地運用或改善AI的建議。他們缺乏必要的直覺與知識,無法妥善決定哪些語言表達該保留或捨棄;研究人員稱此種現象為「AI高牆」(AIwall),它限制了生成式AI能幫助人們執行專業能力以外任務的程度。 這個發現會影響組織對生成式AI工具的部署。它挑戰了一項既有的假定:技術可以將技能層級扁平化,也可以促成學界所謂的「普遍任務流動」(universal task fluidity)。 研究人員指出,生成式AI的成效取決於使用者和任務領域之間的專業能力距離。此外,他們也主張,AI高牆不只存在於寫手與技術人員之間。研究人員建議採取兩項最佳實務,將生成式AI與不同專業程度的員工進行搭配運用: 勿高估生成式AI的能力。要將AI運用到某個領域時,員工須對這個領域有基本認識,也要有一些經驗。他們的知識廣度至少要足以讓他們評估和改進AI生成的內容。舉例來說,在前述的寫作研究中,許多技術人員缺乏必要的精細判斷力,無法調整與整合語句,只能將生成式AI的建議複製貼到文章裡。主持這項研究的史丹福大學博士後研究員路卡.溫卓米奈利(LucaVendraminelli)表示:「如果AI沒辦法將任務完全自動化,它就不會是解決工作大小事的神奇萬靈丹。當AI無法獨立執行工作,但又要取代專家時,它確實可以協助某些人縮小他們與專家的差距,但這只限於特定情況,也必須有適當的條件。AI不是一體適用的解決方案。」 重新思索工作完成方式。當員工開始有效運用生成式AI,不妨考慮組織需要採取哪些變革。要從生成式AI取得最大價值,企業必須改變流程、決策方法,以及團隊合作的方式。生成式AI工具甚至還可能模糊掉領域彼此相關的職稱,像是SEO(搜尋引擎最佳化)專員和內容策略專員。不過,要是領域差異較大(如行銷、銷售及產品團隊之間就是如此),運用生成式AI工具來弭平差異就會困難許多,因為這些工作涉及不同的專業能力、預算與權力結構。把工作內容設計得更廣泛、更有彈性,有助於克服這項挑戰,但這個轉變需要組織改變結構與文化。 此外,當你將生成式AI整合進工作流程時,也別忽略人的層面:使用者是誰?他們具備哪些知識?他們解讀與改進AI產出的能力如何?溫卓米奈立表示:「AI的幫忙有其限度,專業能力仍是無可取代。沒有一項技術可以取代專業能力。」 關於這項研究 〈生成式AI高牆效應:檢視專業能力在業內與業外人士間水平移轉的極限〉(The GenAI Wall Effect:
Examining the Limits to Horizontal Expertise Transfer Between Occupational Insiders and Outsiders),路卡.溫卓米奈立(Luca Vendraminelli)等人合著(工作論文,2025年)。 版權所有,請勿影印重製,若需購買單篇文章,請上本刊網站。 …本文摘錄自 哈佛商業評論全球繁體中文版 2026/3月號
閱讀完整內容


