本文共1430字
GAI浪潮來襲,2023被視為生成式AI元年,對台灣產業是巨大挑戰,也是難得的機遇。
面對GAI帶來的機會與挑戰,愈來愈多企業、單位意識到透過生成式AI,可以為營運帶來諸多效益,包含提升人員的生產力、縮短冗長的流程,進而發揮人力價值,投入到更具創新創意的工作項目。不過,在導入生成式AI工具之前,企業應注意三大面向,包括:選擇合理與合適的模型、AI模型落地考量、及注意生成的內容可能參雜偏見,才能運用GAI活絡產業創新轉型,助產業在下世代產業競賽中爭得一席之地。
生成式AI之所以被廣泛應用在眾多產業,很重要原因是模型訓練的技術推展。其學習的方式可以分成兩個階段,第一個階段是利用巨量資料預訓練,不需人工標記資料,而是透過自監督式的學習而訓練出基礎模型,以人類學習相比,就像小學到中學進行基礎教育。到了第二階段,機器學習採用少量的人工標記資料,搭配網路做調適,產生出客製化的模型,類似人類在大學接受分科教育,透過特殊領域的訓練而具備專業知識。
而企業在選擇AI工具時,需要注意的第一個面向,也就是合理與合適的模型選擇。特別是大型基礎模型,由於模型參數量、訓練資料量相當龐大,背後所需要的訓練費用也相當可觀。因此在不影響模型性能的前提下,採用合理的參數量及訓練資料量,才能顧及到後續的維運成本。
此外,在導入大型語言模型(LLM)之前,建議企業可構思一個AI建置的象限圖,橫軸左右兩端分別是大型LLM與微型LLM,縱軸上下兩端分別為專才型LLM與通用型LLM。根據自身商業模式及業務需求,思考導入的AI模型較適合坐落在哪個象限。以金融、醫藥產業為例,這類資料特別關注隱私,適合微型化私有雲建置,同時訓練資料側重高專業度,因此就會落在第一象限內,屬於「微型」及「專才型」LLM,僅需要少量訓練數據,但同時又能滿足即時效率需求。
根據目前觀察,企業部署生成式AI建置可以分為三種情境,第一種是使用既有模型以web UI進行互動的端對端應用;第二種是使用導入閉源通用型模型,例如Azure Open AI、台智雲AFS; 第三種則是企業垂直領域應用,以開源基礎模型及微調模型出發,再以領域資料,搭配客製化的模型調適進行垂直部屬。
不論哪一種情境,企業要關注的第二個面向,也就是AI模型落地前後可能遭遇的用瓶頸與風險,必須有全盤的評估及相關配套措施。以瓶頸來說,例如基礎建設層的資料可得性是否容易?模型層則會遇到找合作夥伴或自行開發的抉擇,以及應用層需要考量開源、閉源哪個方案較適合?
在評估過程中,也要思考可能後續產生的風險,例如導入過程中,可能就會發生員工未經充分指導私自使用模型,或生成結果的智慧財產權疑慮問題。模型層的風險,來自傳送資料時可能產生洩漏,或是GAI互動過程產生新型態的資安漏洞,這些潛在議題都需要特別納入決策考量。
至於第三個要注意的面向,來自於AI模型在餵養資料或生成答案時,有時訓練用的資料可能有隱私權爭議,是否有其他替代方案;以及生成的內容存在偏見、幻覺。因此建議企業,對於LLM的輸出應具有可解釋性,這部分可嘗試導入RAG(Retrieval Augmented Generation)同時解決幻覺及資料更新問題,在偏見的移除可以RCI(Recursive Criticism and Improvement)機制提供模型內部輸出的偏見檢測回饋,迭代調整合理的結果與建議,讓企業能開放心胸享受AI帶來的自動化生產優勢。(作者是工研院資通所暨服科中心技術長)
※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容
留言