在我們的第二個 五集系列,我將解釋該技術的實際工作原理。
為 ChatGPT、微軟的 Bing 聊天機器人和谷歌的 Bard 提供動力的人工智能可以進行類似人類的對話,並就無窮無盡的主題撰寫自然流暢的散文。 他們還可以執行複雜的任務,從編寫代碼到計劃孩子的生日聚會。
但這一切是如何運作的? 要回答這個問題,我們需要深入了解一種叫做大型語言模型的東西——驅動這些系統的人工智能類型。
大型語言模型或 LLM 在 AI 領域相對較新。 第一批大約五年前才出現,而且不是很好。 但今天他們可以起草電子郵件、演示文稿和備忘錄, 用外語輔導你. 隨著技術的進步和矽谷爭先恐後地從中獲利,未來幾個月和幾年肯定會出現更多功能。
我將引導您從頭開始建立一個大型語言模型,簡化事情並省去很多困難的數學。 假設我們正在嘗試構建一個 LLM 來幫助您回復電子郵件。 我們稱它為 MailBot。
第一步:設定目標
每個人工智能係統都需要一個目標。 研究人員稱這為 目標函數. 它可以很簡單——例如,“贏得盡可能多的國際象棋比賽”——也可以很複雜,比如“預測蛋白質的三維形狀,只使用它們的氨基酸序列”。
大多數大型語言模型都具有相同的基本目標函數:給定一個文本序列,猜測接下來會發生什麼。 我們稍後會為 MailBot 提供更具體的目標,但現在讓我們堅持這個目標。
第 2 步:收集大量數據
接下來,我們需要組裝訓練數據來教 MailBot 如何寫作。 理想情況下,我們將建立一個龐大的文本存儲庫,這通常意味著從互聯網上抓取的數十億頁——比如博客文章、推文、維基百科文章和新聞報導。
新一代聊天機器人
一個勇敢的新世界。 一批由人工智能驅動的新型聊天機器人引發了一場爭論,以確定該技術是否可以顛覆互聯網的經濟,將今天的強者變成過時的,並創造出該行業的下一個巨頭。 以下是需要了解的機器人:
首先,我們將使用一些免費的、公開可用的數據庫,例如 Web 數據的 Common Crawl 存儲庫。 但我們也想以專有或專業數據的形式添加我們自己的秘方。 也許我們會許可一些外語文本,以便 MailBot 學會用法語或西班牙語以及英語撰寫電子郵件。 一般來說,我們擁有的數據越多,來源越多樣化,我們的模型就會越好。
在將數據輸入模型之前,我們需要將其分解為稱為標記的單元,這些單元可以是單詞、短語甚至單個字符。 將文本轉換成一口大小的塊有助於模型更輕鬆地分析它。
第 3 步:構建你的神經網絡
一旦我們的數據被標記化,我們就需要組裝人工智能的“大腦”——一種稱為神經網絡的系統。 這是一個處理和存儲信息的互連節點(或“神經元”)的複雜網絡。
對於 MailBot,我們將要使用一種相對較新的神經網絡類型,稱為 變壓器型號. 他們可以同時分析多段文本,從而更快、更高效。 (Transformer 模型是 ChatGPT 等系統的關鍵——其完整首字母縮寫詞代表“Generative Pretrained Transformer”。)
第 4 步:訓練您的神經網絡
接下來,該模型將逐個標記地分析數據,識別模式和關係。 它可能會注意到“親愛的”後面通常跟著一個名字,或者“最好的問候”通常出現在您的名字之前。 通過識別這些模式,人工智能學習如何構建有意義的消息。
該系統還培養了一種情境感。 例如,它可能會了解到“銀行”可以指代金融機構或河邊,具體取決於周圍的詞。
當它學習這些模式時,transformer 模型勾勒出一幅地圖:人類語言的極其複雜的數學表示。 它使用稱為的數值來跟踪這些關係 參數. 許多當今最好的 LLM 都有數千億或更多的參數。
培訓可能需要幾天甚至幾週的時間,並且需要大量的計算能力。 但是一旦完成,它幾乎就可以開始編寫您的電子郵件了。
奇怪的是,它還可以發展其他技能。 隨著法學碩士學習預測序列中的下一個單詞,一遍又一遍,他們可以獲得其他意想不到的能力,例如知道如何編碼。 AI 研究人員稱這些為突發行為,他們有時仍然對它們感到困惑。
第 5 步:微調您的模型
一旦訓練了大型語言模型,就需要針對特定工作對其進行校準。 例如,醫院使用的聊天機器人可能需要理解醫學術語。
為了微調 MailBot,我們可以要求它生成一堆電子郵件,僱人對它們的準確性進行評分,然後將評分反饋回模型,直到它改進為止。
這是與 ChatGPT 一起使用的方法的粗略近似,稱為 強化學習與人類反饋.
第 6 步:小心啟動
恭喜! 一旦 MailBot 經過培訓和微調,就可以使用了。 在你為它構建某種用戶界面之後——比如插入你的電子郵件應用程序的 Chrome 擴展——它就可以開始發送電子郵件了。
但無論它看起來有多好,您仍然會想要密切關注您的新助手。 像 Microsoft 和 Meta 這樣的公司已經吸取了慘痛的教訓,人工智能係統可能不穩定且不可預測,甚至變得令人毛骨悚然和危險。
明天,我們將聽到更多關於事情如何以意想不到的、有時令人不安的方式出錯的信息。
你的家庭作業
讓我們探索 LLM 更具創造性的能力之一:將不同的概念和格式組合成奇異的新事物的能力。 例如,我們在 Well 的同事要求 ChatGPT“用 Taylor Swift 的聲音寫一首歌,並使用蘇斯博士書中的主題。”
對於今天的作業,嘗試混合搭配一種格式、一種風格和一個主題——例如,“以史努比狗狗的風格寫一首關於全球變暖的打油詩。”
不要忘記在評論中分享您的創作。
測驗
第 1 個問題,共 3 個
ChatGPT 等大型語言模型的主要目標函數是什麼?
選擇您的答案開始測驗。
詞彙表
-
變壓器型號: 一種有助於理解語言的神經網絡架構,它不必一次分析一個單詞,而是可以一次查看整個句子。 一種稱為自註意力的技術允許模型專注於對理解句子含義很重要的特定單詞。
-
參數: 定義大型語言模型的結構和行為的數值,例如幫助它猜測下一個單詞的線索。 像 GPT-4 這樣的現代系統被認為具有數千億個參數。
-
強化學習: 一種教導 AI 模型通過反複試驗找到最佳結果,並根據其結果從算法中獲得獎勵或懲罰的技術。 該系統可以通過人類對其性能提供反饋來增強。
單擊此處了解更多詞彙表術語。