任何被 ChatGPT 和 Bard 等人工智能聊天機器人所吸引的人——哇,他們可以寫論文和食譜! ——最終會陷入所謂的幻覺,即人工智能捏造信息的傾向。
聊天機器人根據從互聯網上獲得的信息來猜測該說什麼,但不可避免地會出錯。 當他們失敗時——例如,發布了一份麵粉測量極其不准確的蛋糕配方——這可能會真正引起轟動。
然而,隨著主流技術工具不斷集成人工智能,掌握如何使用它為我們服務至關重要。 在過去兩個月測試了數十種人工智能產品後,我得出的結論是,我們大多數人都以次優的方式使用該技術,這很大程度上是因為科技公司給了我們糟糕的指導。
當我們向聊天機器人提出問題,然後希望他們自己給出的答案都是真實的時,聊天機器人的好處是最少的,這就是它們的設計用途。 但是,當被指示使用來自可信來源(例如可信網站和研究論文)的信息時,人工智能可以高度準確地執行有用的任務。
“如果你給他們正確的信息,他們就可以用它做有趣的事情,”人工智能初創公司 Context 的創始人 Sam Heutmaker 說。 “但就其本身而言,你得到的信息中有 70% 是不准確的。”
通過建議聊天機器人處理特定數據的簡單調整,他們生成了易於理解的答案和有用的建議。 在過去的幾個月裡,這讓我從一個脾氣暴躁的人工智能懷疑論者變成了一個熱情的超級用戶。 當我使用ChatGPT規劃的旅行行程去旅行時,進展順利,因為推薦來自我最喜歡的旅行網站。
將聊天機器人引導至特定的高質量來源,例如來自知名媒體和學術出版物的網站,也有助於減少錯誤信息的產生和傳播。 讓我分享一些我在烹飪、研究和旅行計劃方面獲得幫助的方法。
膳食計劃
像 ChatGPT 和 Bard 這樣的聊天機器人可以編寫理論上看起來不錯但在實踐中行不通的食譜。 在《紐約時報》食品台去年 11 月的一項實驗中,早期的人工智能模型創建了感恩節菜單的食譜,其中包括極其乾的火雞和緻密的蛋糕。
我在人工智能生成的海鮮食譜中也遇到了令人印象深刻的結果。 但當我嘗試使用 ChatGPT 插件時,情況發生了變化,這些插件本質上是與聊天機器人配合使用的第三方應用程序。 (只有每月支付 20 美元訪問最新版本的聊天機器人 ChatGPT4 的訂閱者才能使用插件,該插件可以在設置菜單中激活。)
在 ChatGPT 的插件菜單中,我選擇了 Tasty Recipes,它從知名媒體網站 BuzzFeed 擁有的 Tasty 網站中提取數據。 然後,我要求聊天機器人使用網站上的食譜制定一份膳食計劃,包括海鮮菜餚、豬肉末和蔬菜配菜。 該機器人提出了一個鼓舞人心的膳食計劃,包括檸檬草豬肉三明治、烤豆腐玉米捲和冰箱裡的意大利面; 每份膳食建議都包含一個指向 Tasty 上食譜的鏈接。
對於其他出版物中的食譜,我使用了 Link Reader,這是一個插件,可讓我粘貼網絡鏈接,以使用來自其他可信網站(如 Serious Eats)的食譜生成膳食計劃。 聊天機器人從網站上提取數據來創建膳食計劃,並告訴我訪問網站來閱讀食譜。 這需要額外的工作,但它擊敗了人工智能製定的膳食計劃。
研究
當我為一篇關於流行視頻遊戲系列的文章做研究時,我求助於 ChatGPT 和 Bard,通過總結他們的情節來刷新我對過去遊戲的記憶。 他們搞砸了遊戲故事和角色的重要細節。
在測試了許多其他人工智能工具後,我得出的結論是,對於研究來說,關注可信來源并快速仔細檢查數據的準確性至關重要。 我最終找到了一個可以實現這一目標的工具:Humata.AI,這是一款在學術研究人員和律師中廣受歡迎的免費網絡應用程序。
該應用程序允許您上傳 PDF 等文檔,然後聊天機器人會在文檔副本旁邊回答您有關該材料的問題,並突出顯示相關部分。
在一次測試中,我上傳了在 PubMed(政府運營的科學文獻搜索引擎)上找到的一篇研究論文。 該工具在幾分鐘內就生成了這份冗長文檔的相關摘要,而這個過程可能需要我幾個小時,我瀏覽了一下重點內容,再次檢查摘要是否準確。
總部位於德克薩斯州奧斯汀的 Humata 創始人賽勒斯·卡吉萬迪 (Cyrus Khajvandi) 表示,他在斯坦福大學擔任研究員時開發了這款應用程序,當時他需要幫助閱讀厚重的科學文章。 他說,像 ChatGPT 這樣的聊天機器人的問題在於它們依賴於過時的網絡模型,因此數據可能缺乏相關的上下文。
旅行計劃
當《泰晤士報》的一位旅行作家最近要求 ChatGPT 為米蘭制定旅行行程時,機器人引導她參觀了城鎮的中心區域,該區域因意大利假期而荒蕪,還有其他一些混亂。
當我為我、我的妻子和我們的狗在加利福尼亞州門多西諾縣申請度假行程時,我的運氣比較好。就像我在計劃用餐時所做的那樣,我要求 ChatGPT 採納一些我最喜歡的旅遊網站的建議,例如 Thrillist、由 Vox 和《泰晤士報》旅遊版塊所有。
幾分鐘之內,聊天機器人就生成了一條行程,其中包括對狗友好的餐廳和活動,包括一個提供葡萄酒和奶酪搭配的農場,以及前往一條受歡迎的遠足小徑的火車。 這讓我節省了幾個小時的計劃時間,最重要的是,狗們度過了一段美好的時光。
底線
與微軟密切合作的谷歌和 OpenAI 表示,他們正在努力減少聊天機器人中的幻覺,但我們已經可以通過控制機器人得出答案所依賴的數據來獲得人工智能的好處。
換句話說:投資人工智能公司的風險投資家內森·貝奈奇(Nathan Benaich)表示,擁有大量數據集的訓練機器的主要好處是它們現在可以使用語言來模擬人類推理。 他說,對我們來說重要的一步是將這種能力與高質量的信息結合起來。