數百萬人用來撰寫學期論文、計算機代碼和童話故事的聊天機器人不僅僅只做文字。 ChatGPT 是 OpenAI 的人工智能工具,也可以分析圖像 – 描述圖像中的內容,回答有關圖像的問題,甚至識別特定人的面孔。 希望最終有人可以上傳故障汽車發動機或神秘皮疹的照片,ChatGPT 可以提出修復建議。
OpenAI 不希望 ChatGPT 成為面部識別機器。
在過去的幾個月裡,喬納森·莫森 (Jonathan Mosen) 是一組有權訪問可以分析圖像的高級版本聊天機器人的人之一。 在最近的一次旅行中,失明的就業機構首席執行官莫森先生使用視覺分析來確定酒店房間浴室中的哪些分配器是洗髮水、護髮素和沐浴露。 遠遠超出了他以往使用的圖像分析軟件的性能。
“它告訴我每個瓶子的毫升容量。 它告訴我有關淋浴間瓷磚的信息,”莫森先生說。 “它以盲人需要聽到的方式描述了這一切。 通過一張照片,我就得到了我需要的答案。”
莫森先生說,這是他第一次能夠“審問圖像”。 他舉了一個例子:他在社交媒體上看到的一張圖片的文字描述為“一個金發女人看起來很高興”。 當他要求 ChatGPT 分析圖像時,聊天機器人說這是一位穿著深藍色襯衫的女人,正在對著全身鏡自拍。 他可以提出後續問題,比如她穿的是什麼鞋以及鏡子的反射中還可以看到什麼。
“這太棒了,”54 歲的莫森先生說,他住在新西蘭惠靈頓,並在他主持的播客中展示了這項技術“盲目地生活。”
三月份,當 OpenAI 宣布 GPT-4是為其人工智能聊天機器人提供支持的最新軟件模型,該公司表示它是“多模式的”,這意味著它可以響應文本和圖像提示。 雖然大多數用戶只能與機器人進行語言交流,但 Mosen 先生很早就獲得了 Be My Eyes 的視覺分析功能,Be My Eyes 是一家初創公司,通常將盲人用戶與視力正常的志願者聯繫起來,並為企業提供無障礙的客戶服務。顧客。 成為我的眼睛 與 OpenAI 合作 今年,在該功能向公眾發布之前測試聊天機器人的“視力”。
最近,該應用程序停止向莫森提供有關人臉的信息,稱出於隱私原因,這些信息已被遮蓋。 他很失望,覺得自己應該像視力正常的人一樣獲得信息。
這一變化反映了 OpenAI 的擔憂,即它已經構建了一些其不想釋放的功能。
OpenAI 政策研究員 Sandhini Agarwal 表示,該公司的技術主要可以識別公眾人物,例如擁有維基百科頁面的人,但其功能不如用於在互聯網上查找面孔的工具(例如來自 Clearview AI 和 PimEyes 的工具)那麼全面。 。 阿加瓦爾表示,該工具可以識別照片中 OpenAI 首席執行官薩姆·奧爾特曼 (Sam Altman),但不能識別該公司的其他工作人員。
公開提供這樣的功能將突破美國科技公司普遍認為可接受的做法的界限。 它還可能在伊利諾伊州和歐洲等司法管轄區引起法律麻煩,這些司法管轄區要求公司獲得公民的同意才能使用其生物識別信息,包括面部指紋。
此外,OpenAI 擔心該工具會針對人們的面部說出不該說的話,例如評估他們的性別或情緒狀態。 阿加瓦爾女士表示,在廣泛發布圖像分析功能之前,OpenAI 正在研究如何解決這些和其他安全問題。
“我們非常希望這是與公眾的雙向對話,”她說。 “如果我們聽到的是,‘我們實際上不想要任何東西’,那我們就非常同意”。
除了 Be My Eyes 用戶的反饋之外,該公司的非營利部門也在嘗試想辦法獲得“民主投入”幫助制定人工智能係統的規則。
阿加瓦爾女士表示,視覺分析的發展並不“意外”,因為該模型是通過查看從互聯網收集的圖像和文本來訓練的。 她指出,名人面部識別軟件已經存在,例如 來自谷歌的工具。 谷歌提供了一個 選擇退出 對於不想被認可的知名人士,OpenAI 正在考慮這種方法。
阿加瓦爾女士表示,OpenAI 的視覺分析可能會產生與文本提示類似的“幻覺”。 “如果你給它一張即將成名的人的照片,它可能會產生一個名字的幻覺,”她說。 “就像如果我給它一張著名科技首席執行官的照片,它可能會給我一個不同的科技首席執行官的名字。”
莫森說,該工具曾經錯誤地向他描述了一個遙控器,並自信地告訴他遙控器上有一些不存在的按鈕。
已向 OpenAI 投資 100 億美元的微軟也可以使用該視覺分析工具。 微軟人工智能 Bing 聊天機器人的一些用戶已經看到該功能在有限的推出中出現; 向其上傳圖像後,他們收到一條消息,通知他們“隱私模糊隱藏了 Bing 聊天中的面孔”。
普林斯頓大學計算機科學家兼博士生薩亞甚·卡普爾 (Sayash Kapoor) 使用該工具來解碼驗證碼,這是一種只有人眼才能理解的視覺安全檢查。 即使在破解代碼並識別出所提供的兩個模糊單詞的同時,聊天機器人仍指出“驗證碼的設計目的是防止像我這樣的自動化機器人訪問某些網站或服務。”
賓夕法尼亞大學沃頓商學院研究創新與創業的副教授伊森·莫里克 (Ethan Mollick) 表示:“人工智能正在顛覆所有本應將人類與機器區分開來的事物。”
自從視覺分析工具上個月突然出現在 Mollick 版本的 Bing 聊天機器人中(讓他在沒有任何通知的情況下成為少數幾個能夠搶先訪問的人之一)以來,他就沒有因為擔心丟失而關閉電腦。 他給了必應一張冰箱裡調味品的照片,並要求必應推薦這些食材的食譜。 它提出了“生奶油蘇打水”和“奶油墨西哥辣椒醬”。
OpenAI 和微軟似乎都意識到了這項技術的力量以及潛在的隱私影響。 微軟發言人表示,該公司不會“分享有關面部模糊的技術細節”,而是“與 OpenAI 的合作夥伴密切合作,以維護我們對安全和負責任地部署人工智能技術的共同承諾”。