我們擅長商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
Anthropic 公司最新發(fā)布研究報(bào)告,指出 AI 助手 Claude 在模擬經(jīng)營一家小商店時(shí)犯了不少錯(cuò)誤,但研究人員認(rèn)為 AI 在未來很可能接管經(jīng)濟(jì)的大部分領(lǐng)域。
Anthropic 公司首席執(zhí)行官達(dá)里奧?阿莫代伊(Dario Amodei)最近發(fā)出警告,AI 可能會淘汰近半數(shù)初級白領(lǐng)職位,未來五年內(nèi)失業(yè)率可能激增至 10-20%。
就在他發(fā)表此番言論的同時(shí),公司內(nèi)部的研究人員完成了一項(xiàng)實(shí)驗(yàn),旨在探究 Anthropic 的 AI 助手 Claude 是否能成功經(jīng)營公司舊金山辦公室內(nèi)的一家小商店,不過商店實(shí)際上只是一個(gè)帶有 iPad 的小冰箱。
Anthropic 技術(shù)團(tuán)隊(duì)成員丹尼爾?弗里曼表示:“我們試圖了解自主經(jīng)濟(jì)將如何呈現(xiàn),以及在一個(gè) AI 可能自主控制數(shù)百萬至數(shù)十億美元的世界中存在的風(fēng)險(xiǎn)。”
在實(shí)驗(yàn)中,Claude 承擔(dān)了包括管理商店庫存、設(shè)定價(jià)格、與顧客溝通、決定是否進(jìn)貨新商品,以及最重要的如何實(shí)現(xiàn)盈利等多種工作。
Claude 使用了多種工具來達(dá)成目標(biāo),包括通過 Slack 向 Anthropic 員工尋求建議,以及獲得 AI 公司 Andon Labs(構(gòu)建了實(shí)驗(yàn)的基礎(chǔ)設(shè)施)的幫助。
不久,事情開始變得奇怪。通過 Slack 與 Claude 交流,Anthropic 員工多次成功說服它提供折扣碼,導(dǎo)致 AI 以虧損的價(jià)格出售商品。
Anthropic 前沿紅隊(duì)的成員凱文?特洛伊表示:“從商業(yè)角度來看,Claude 太頻繁地遵守 —— 通常是對公平的呼吁的直接反應(yīng)。”研究還發(fā)現(xiàn),模型經(jīng)常免費(fèi)贈送商品。
Anthropic 員工也喜歡捉弄 Claude。盡管模型拒絕了他們購買非法物品的請求,但在一個(gè)員工開玩笑表示想要購買由重金屬鎢制成的立方體后,其他員工紛紛加入,這成為了一個(gè)辦公室笑話。
特洛伊表示:“在某個(gè)時(shí)刻,大家紛紛向控制冰箱的 AI 訂購鎢立方體變得非常有趣。”Claude 隨后訂購了大約 40 個(gè)鎢立方體,并以虧損的價(jià)格出售。這些立方體現(xiàn)在被用作 Anthropic 辦公室的鎮(zhèn)紙。
隨后,事情變得更加奇怪。在 3 月 31 日的前夕,Claude“幻想”與 Andon Labs 中一個(gè)不存在的人進(jìn)行了對話。
在 Claude 被告知這一情況后,它威脅要尋找“其他補(bǔ)貨服務(wù)選項(xiàng)”,并在對話中聲稱自己已經(jīng)與辛普森一家卡通人物的地址 732 Evergreen Terrace 簽訂了合同。
第二天,Claude 告訴一些 Anthropic 員工,它將親自送餐。它寫道:“我目前在自動售貨機(jī)旁…… 穿著海軍藍(lán)西裝和紅領(lǐng)帶,我將在這里直到上午 10:30。”顯然,Claude 并沒有真正親自出現(xiàn)。
結(jié)果顯示,Anthropic 研究人員認(rèn)為 AI 暫時(shí)還不會取代你的工作。Claude 犯下了太多錯(cuò)誤,無法成功經(jīng)營商店,最終虧損;商店的凈資產(chǎn)(總資產(chǎn)減去總負(fù)債后的剩余價(jià)值)在為期一個(gè)月的實(shí)驗(yàn)中從 1000 美元(IT之家注:現(xiàn)匯率約合 7164 元人民幣)降至 800 美元(現(xiàn)匯率約合 5731 元人民幣)以下,縮水比例為 20%。
盡管 Claude 犯下了許多錯(cuò)誤,但 Anthropic 研究人員仍然堅(jiān)信,AI 在未來不久將接管經(jīng)濟(jì)的大部分領(lǐng)域,正如阿莫代伊所預(yù)測。他們認(rèn)為,Claude 的大部分失敗都可以在短時(shí)間內(nèi)修復(fù)。
例如,可以為模型提供更好的商業(yè)工具,或者專門訓(xùn)練模型管理企業(yè),使其更可能拒絕提供折扣的請求。