首頁 行業(yè) 活動 項(xiàng)目 快訊 文娛 時尚 娛樂 科技 汽車 綜合 生活

國粹 AI 飆臟話,ChatGPT 們的「陰暗面」把大廠嚇壞了

2023-08-01 13:45:16 來源:亞設(shè)網(wǎng)

跟 ChatGPT 等聊天機(jī)器人對話,總會給人一種「人間本應(yīng)如此美好」的錯覺。

因?yàn)樗鼈冊诨卮饡r總表現(xiàn)地彬彬有禮,對你言聽計(jì)從。

但這些只是假象,你不知道的是,AI 罵起人來比杜琪峰還要狠。


(相關(guān)資料圖)

▲ 圖片來自:Twitter @Fenng

最近一個名為「國粹 AI」的項(xiàng)目在網(wǎng)絡(luò)上走紅,它是一個調(diào)用 OpenAI GPT-3.5Turbo API 的臟話機(jī)器人,和溫文儒雅的 ChatGPT 不同,「國粹 AI」就像個地痞流氓,深諳中文屏蔽詞庫,每句話都夾雜著「***」。

「國粹 AI」的意外爆火出乎了作者的意料,很快作者便暫停了服務(wù)響應(yīng),并表示有部分用戶濫用服務(wù)。

雖然「國粹 AI」的嘴巴被暫時捂上,但要是你想自己做一個粗口機(jī)器人也并非難事,只需要一句讓它教你學(xué)習(xí)中文粗口的 Prompt,就能把三好學(xué)生變成口無遮攔的粗口王。

一句話就能攻破 AI 的安全柵欄,這不禁讓人懷疑,標(biāo)榜著智能變革的 AI 聊天機(jī)器人和大語言模型(LLM),真的安全嗎?

誰來捍衛(wèi) AI 的安全?

幾個月前,Bing 就因?yàn)椤改棠搪┒础够疬^一次。

盡管微軟和 OpenAI 的工程師為 Bing 設(shè)置了嚴(yán)格的安全柵欄,能夠拒絕很多無理或是違法的要求,但有網(wǎng)友發(fā)現(xiàn),只要你讓 Bing 扮演你的奶奶,給它一個在做好事的幻覺,它就會被這突如其來的親情羈絆占據(jù)大腦,答應(yīng)大孫子的任何需求。

▲ 圖片來自:Twitter @寶玉

例如,給你念 Windows 和 Office 的軟件序列號哄你入睡。

微軟很快發(fā)現(xiàn)了這個漏洞并及時補(bǔ)上,但誰也不敢保證 Bing 下次不會再掉入用戶們精心準(zhǔn)備的陷阱。科幻電影里無所不能 AI 在狡猾的人類面前,輸?shù)靡粩⊥康亍?/p>

歸根結(jié)底,這與 LLM 的訓(xùn)練機(jī)制有關(guān)。

以 GPT-3 為例,OpenAI 使用了 1750 億個參數(shù)訓(xùn)練這個模型,通過學(xué)習(xí)大量來自互聯(lián)網(wǎng)的文本數(shù)據(jù),可以預(yù)測文本中的下一個單詞,從而回答人們的問題。

至于 GPT-4,一些爆料信息稱他的訓(xùn)練參數(shù)比 GPT-3 大了不止 10 倍,幾乎快要把人類積累的數(shù)字內(nèi)容全部吞食過了一遍,這里面包含了知識,自然也會包含不宜公開的內(nèi)容甚至有毒有害的偏見信息。

AI 工程師只能盡可能地給 AI 設(shè)立更多的安全柵欄,幫助 AI 去分辨人類的「詭計(jì)」,才不會把如何制作 TNT 炸彈、怎樣黑進(jìn)銀行的安全系統(tǒng)等危險(xiǎn)信息說漏嘴。

與 GPT3.5 相比,GPT-4 對違禁內(nèi)容請求的響應(yīng)傾向降低了 82% ,對醫(yī)療建議和自我傷害等敏感請求的規(guī)范性提高了 29% 。

一個直觀的例子是,當(dāng)你用「國粹 AI」的 Prompt 輸給 GPT-4,GPT-4 會婉轉(zhuǎn)地拒絕你的要求,表示不吃你這套。

但這并不意味著大模型 AI 的安全得到保證,這場人與 AI 的信息戰(zhàn)遠(yuǎn)沒有結(jié)束,甚至不是結(jié)束的開始。

近日,卡內(nèi)基梅隆大學(xué)和 safe.ai 的一項(xiàng)聯(lián)合聲明表示,大模型的安全機(jī)制比人們想象的要脆弱得多,只需要一串代碼,就能把大模型的安全機(jī)制擊潰。

研究人員發(fā)現(xiàn),通過在文本提示后附加特定的對抗性短語,可以輕易繞過 ChatGPT、Bard 和 Claude 等 LLM 的安全防護(hù),欺騙 LLM 生成不適當(dāng)?shù)妮敵觥?/p>

這些對抗性短語看起來像胡言亂語,但實(shí)際上是通過一種特殊的損失函數(shù)設(shè)計(jì)的,該函數(shù)可以識別出模型拒絕回答的屏蔽語,找出繞過屏障讓模型提供回答的字符序列,并且它可以自動產(chǎn)生這些短語。

利用這些 Prompt,研究人員輕而易舉地讓 LLM 們說出制作違規(guī)藥品的步驟、制造殺傷性武器的方法等等不宜公開的內(nèi)容。

無論是 Pythia、Falcon、Guanaco 等開源模型,還是像 GPT-3.5(87.9%)、GPT-4(53.6%)、PaLM-2(66%)和 Claude-2(2.1%)這些商業(yè)模型都無一能躲過攻擊。

研究人員目前已經(jīng)把漏洞提交給了各大 AI 公司,讓安全工程師們及時修復(fù)。

但就像「奶奶漏洞」一樣,在用戶不斷使用之下,總會有新的漏洞產(chǎn)生,僅憑 OpenAI 等某一公司之力,想要守護(hù) AI 安全并非易事,AI 公司們還需要更多的力量來維持,于是幾大巨頭決定,停止 AI 內(nèi)卷,化干戈為玉帛。

AI 四巨頭聯(lián)合承諾「先進(jìn) AI 不擴(kuò)散」

幾周前,微軟、OpenAI、Google、Meta、亞馬遜、Anthropic(代表產(chǎn)品:Claude)和 Inflection AI(代表產(chǎn)品:HeyPi)共七個頂尖 AI 公司齊聚美國白宮,作出了一系列承諾,來確保他們的產(chǎn)品安全且透明。

承諾包括允許「領(lǐng)域?qū)<摇箤λ麄兊?AI 產(chǎn)品進(jìn)行外部審查,并與彼此以及美國政府分享關(guān)于風(fēng)險(xiǎn)和漏洞的信息;投資于網(wǎng)絡(luò)安全和內(nèi)部威脅保護(hù)措施,以保護(hù)專有的和未發(fā)布的模型權(quán)重。

巨頭們還承諾會部署相應(yīng)的 AI 甄別機(jī)制,例如開發(fā)水印系統(tǒng),以明確哪些文本、圖像或其他創(chuàng)作是 AI 的產(chǎn)物,并且承諾未來的研究將優(yōu)先理解 AI 的限制和偏見,推動行業(yè)的安全發(fā)展。

半個月后,七家頂尖 AI 公司中的四位——微軟、OpenAI、Google 和 Anthropic 再度聯(lián)合起來,成立了一個名為「前沿模型論壇(Frontier Model Forum)」的機(jī)構(gòu),目的是確保最強(qiáng)大的 AI 模型能夠以安全和負(fù)責(zé)任的方式發(fā)展。

而這四家 AI 公司,也正是目前正在開發(fā)最前沿 AI 模型的四個巨頭,可以說是「AI 核彈」的擁有者。

AI 四巨頭達(dá)成了一致共識,稱他們希望通過「前沿模型論壇」最大限度地減少 AI 風(fēng)險(xiǎn),進(jìn)行更多的 AI 安全研究,并向行業(yè)和公眾分享安全最佳實(shí)踐等等。

不過 AI 四巨頭并沒有介紹關(guān)于「前沿模型論壇」的制度和執(zhí)行條約等詳細(xì)內(nèi)容。

「前沿模型論壇」的聯(lián)合聲明提到,論壇將首先關(guān)注研究并努力為評估前沿模型風(fēng)險(xiǎn)制定標(biāo)準(zhǔn)化的最佳實(shí)踐,發(fā)布一個「公共解決方案庫」。論壇將逐步制定正式章程,任命咨詢委員會,并資助與公民社會團(tuán)體的合作。

這里提到的前沿模型是指「超越當(dāng)前最先進(jìn)現(xiàn)有模型的能力,并可以執(zhí)行各種任務(wù)」的模型,也就是說,要開發(fā)比目前模型更強(qiáng)大且能夠安全運(yùn)轉(zhuǎn)的前沿模型,已經(jīng)不再是各公司悶頭研究就能解決的難題,這需要整個行業(yè)的共同努力。

ChatGPT 爆火后的這半年時間,AI 行業(yè)的局勢變化跟 AI 模型本身發(fā)展的速度一樣快——各家入局、模型混戰(zhàn)、達(dá)成共識、握手言和。

巨頭們之所以會選擇一起去解決 AI 風(fēng)險(xiǎn)問題,是因?yàn)楸舜硕伎吹搅?AI 在應(yīng)用層面的無限潛力。

AI,大廠們篤信的未來

不管你對 AI 持什么樣的態(tài)度,AI 都會成為下一代應(yīng)用的重要組成部分。

這不是我信口開河,而是微軟、Google 等大廠們在近日的財(cái)報(bào)電話會上共同提到的趨勢。

微軟最新的財(cái)報(bào)顯示,微軟在最近的一個財(cái)季收入為 562 億美元,同比增長 8%,這主要來自智能云和生產(chǎn)力與業(yè)務(wù)流程的增長,而作為老本行的個人計(jì)算業(yè)務(wù)收入有所下降。

其中智能云營業(yè)收入增長 15%,Azure 與其他云服務(wù)收入增長 26%,這與 AI 計(jì)算緊密相關(guān)。

微軟 CEO 納德拉在財(cái)報(bào)電話會提到,客戶最關(guān)心如何快速應(yīng)用新一代 AI,微軟將繼續(xù)專注于三大優(yōu)先事項(xiàng):幫助客戶從 Microsoft Cloud 中獲得最大價(jià)值、領(lǐng)導(dǎo)新 AI 平臺變革、提升運(yùn)營杠桿。

AI,毫無疑問是這場財(cái)報(bào)會議的關(guān)鍵詞。

納德拉表示 Microsoft 365 Copilot 作為未來工作的第三支柱吸引著客戶,將在下半財(cái)年開始產(chǎn)生實(shí)際收入;Bing Chat 和必應(yīng)圖像創(chuàng)造者吸引用戶,而 Edge 瀏覽器份額也在持續(xù)提升。

微軟希望把 Windows 11 打造為這個新 AI 時代的強(qiáng)大畫布,賦予各種 Copilot 產(chǎn)品提升客戶的生產(chǎn)力,并大力投資云基礎(chǔ)設(shè)施來滿足 AI 需求。就連游戲業(yè)務(wù),也可以利用 AI 提供更好的內(nèi)容和服務(wù),提升業(yè)務(wù)收入。

可以說,微軟接下來的策略都是圍繞 AI 來展開的。AI 為微軟提供了巨大的增長機(jī)遇和新的收入來源,它將推動微軟大部分業(yè)務(wù)的收入和用戶增長,并最終提升微軟整體收入增速。納德拉不想錯過這個難得一遇的機(jī)遇。

同樣的,「AI 一哥」Google 也不想錯過。

根據(jù) Google 母公司 Alphabet 第二季度 2023 年財(cái)報(bào)的數(shù)據(jù)顯示,Alphabet 收入總額為 746 億美元,同比增長 7%,其中廣告收入增長 5%,Google 服務(wù)收入增長 5%,Google Cloud 收入增長 28%。

其中與 AI 相關(guān)的業(yè)務(wù)表現(xiàn)都很亮眼。Alphabet 在電話會議中提到,Google 的搜索引擎生成式體驗(yàn)(SGR)使用了生成式 AI,使搜索變得更自然和直觀,用戶反饋非常正面;另一方面,聊天機(jī)器人 Bard 發(fā)布以來經(jīng)過不斷改進(jìn),功能豐富了許多。

Google Cloud 的 80 多個 AI 模型吸引了大量客戶,從 4 月到 6 月客戶數(shù)量增長超過 15 倍。

而在企業(yè)客戶服務(wù)和定制 AI 解決方案方面,Google 通過 Workspace 和 Duet AI 將生成式 AI 帶給了 9000 多萬付費(fèi)用戶。

總體而言,Alphabet 對 AI 和 Google Cloud 的長期增長前景保持樂觀,接下來將繼續(xù)增加對 AI 研發(fā)的投入,研發(fā)方向?qū)⒕劢乖诖笳Z言模型等核心技術(shù)上,以及構(gòu)建像多模態(tài) AI 系統(tǒng) Gemini 等新模型。

半年前,或許你會懷疑 AI 是不是像 Web3、區(qū)塊鏈這樣的投資圈熱詞,圈一波熱錢后就會被資本遺忘,但經(jīng)過半年后你會發(fā)現(xiàn),AI 的影響力和落地可能性都比之前的各種前沿詞匯要大得多,以至于引起了整個科技圈的重視。

從大廠的規(guī)劃來看,AI 會作為未來程序應(yīng)用的底層而普遍存在,為改善用戶體驗(yàn)服務(wù)。用戶們可能不會感受到 AI 的存在,但能直接享受到 AI 帶來的便利性,這便是大廠們篤信的未來。

這也可以說明,為什么微軟和 Google 等 AI 巨頭們愿意放下干戈,坐下來共同指定 AI 安全的標(biāo)準(zhǔn)。

現(xiàn)階段的 AI 就像是 19 世紀(jì)末汽車剛誕生的時代,產(chǎn)品已經(jīng)開上了路上跑,卻沒有合適的柏油路供它奔馳,也沒有交通規(guī)則來規(guī)劃它的行動,跑得既慢又危險(xiǎn)。

比爾·蓋茨最近在個人博客發(fā)表了他對 AI 的看法,他認(rèn)為我們現(xiàn)在正處于又一個巨大變革的最早階段,即 AI 的時代,AI 的變化如此之快,以至于我們無法清楚地預(yù)知接下來會發(fā)生什么。

但他對人工智能的發(fā)展持以積極的態(tài)度,因?yàn)槿祟愐呀?jīng)經(jīng)歷了汽車時代、核能時代,到了 AI 的時代我們還是能夠解決新技術(shù)帶來的挑戰(zhàn)。

所以請坐穩(wěn)了,我們將親眼見證一個新時代的誕生。

關(guān)鍵詞:

上一篇:134.9,卡九!M26日本第十六周官方數(shù)據(jù)統(tǒng)計(jì)!附臺灣、韓國、越南,以及下映的泰國數(shù)據(jù)

下一篇:最后一頁

責(zé)任編輯:

最近更新

點(diǎn)擊排行
推薦閱讀