深化交流合作 筑牢AI安全屏障
時(shí)間:2023-06-25 14:47:10
ChatGPT寫文章調(diào)代碼,文心一言巧解雞兔同籠數(shù)學(xué)題,Microsoft 365Copilot幫“打工人”做PPT,Midjourney V5繪制的20世紀(jì)90年代中國(guó)情侶刷屏朋友圈……人工智能領(lǐng)域的大事一件接著一件,令人欣喜,也引人擔(dān)憂。擔(dān)心被AI“搶飯碗”,擔(dān)心AI發(fā)展過快超出人類管控的能力范圍。
最近,包括“ChatGPT之父”、OpenAI創(chuàng)始人兼CEO山姆·阿爾特曼,谷歌DeepMind公司CEO戴密斯·哈薩比斯以及美國(guó)Anthropic公司的CEO達(dá)里奧·阿莫代伊在內(nèi)的一眾AI界大佬聯(lián)名簽署了一封公開信,信的內(nèi)容很短,加上the和a在內(nèi)僅有22個(gè)單詞。字?jǐn)?shù)少,但信息量很大。信中這樣說:“與流行病和核戰(zhàn)爭(zhēng)等其他社會(huì)規(guī)模的風(fēng)險(xiǎn)一樣,緩解人工智能導(dǎo)致的滅絕風(fēng)險(xiǎn)應(yīng)該被視作全球的優(yōu)先事項(xiàng)。”信中把AI提到了與流行病和核戰(zhàn)爭(zhēng)同樣的級(jí)別,足以見得AI野蠻生長(zhǎng)帶來的問題的嚴(yán)重性。比如AI系統(tǒng)設(shè)計(jì)不當(dāng)或被惡意使用,可能會(huì)讓歧視和偏見不斷固化、虛假信息蔓延、隱私數(shù)據(jù)泄露……呼吁全球通力合作,對(duì)人工智能進(jìn)行規(guī)范與監(jiān)管,共同去應(yīng)對(duì)、去解決AI超速發(fā)展帶來的挑戰(zhàn)。
上一封著名的AI公開信是在3月底,距離GPT-4發(fā)布僅兩周時(shí)間。包括特斯拉CEO埃隆·馬斯克在內(nèi)的1000多名企業(yè)高管、學(xué)界專家聯(lián)署發(fā)表公開信,呼吁所有AI實(shí)驗(yàn)室立即暫停訓(xùn)練比GPT-4更強(qiáng)大的AI系統(tǒng),暫停至少6個(gè)月。
(資料圖片僅供參考)
為什么全球頂尖AI公司的高管和學(xué)界大咖要呼吁限制AI發(fā)展,他們?cè)趽?dān)心些什么?或許是AI快速發(fā)展在帶給人們驚喜的同時(shí)也帶來了未知,有些問題甚至連開發(fā)者本身都無能為力。
近日,在2023北京智源大會(huì)上,阿爾特曼呼吁全球各方就AI安全問題通力合作,建立國(guó)際通行的AI安全標(biāo)準(zhǔn),并推進(jìn)人工智能對(duì)齊(AI alignment,即引導(dǎo)AI系統(tǒng)的表現(xiàn),使其符合設(shè)計(jì)者的預(yù)期目標(biāo))研究。他提出,可以嘗試使用AI系統(tǒng)輔助人類來監(jiān)督其他AI系統(tǒng)。以未來的AGI(通用人工智能)系統(tǒng)為例,可能包含10萬行的二進(jìn)制代碼,人類有必要借助AI來輔助監(jiān)督,判別系統(tǒng)是否存在違規(guī)行為。除了必要性之外,這種方法的好處在于,伴隨AI技術(shù)的突破,AI監(jiān)管技術(shù)也在同步發(fā)展。
在與智源研究院理事長(zhǎng)張宏江圍繞“AI安全與對(duì)齊”議題的問答討論中,阿爾特曼談到,未來十年內(nèi),全球很可能擁有一個(gè)非常強(qiáng)大的AI系統(tǒng),屆時(shí)人類會(huì)面臨很多安全問題,因此,要從現(xiàn)在開始做好準(zhǔn)備。他強(qiáng)調(diào),對(duì)于AI安全而言,建立統(tǒng)一公平的框架和測(cè)試標(biāo)準(zhǔn),讓每個(gè)達(dá)到一定能力的AI模型都接受測(cè)試具有重要意義。他表示,解決AI對(duì)齊問題難度極大,需要來自世界各地最好的頭腦,并稱中國(guó)有很多優(yōu)秀的人工智能人才,期待中國(guó)AI研究者能為AI安全提供中國(guó)智慧。
請(qǐng)掃碼觀看視頻
劃重點(diǎn)!關(guān)于AI對(duì)齊
什么是AI對(duì)齊?
AI對(duì)齊(AI alignment)是AI控制問題中的一個(gè)主要問題,即要求AI系統(tǒng)的目標(biāo)要和人類的價(jià)值觀與利益保持一致。
實(shí)現(xiàn)AI對(duì)齊面臨哪些挑戰(zhàn)?
◆ 選擇合適的價(jià)值觀
◆ 將價(jià)值觀編碼到AI系統(tǒng)中,使系統(tǒng)表現(xiàn)與價(jià)值觀一致
◆ 選擇合適的訓(xùn)練數(shù)據(jù)
AI對(duì)齊的研究方法
DeepMind和OpenAI圍繞AI對(duì)齊分別從“提出合適的價(jià)值觀”和“用技術(shù)方法實(shí)現(xiàn)對(duì)齊”兩方面進(jìn)行研究。
在用技術(shù)方法實(shí)現(xiàn)對(duì)齊方面,DeepMind提出了一種基于“逆強(qiáng)化學(xué)習(xí)(Inverse Reinforcement Learning)”的方法,該方法關(guān)注人類的行為,能夠從行為表現(xiàn)中推斷出價(jià)值觀,并將其編碼到AI系統(tǒng)中。OpenAI則提出了一種基于“對(duì)抗訓(xùn)練(Adversarial Training)”的方法,通常用于增強(qiáng)模型的魯棒性和泛化能力,該方法可以讓AI系統(tǒng)在與人進(jìn)行交互時(shí)學(xué)習(xí)到人類的價(jià)值觀。
逆強(qiáng)化學(xué)習(xí)的關(guān)注點(diǎn)在于人類的行為,從行為表現(xiàn)推斷價(jià)值觀;而對(duì)抗訓(xùn)練的重點(diǎn)是交互,從AI系統(tǒng)與人的交互中學(xué)習(xí)價(jià)值觀。
相關(guān)稿件
2023年6月25日云南省山藥批發(fā)價(jià)格行情
揚(yáng)州:購(gòu)買市區(qū)改善性住房不再執(zhí)行限購(gòu) 人才購(gòu)房給予契稅100%補(bǔ)貼 全球速讀
中山127億元掛牌出讓10宗宅地 供地規(guī)模遠(yuǎn)超去年整年|世界新消息
利民股份嘧霉胺 通過歐盟原藥認(rèn)定 全球關(guān)注
0仰角設(shè)計(jì) 原裝鏡頭 理光RU336ST激光投影評(píng)測(cè)|今日熱聞
環(huán)球微動(dòng)態(tài)丨該省4成考生被破格錄取!2022年清北強(qiáng)基入圍、錄取數(shù)據(jù)回顧
全球頭條:端午假期北京全市公園納客326萬人次 同比增61%
【世界獨(dú)家】重塑新生態(tài) 開啟新征程 江鈴汽車新能源品牌發(fā)布
世界快資訊丨祝賀!三岔湖小學(xué)省級(jí)課題成功立項(xiàng)!
有一種叫云南的生活·麗江篇丨這個(gè)夏天,到永勝三川享受一頓色香俱全的荷花盛宴
海內(nèi)指的是什么地方_海內(nèi)指的是什么_天天微動(dòng)態(tài)
用方正奧思制作多媒體課件_關(guān)于用方正奧思制作多媒體課件介紹
川酒集團(tuán)國(guó)優(yōu)品牌矩陣閃耀德陽(yáng)酒博會(huì),助力川酒高質(zhì)量發(fā)展
當(dāng)前熱文:濟(jì)源稅務(wù):提升服務(wù)質(zhì)效 優(yōu)化營(yíng)商環(huán)境
全球滾動(dòng):降薪后的銀行人生活現(xiàn)狀:點(diǎn)鈔3億,月入3千
5月成交榜首居然在福田!深圳各區(qū)成交TOP10一覽 世界新消息
當(dāng)前報(bào)道:2023六盤水個(gè)人社保多少錢一個(gè)月 六盤水個(gè)人社保繳費(fèi)比例查詢
天天速讀:2023端午檔總票房破9億大關(guān),《消失的她》獨(dú)占六成
龍舟生意太火爆!除了生產(chǎn)廠家,這些公司也賺“瘋”了!
全球首臺(tái)16兆瓦風(fēng)機(jī)安裝工作全部準(zhǔn)備就緒
箭牌家居:通過研發(fā)、采購(gòu)及生產(chǎn)等舉措推進(jìn)降本工作
甘肅7個(gè)曲藝項(xiàng)目亮相全國(guó)非遺曲藝周
教育頻道
深圳福田皇崗村舊改項(xiàng)目確定申報(bào)主體為皇崗實(shí)業(yè) 世界快資訊
60項(xiàng)具體任務(wù),50個(gè)重大項(xiàng)目 南京推進(jìn)長(zhǎng)三角一體化年度“施工圖”出爐 全球微動(dòng)態(tài)
競(jìng)爭(zhēng)激烈!廣汽豐田展臺(tái)上演“武術(shù)表演”:藍(lán)衣、白衣銷售互毆|新資訊
九寨溝黃龍景區(qū)海拔高度多少_ldquo 九寨溝 rdquo ldquo 黃龍 rdquo 的海拔各是多少-天天新要聞
全球今熱點(diǎn):歌名最長(zhǎng)的中文歌有哪些_歌名最長(zhǎng)的中文歌
中國(guó)人壽保險(xiǎn)產(chǎn)品介紹大全,保險(xiǎn)龍頭產(chǎn)品都為大家盤點(diǎn)好了_看熱訊


