国产美女主播视频一区_国产精品蜜臀在线观看_亚洲成人动漫一区_亚洲视屏在线播放

首頁 > 游戲

GPT-4是8x2200億參數的混合模型?這個小道消息今天傳瘋了 環球熱聞

來源:機器之心Pro 時間:2023-06-24 01:05:23

機器之心報道

編輯:吳昕


(資料圖)

George Hotz:除了蘋果之外,大部分公司保密的原因都不是在隱藏什么黑科技,而是在隱藏一些?「不那么酷」的東西。

「GPT-4 的參數量高達 100 萬億。」相信很多人還記得這個年初刷屏的「重磅」消息和一張被病毒式傳播的圖表。

不過很快,OpenAI 的 CEO Sam Altman 就出來辟謠,證實這是一條假消息,并表示,「關于 GPT-4 的謠言都很荒謬。我甚至不知道這從何而起。」

實際上,許多人相信并傳播這樣的謠言是因為近年來 AI 社區不斷在增加 AI 模型的參數規模。谷歌在 2021 年 1 月發布的 Switch Transformer 就把 AI 大模型參數量拉高到了 1.6 萬億。在此之后,很多機構也陸續推出了自己的萬億參數大模型。據此,人們有充分的理由相信,GPT-4 將是一個萬億參數的巨量模型,100 萬億參數也不是不可能。

雖然 Sam Altman 的辟謠幫我們去掉了一個錯誤答案,但他背后的 OpenAI 團隊一直對 GPT-4 的真實參數量守口如瓶,就連 GPT-4 的官方技術報告也沒透露任何信息。

直到最近,這個謎團疑似被「天才黑客」喬治?霍茲(George Hotz)捅破了。

喬治?霍茲因 17 歲破解 iPhone、21 歲攻陷索尼 PS3 而聞名,目前是一家研發自動駕駛輔助系統的公司(comma.ai)的老板。

最近,他接受了一家名為 Latent Space 的 AI 技術播客的采訪。在采訪中,他談到了 GPT-4,稱 GPT-4 其實是一個混合模型。具體來說,它采用了由 8 個專家模型組成的集成系統,每個專家模型都有 2200 億個參數(比 GPT-3 的 1750 億參數量略多一些),并且這些模型經過了針對不同數據和任務分布的訓練。

在這段播客播出之后,PyTorch 創建者 Soumith Chintala 表示自己似乎聽過同樣的「傳聞」,很多人可能也聽過,但只有 George Hotz 在公開場合將其說了出來。

「混合模型是你在無計可施的時候才會考慮的選項,」George Hotz 調侃說,「混合模型的出現是因為無法讓模型的參數規模超過 2200 億。他們希望模型變得更好,但如果僅僅是訓練時間更長,效果已經遞減。因此,他們采用了八個專家模型來提高性能。」至于這個混合模型是以什么形式工作的,George Hotz 并沒有詳細說明。

為什么 OpenAI 對此諱莫如深呢?George Hotz 認為,除了蘋果之外,大部分公司保密的原因都不是在隱藏什么黑科技,而是在隱藏一些「不那么酷」的東西,不想讓別人知道「只要花 8 倍的錢你也能得到這個模型」。

對于未來的趨勢,他認為,人們會訓練規模較小的模型,并通過長時間的微調和發現各種技巧來提升性能。他提到,與過去相比,訓練效果已經明顯提升,盡管計算資源沒有變化,這表明訓練方法的改進起到了很大作用。

目前,George Hotz 關于 GPT-4 的「爆料」已經在推特上得到了廣泛傳播。

有人從中得到了靈感,聲稱要訓練一個 LLaMA 集合來對抗 GPT-4。

還有人說,如果真的像 George Hotz 說的那樣,GPT-4 是一個由 8 個 2200 億參數的專家模型組合的混合模型,那很難想象背后的推理成本有多高。

需要指出的是,由于 George Hotz 并未提及消息來源,我們目前無法判斷以上論斷是否正確。有更多線索的讀者歡迎在評論區留言。

相關稿件

GPT-4是8x2200億參數的混合模型?這個小道消息今天傳瘋了 環球熱聞

焦點報道:《功勛》《大決戰》《我們這十年》獲得白玉蘭評委會大獎

鶴壁市鶴山區2023年夏季文旅促消費暨“夏日微涼、端午安康”系列活動啟動-環球報資訊

民俗文化共傳承 新鄉市衛濱區舉辦“我們的節日·端午”新時代文明實踐志愿服務活動_獨家

當前通訊!雙動力系統加持,新“問界M5”增程版曝光 外觀有調整,或Q3亮相

天津市科技局舉辦外籍人才“中國日” ——“粽情端午”活動

第28屆白玉蘭:雷佳音憑《人世間》得影帝,吳越爆冷獲影后_當前時訊

國華(00370)發盈警 預期年度公司擁有人應占虧損將不少于3億港元

全球今頭條!阿富汗地震一周年丨重建艱難 美國單邊制裁加劇民眾痛苦

溫州房價五連跌,溫州樓市的神話結束了,溫州樓市半年分析

北京動物園:部分喜冷怕熱動物將減少外放時間-天天時訊

臨沂:繳納貸款保證金 還完貸款難退錢

百勝中國6月21日斥100萬美元回購1.73萬股|每日快訊

國泰航空5月載客141.79萬人次 同比增加2345%

廣西玉林一男子搶劫金店被特警帶走?老板辟謠:系員工與男友產生感情糾紛

譽燊豐控股(02132)發年度業績 股東應占溢利3279.1萬港元 同比減少20.47%|天天速看料

當前頭條:資訊推薦:不顧醫生勸阻,每天2包煙,頓頓8兩白酒的演員李琦,如今變成這樣

全球快報:任重身高不止181_任重身高

起亞中國首款純電車EV6 28日開啟盲訂 8月正式上市_世界速看料

韓國現代汽車將出售兩家中國工廠 因中國市場銷售低迷

【世界速看料】青島即墨旅投公司發行2023年度第二期5億元超短期融資券

園博園 票房展演“小戲臺”

市疾控中心送來端午假期健康提醒_世界播報

為什么宏觀預測經常錯? 天天新消息

廈航獲評2022年度最佳航空公司

世界焦點!男生高考查分601激動滿屋蹦跳 具體是什么情況?

【甲醇半年報】黎明前的黑暗-環球觀熱點

廣西:擴大保障性租賃住房供給助力新市民、青年人“住有所居”

聯播觀察丨端午由來 竟和農人“調休”也有關

世界快看點丨亞馬遜 Prime Day 促銷將于 7 月 11 日啟動,首次推出邀請制


主站蜘蛛池模板: 日韩有码在线播放| 久久久www成人免费精品| 欧美激情中文字幕在线| 国产精品视频yy9099| 国产精品视频999| 欧美专区中文字幕| 亚洲午夜久久久影院伊人| 国产免费一区二区视频| 日本久久久久久久| 亚洲午夜精品一区二区| 国产精品视频自在线| 亚洲a区在线视频| 亚洲自拍av在线| 高清一区二区三区视频| 国产精品91一区| 国产伊人精品在线v| 91精品国产自产在线| 国产精品久久久久av福利动漫| 久久久精品在线视频| 日韩中文字幕网址| 日韩在线中文视频| 国产自偷自偷免费一区| 激情网站五月天| 狠狠精品干练久久久无码中文字幕| 国产精品久久久久7777| 国产精品久久久久久久久久 | 日本婷婷久久久久久久久一区二区 | 色99中文字幕| 色妞一区二区三区| 日本三级久久久| 欧洲日韩成人av| 日本一区二区免费高清视频| 色婷婷综合成人| 欧美国产综合在线V| 久久综合五月天| 国产日韩欧美黄色| 久久精品国产美女| 国产精品日韩在线| 国产成人综合一区二区三区| 国产精品久久久久久久久电影网 | 国产精品入口尤物|