資訊> 正文

百模大戰(zhàn)中,笑到最后的可能并不是OpenAI

時(shí)間: 2023-05-08 15:57:20 來源: 菠菜

2023年顯然是無可爭議的AI大年,如果對ChatGPT、OpenAI、生成式AI、LLM(大語言模型)等概念一頭霧水,那你可能就OUT了。甚至自1956年達(dá)特茅斯會議上人工智能(AI)這一概念誕生以來,AI從未距離大眾如此之近。所以自然而然的,圍繞AI的一切也引發(fā)了大量的關(guān)注,特別是對于站在浪潮之巔的巨頭們關(guān)于AI的只言片語,也總能引發(fā)諸多的熱議。

被稱為“AI教父”的杰弗里·辛頓繼不久前從谷歌離職后,隨即就加入了“AI批評者”的行列,并大談AI未來可能會帶來的風(fēng)險(xiǎn),甚至還表示,“我對畢生所研究的東西感到后悔”。

就在他態(tài)度180°大轉(zhuǎn)彎激起、由“不明真相吃瓜群眾”對AI危險(xiǎn)性的討論尚未落幕之時(shí),一個據(jù)稱是谷歌高級軟件工程師Luke Sernau所寫的內(nèi)部信又激起波瀾。而這份被泄露的文件中其實(shí)只有一個核心主旨,那就是谷歌、OpenAI都沒有護(hù)城河,開源AI將會摘取這個賽道最后的勝利果實(shí)。


(相關(guān)資料圖)

在這一場生成式AI的“大戰(zhàn)”中,谷歌顯然只是不折不扣的追趕者。雖然作為阿爾法狗的創(chuàng)造者,多年來谷歌一直扮演著“AI布道者”的角色,但在生成式AI領(lǐng)域,ChatGPT無疑才是領(lǐng)路人。緊隨其后的Google Bard公開演示翻車、導(dǎo)致谷歌市值一度蒸發(fā)千億美元后,好不容易推出將生成式AI整合到工作場景的Workspace后,微軟融合了GPT-4的Microsoft 365 Copilot又很快把風(fēng)頭搶走了。

所以在外界看來,如今焦慮一詞或許才是谷歌在面對生成式AI、LLM時(shí),最為真實(shí)的寫照。

與此同時(shí),領(lǐng)導(dǎo)谷歌前進(jìn)的CEO皮查伊持有保守傾向、并且也受到了不少的掣肘,以至于谷歌的AI路線圖目前并不清晰。在這樣的情況下,公司內(nèi)部的“有識之士”當(dāng)然也就會心急如焚。

那么問題就來了,作為在生成式AI賽道落后的谷歌有危機(jī)感、內(nèi)部傳出悲觀論調(diào)再正常不過,但為什么會扯上OpenAI呢,或者說為什么開源AI才是最終的勝利者?

鮮花著錦烈火烹油,無疑是當(dāng)下OpenAI的境況。別看這家公司現(xiàn)在幾乎是最炙手可熱的投資標(biāo)的,但據(jù)相關(guān)海外科技媒體在近期曝光的新一輪融資文件顯示,OpenAI的估值來到了290億美元??梢赖氖?,目前在A股,僅僅寒武紀(jì)和昆侖萬維這兩家AI概念的市值,就已經(jīng)接近這個數(shù)字。換而言之,一手點(diǎn)燃了生成式AI這把火的OpenAI,其實(shí)并沒有被投資者給出一個驚人的估值。

在許多業(yè)內(nèi)人士看來,OpenAI目前的問題在于缺乏一個清晰的商業(yè)模式,他們現(xiàn)階段唯二可以確定的收入,是一個月20美元的ChatGPT Plus訂閱服務(wù),以及1k tokens/0.002美元的ChatGPT API,但這兩者顯然還不足以讓OpenAI盈利。甚至有觀點(diǎn)認(rèn)為,OpenAI現(xiàn)在像極了世紀(jì)之交的QQ,盡管同樣都是站在相關(guān)領(lǐng)域的最前沿,但也同樣缺乏一個明朗的商業(yè)化前景。但后來QQ等來了QQ秀,目前OpenAI卻暫時(shí)還看不到解決商業(yè)化難題的契機(jī)。

事實(shí)上,讓谷歌公司的內(nèi)部人士對谷歌、OpenAI悲觀的核心,是生成式AI、或者說LLM本身其實(shí)并沒有太深的護(hù)城河。沒錯,別看ChatGPT、文心一言這類產(chǎn)品表現(xiàn)得如此智能,但實(shí)際上打造一個生成式AI并沒有大家想象的那么難。

LLM的理論其實(shí)非常簡單,即通過分析大量文本數(shù)據(jù)進(jìn)行訓(xùn)練,從而學(xué)習(xí)語言的結(jié)構(gòu)和模式,其所使用的架構(gòu)也是是長短時(shí)記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)或門控循環(huán)單元(Gated Recurrent Unit,GRU)等傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。

LLM更像是“力大磚飛”的結(jié)果,然而在ChatGPT一鳴驚人前,業(yè)界更青睞的其實(shí)是谷歌的Transformer模型。而后者追求的卻是如何設(shè)計(jì)出更小、更快,但更準(zhǔn)確的神經(jīng)網(wǎng)絡(luò),甚至于彼時(shí)OpenAI的GPT-3是被業(yè)界作為負(fù)面典型進(jìn)行評價(jià)的。當(dāng)時(shí)就有業(yè)內(nèi)人士表示,“GPT-3在小樣本學(xué)習(xí)中表現(xiàn)出卓越的能力,但它需要使用數(shù)千個GPU進(jìn)行數(shù)周的訓(xùn)練,因此很難重新訓(xùn)練或改進(jìn)。”

ChatGPT的成功就成功在它提出了一個新的思路,畢竟加大參數(shù)、加高算力的大模型也是一個方向,并且真的讓大模型涌現(xiàn)出了智能。但顯而易見的是,這一模式并沒有護(hù)城河。君不見,即使OpenAI對自己基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)技術(shù)秘而不宣,也阻攔不了百度文心一言、阿里通義千問、谷歌Bard等等一眾同類大模型的出現(xiàn)。

此前李彥宏就曾在百度的內(nèi)部講話中提到,“算力不能保證我們能夠在通用人工智能技術(shù)上領(lǐng)先,因?yàn)樗懔κ强梢再I來的,但創(chuàng)新的能力是買不來的,是需要自建的”,也就是說算力和參數(shù)都可以買、技術(shù)壁壘不高。所以也難怪短時(shí)間內(nèi)國內(nèi)市場的“百模大戰(zhàn)”就已開打,因此先發(fā)優(yōu)勢在這里幾乎不值一提。

當(dāng)然,如果沒有Meta的LLaMA模型“意外”在4chan上泄露,LLM的技術(shù)壁壘不高也只是相對大廠而言。但LLaMA模型的被迫開源,也讓開源社區(qū)主導(dǎo)了最近一段時(shí)間針對ChatGPT的“平替”熱潮。

比如說來自斯坦福的Alpaca,借助Llama的預(yù)訓(xùn)練模型為基礎(chǔ),僅使用來自GPT模型的一個小尺寸調(diào)優(yōu)數(shù)據(jù)集(52000個樣本),就建立了一個具有對話功能的LLM。而基于LLaMA模型,以及LoRA (Low-Rank Adaptation of LLM,即插件式的微調(diào))訓(xùn)練,開源社區(qū)在不到兩個月的時(shí)間里已接連發(fā)布了ChatLLaMa、Alpaca、Vicuna、Koala等模型,并且“羊駝家族”們的實(shí)際效果還直追GPT-3.5、甚至不輸GPT-4。

借助社區(qū)的力量群策群力,并最終實(shí)現(xiàn)極低成本下的高速迭代,這無疑就是開源AI的優(yōu)勢。就像谷歌這位員工所說的那樣,“如果存在一個沒有使用限制的免費(fèi)高質(zhì)量替代品,誰還會為帶有使用限制的谷歌產(chǎn)品買單呢?”

因此從某種意義上來說,谷歌在Android上的做法可能才是最佳范例,也就是讓開源社區(qū)不自覺地為自己的商業(yè)利益服務(wù)。

所以不得不說,LLaMA模型泄露更像是一個神來之筆,一下子就讓原本掉隊(duì)的Meta實(shí)現(xiàn)了超谷歌、趕OpenAI,畢竟“羊駝家族”就是在Meta的架構(gòu)之上誕生的產(chǎn)物。

責(zé)任編輯:房家輝

分享到:版權(quán)聲明:凡注明來源“流媒體網(wǎng)”的文章,版權(quán)均屬流媒體網(wǎng)所有,轉(zhuǎn)載需注明出處。非本站出處的文章為轉(zhuǎn)載,觀點(diǎn)供業(yè)內(nèi)參考,不代表本站觀點(diǎn)。文中圖片均來源于網(wǎng)絡(luò)收集整理,僅供學(xué)習(xí)交流,版權(quán)歸原作者所有。如涉及侵權(quán),請及時(shí)聯(lián)系我們刪除!

關(guān)鍵詞:

責(zé)任編輯:QL0009

為你推薦

關(guān)于我們| 聯(lián)系我們| 投稿合作| 法律聲明| 廣告投放

版權(quán)所有 © 2020 跑酷財(cái)經(jīng)網(wǎng)

所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀網(wǎng)站聲明。本站不作任何非法律允許范圍內(nèi)服務(wù)!

聯(lián)系我們:315 541 185@qq.com