資訊> 正文

全球熱訊:大考在即 百度版ChatGPT會翻車嗎?

時間: 2023-03-07 10:43:08 來源: 落落

文心一言的發(fā)布會定檔3月16日,不出意外,百度創(chuàng)始人李彥宏、CTO王海峰將出現(xiàn)在北京總部的發(fā)布會現(xiàn)場。這是百度版ChatGPT最新的官方消息,2月7日,文心一言首次官宣,當時稱,產(chǎn)品“3月見”。

3月如期而至,距離發(fā)布會還剩10天,各種消息烘托出期待:3月16日用戶就能用上文心一言了。有心人也在圍觀,文心一言面世后能否達到ChatGPT的能力。


【資料圖】

這個結(jié)果恐怕要等到文心一言產(chǎn)品正式向公眾開放后才能評估,而《元宇宙日爆》從內(nèi)部獲悉,3月16日當日,公眾還無法直接使用文心一言,“內(nèi)測及可能的公測”之后產(chǎn)品才會直達用戶。畢竟,谷歌、微軟的同類產(chǎn)品翻車在前,百度有前車之鑒,以多測確保重點產(chǎn)品的穩(wěn)妥。

文心一言長什么樣?百度內(nèi)部密不透風,些許信號透露,搜索引擎大概率是百度版ChatGPT最主要應(yīng)用方向,“云輸出"文心一言的AI能力也是百度會涉及的業(yè)務(wù)。

這些信號有文心一言底層“文心大模型”的過往應(yīng)用方向可印證,而當微軟將ChatGPT的模型GPT3.5語言整合進Azure的云服務(wù)后,上崗7年多的百度智能云自然會順勢“一言”。

01 產(chǎn)品封閉開發(fā) 測后才示眾

一個大概率的事件是,文心一言最終以產(chǎn)品的形態(tài)供大眾用戶使用,要等到測試之后了,測試很可能會在3月16日之后,百度內(nèi)部人士的說法是,“先內(nèi)測,可能還有公測”。

公開消息可見,內(nèi)測用戶為百度文心一言的首批生態(tài)合作伙伴,主要以企事業(yè)單位為主,其中媒體機構(gòu)最為龐大,包括上海報業(yè)集團旗下的澎湃新聞、四川日報報業(yè)集團下的封面新聞等超過超過160家媒體將成為百度版ChatGPT最先“嘗鮮”的一批用戶。

“輸入文字、獲得回答”的ChatGPT已經(jīng)展現(xiàn)了文本對話型AI機器人對自然語言理解能力的提升,天天和文字打交道的媒體自然展現(xiàn)出對文心一言的剛需。

內(nèi)測之后,可能還有公測,測試不斷,足見百度對推出“國產(chǎn)ChatGPT”所持的謹慎且重視的態(tài)度。畢竟,谷歌和微軟在搶占“對話機器人”的先機時都先后翻了車。

2月10日,在巴黎的一場活動上,谷歌展示Bard“如何向9歲小孩介紹詹姆斯·韋伯空間望遠鏡(JWST)的成果”時,這個機器人將2004年智利的甚大射電望遠鏡(VLA)的重要成果安在JWST頭上,“張冠李戴”的錯誤結(jié)果被網(wǎng)友指摘不說,展示活動當天,谷歌股價下跌超7%,創(chuàng)下去年10月26日以來的最大日跌幅,谷歌市值瞬間蒸發(fā)1000億美元。

“一本正經(jīng)地胡說八道”也是ChatGPT存在的問題,而微軟將該機器人的底層模型引入搜索引擎必應(yīng)(Bing)后,不只會出現(xiàn)錯誤知識,甚至還出現(xiàn)了“倫理問題”。有獲得體驗權(quán)限的網(wǎng)友曬出長時間與Bing的機器人聊天稱,該搜索引擎彈出了要和提問者“戀愛”甚至“勸離婚”的內(nèi)容;還有記者反饋,他指出Bing機器人的錯誤后,遭遇了它的嘲諷,后來被不認錯的Bing以“你沒有好好使用我”指責了。

這兩大互聯(lián)網(wǎng)巨頭的對話機器人亮相后,中國市場自然會將目光投向百度的文心一言,拿來比較、體驗是一定會出現(xiàn)的。如此矚目,百度要“測了再測”也就不難理解了。

至于文心一言到底長什么樣,百度的內(nèi)部人士稱,產(chǎn)品一直處于封閉研發(fā)中,“估計只有李彥宏和王海峰知道了,但兩人會在發(fā)布會上說什么,也沒人知道?!?月16日,也就再等10天,答案將揭曉。

百度內(nèi)部對文心一言的產(chǎn)品終態(tài)密不透風,倒是這類文本生成式的產(chǎn)品,百度有不少,最值得注意的是2021年年底發(fā)布的百億級“知識增強大模型”文心ERNIE3.0。

飛槳社區(qū)成員放出的ERNIE3.0模型功能

有程序員在百度的飛槳社區(qū)中放出過ERNIE3.0在“文本理解與創(chuàng)作”上的效果,截圖顯示,該模型可實現(xiàn)同義改寫、寫作文、對對聯(lián)、寫小說、補全文本等功能,其中也支持自由問答,輸入問題后,點擊立即生成,就會獲得AI的答案。

《元宇宙日爆》發(fā)現(xiàn),現(xiàn)在在文心大模型官網(wǎng)上,如果你在“開放API”欄目中點擊“ERNIE3.0文本理解與創(chuàng)作”選項時,直接彈出的是文心一言的官宣預(yù)告。這或許暗示著,ERNIE3.0身上的本事很可能將在文心一言中展現(xiàn),雙方的關(guān)系類似GPT-3模型與ChatGPT。

02 大模型露玄機 “搜索+云”追微軟

ERNIE3.0模型的存在至少證明了百度在對話機器人上已有技術(shù)積累。

如果類比的話,百度的ERNIE文心大模型類似于Open AI的GPT模型,于2019年推出,從單一的自然語言理解延申到多模態(tài),包括視覺、文檔、文圖、語音等,不斷迭代到了3.0。

文心一言和去年8月推出的AI生圖應(yīng)用“文心一格”一樣,名字部分直取于文心大模型,那么基于ERNIE系列,文心一言就可以在這個模型上進行泛化和性能調(diào)整。ERNIE 3.0的文本理解與創(chuàng)作能力也說明了這一點。按百度內(nèi)部人士的說法,文心一言不是什么新鮮物種,是大模型基礎(chǔ)上的迭代。

那么,脫胎于文心大模型的文心一言,到底是網(wǎng)頁版的ChatGPT還是搜索引擎式的新Bing?

更大的概率會集成進搜索引擎中。

一方面,百度最為人知的產(chǎn)品是國人天天都要“百度一下”的搜素引擎,同類競品中,谷歌、微軟這兩大巨額投入AI的公司也最先將對話機器人的模型和技術(shù)嵌入到搜索中。

此外,生成式AI和搜索引擎在技術(shù)上本身“很搭”。今年1月,百度Create AI開發(fā)者大會前夕,李彥宏表態(tài),將基于百度自研的生成式模型升級為“生成式搜索”,“生成式AI和搜索引擎是互補關(guān)系而不是替代?!?/p>

將文心一言引入搜索引擎,對百度的大模型也有好處。要知道,ChatGPT預(yù)訓練大模型的語料數(shù)據(jù)主要來自互聯(lián)網(wǎng)的文本數(shù)據(jù)庫,包括從網(wǎng)絡(luò)文本、維基百科、文章中獲取的高達570GB的數(shù)據(jù)。那么,文心一言如果接入百度搜索引擎,與用戶的交互和聊天將為文心大模型提供更具數(shù)量級的自然語言模型的訓練數(shù)據(jù),這些大規(guī)模結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)將為中文版的ChatGPT提供更充分的預(yù)訓練語料。

文心大模型諸多產(chǎn)品化

綜合分析,文心一言接入百度搜索的可行性很高。而除了搜索,這個Bot可嵌入的另外一塊百度基建是“云”。

ChatGPT爆火后,微軟幾乎將全線產(chǎn)品都加上了OpenAI研發(fā)的GPT 3.5模型,除了Bing和Office外,Azure云服務(wù)是其中的重頭戲,微軟試圖通過Azure+GPT3.5的方式對外輸出AI基礎(chǔ)設(shè)施、模型和工具鏈,服務(wù)于想要構(gòu)建應(yīng)用程序的第三方。

如果說“文心一言+搜索”是面向C端的產(chǎn)品,那么“文心一言+云”會直取B端,這意味著商業(yè)化。

在云市場上,百度智能云已經(jīng)上崗7年,在AI高需求的算法、算力上均有布局,比如位于陽泉、定興、徐水的三個云計算中心,這些基建的存在十分必要,畢竟,國產(chǎn)版ChatGPT上線后,首先得“不崩”。應(yīng)對有高并發(fā)需求的產(chǎn)品,ERNIE大模型將再次驗證百度云高并發(fā)、高彈性、高精度的能力。

反觀AI,百度也極其擅長將大模型的能力產(chǎn)品和場景化,光文心大模型,就整合出適配醫(yī)療、金融等各種具體場景的子模型,去年還搞了AI生圖的文心一格。

文心一言首批生態(tài)合作伙伴已是企業(yè)云集,百度要“交朋友”,各家公司也不吝惜友情。百度內(nèi)部人士透露,每天都會收到“求內(nèi)測”的企業(yè)客戶。ChatGPT這口鮮貨,無論是主營線上業(yè)務(wù)的互聯(lián)網(wǎng)公司,還是主打線下場景的傳統(tǒng)企業(yè),都躍躍欲試。海外跨境調(diào)用難,百度國產(chǎn)自然成了香餑餑。

C端有搜索引擎,B端有云服務(wù),文心一言能整合的百度產(chǎn)品不少。發(fā)布會在即,測試將近,這個“本地媳婦”是丑是俊、能否和“外來媳婦”一拼,3月16日之后將見分曉。

責任編輯:房家輝

分享到:版權(quán)聲明:凡注明來源“流媒體網(wǎng)”的文章,版權(quán)均屬流媒體網(wǎng)所有,轉(zhuǎn)載需注明出處。非本站出處的文章為轉(zhuǎn)載,觀點供業(yè)內(nèi)參考,不代表本站觀點。文中圖片均來源于網(wǎng)絡(luò)收集整理,僅供學習交流,版權(quán)歸原作者所有。如涉及侵權(quán),請及時聯(lián)系我們刪除!

關(guān)鍵詞: 搜索引擎 內(nèi)部人士 密不透風

責任編輯:QL0009

為你推薦

關(guān)于我們| 聯(lián)系我們| 投稿合作| 法律聲明| 廣告投放

版權(quán)所有 © 2020 跑酷財經(jīng)網(wǎng)

所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀網(wǎng)站聲明。本站不作任何非法律允許范圍內(nèi)服務(wù)!

聯(lián)系我們:315 541 185@qq.com