資訊> 正文

環(huán)球熱頭條丨大模型建設(shè)成為媒體轉(zhuǎn)型新方向!

時(shí)間: 2022-12-10 07:59:19 來源: 唐瑞峰

11月30日,由深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主辦的WAVE SUMMIT+ 2022深度學(xué)習(xí)開發(fā)者峰會上,百度文心大模型再次升級,包括新增11個(gè)大模型,大模型總量增至36個(gè),構(gòu)建起業(yè)界規(guī)模最大的產(chǎn)業(yè)大模型體系。


【資料圖】

不久前,百度聯(lián)合人民網(wǎng)發(fā)布媒體行業(yè)大模型“人民網(wǎng)-百度·文心”,這是領(lǐng)先的大模型技術(shù)在傳媒行業(yè)的首次嘗試,旨在順應(yīng)內(nèi)容與技術(shù)發(fā)展,打造全媒體時(shí)代內(nèi)容科技創(chuàng)新引擎。

人民網(wǎng)-百度·文心大模型基于文心大模型ERNIE3.0,引入人民網(wǎng)在傳媒行業(yè)積淀的行業(yè)知識與任務(wù)樣本數(shù)據(jù),結(jié)合雙方在預(yù)訓(xùn)練大模型技術(shù)和傳媒領(lǐng)域業(yè)務(wù)與算法的經(jīng)驗(yàn)打造。

人工智能是基礎(chǔ)設(shè)施,大模型已成為新方向

近些年來,人工智能的應(yīng)用日益廣泛,“十四五”期間,我國媒體融合發(fā)展進(jìn)入新階段,雖然不同層級和形態(tài)的媒體深度融合、整體轉(zhuǎn)型形式多樣,但引入先進(jìn)的互聯(lián)網(wǎng)技術(shù)已成為行業(yè)共識。5G、大數(shù)據(jù)、云計(jì)算、人工智能等新技術(shù)被應(yīng)用到新聞采編播發(fā)的各個(gè)環(huán)節(jié),成為媒體智能化的基礎(chǔ)設(shè)施。

從內(nèi)容發(fā)展形態(tài)來看,當(dāng)下從文字到圖文到視頻,多模態(tài)的內(nèi)容形式已成為常態(tài),傳播路徑越來越短,傳播速度越來越快。與之相伴的是,以移動終端為傳播介質(zhì)的新媒體成為傳媒輿論的主陣地,傳播形態(tài)和介質(zhì)的變化導(dǎo)致新聞傳播規(guī)則和評價(jià)標(biāo)準(zhǔn)隨之改變。

對傳統(tǒng)媒體來說,加碼技術(shù)領(lǐng)域的投入迫在眉睫。從技術(shù)發(fā)展趨勢來看,隨著數(shù)據(jù)井噴、算法進(jìn)步以及算力突破,預(yù)訓(xùn)練大模型已成為人工智能發(fā)展的新方向,基于大規(guī)模知識和海量無結(jié)構(gòu)數(shù)據(jù)融合學(xué)習(xí)、深度學(xué)習(xí),在多模態(tài)內(nèi)容理解上具備更強(qiáng)的能力,在內(nèi)容生成上也有更好的表現(xiàn),可以進(jìn)一步提升內(nèi)容創(chuàng)作效率,促進(jìn)內(nèi)容生態(tài)繁榮。

在媒體轉(zhuǎn)型浪潮的初期,“造不如買、買不如租”是大多數(shù)媒體的選擇,隨著改革的深入,自主開發(fā)受到不少媒體的青睞,但是“造游艇”和“造航母”,畢竟完全不在一個(gè)數(shù)量級上,預(yù)訓(xùn)練大模型雖然作用巨大、前景廣闊,但受技術(shù)復(fù)雜、研發(fā)周期長、投入成本高等因素的制約,絕大部分媒體都不可能獨(dú)自踏入這條賽道。

以百度為代表的大模型生產(chǎn)企業(yè),在大模型能力、海量數(shù)據(jù)、大規(guī)模算力等方面具有優(yōu)勢,能夠根據(jù)AI應(yīng)用方的需求,自動化、標(biāo)準(zhǔn)化地進(jìn)行多場景多領(lǐng)域的模型生產(chǎn),當(dāng)達(dá)到一定規(guī)模時(shí),即可形成健康、可持續(xù)發(fā)展的大模型產(chǎn)業(yè)模式。

“具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè),可以將模型生產(chǎn)的復(fù)雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務(wù)?!卑俣仁紫夹g(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰指出,如此一來,大數(shù)據(jù)、大算力、大模型能力僅需少數(shù)企業(yè)操心,千行百業(yè)直接應(yīng)用AI模型即可。

王海峰提出的這條產(chǎn)業(yè)化路徑,是媒體轉(zhuǎn)型過程中一種可行的模式。龐雜的系統(tǒng)和復(fù)雜的研發(fā)流程,對以內(nèi)容見長的傳統(tǒng)媒體來說,不啻于一座大山,唯有借助合作伙伴的力量才有可能翻越。

值得一提的是,文心大模型與媒體行業(yè)的結(jié)合已經(jīng)在一些場景上帶來了新模式。傳媒內(nèi)參從百度方面獲悉,部分媒體“策、采、編、發(fā)”各個(gè)環(huán)節(jié)已采用人機(jī)協(xié)作的模式工作。此外,2022年北京冬奧會,大模型作為底層技術(shù)支持的AI數(shù)字人作為手語主播,為超過兩千萬的聽障人士觀看觀賽提供了高效、高質(zhì)量的服務(wù)。

內(nèi)容與技術(shù)的牽手:人工智能加持傳媒、大模型顯著提升行業(yè)效率

作為傳媒領(lǐng)域的AI基礎(chǔ)設(shè)施,百度與人民網(wǎng)計(jì)劃基于人民網(wǎng)-百度·文心大模型,打造全媒體時(shí)代內(nèi)容科技創(chuàng)新引擎,通過集約化的大模型建設(shè),實(shí)現(xiàn)以一個(gè)傳媒行業(yè)大模型底座支持多個(gè)細(xì)分業(yè)務(wù)場景應(yīng)用,加快傳媒行業(yè)融合發(fā)展的步伐。

在百度文心大模型的技術(shù)加持下,人民網(wǎng)首批將自主可控的大模型應(yīng)用于業(yè)務(wù)之中,將打造全媒體時(shí)代內(nèi)容科技創(chuàng)新引擎,引領(lǐng)媒體行業(yè)的AI應(yīng)用新方向。

在技術(shù)方面,以人民網(wǎng)-百度·文心大模型替換原有模型,在各類NLP(自然語言處理)場景上,顯著提升功能效果;在應(yīng)用方面,集約化建設(shè)AI能力,突破效果瓶頸,實(shí)現(xiàn)更多傳媒業(yè)務(wù)場景的降本增效,如應(yīng)用于文章摘要生成等內(nèi)容生成類場景。

人民網(wǎng)-百度·文心大模型已應(yīng)用于人民網(wǎng)的新聞?wù)巿?bào)告生成、新聞內(nèi)容審核分類、輿情分析等重要場景上,取得了比較明顯的效果提升,大幅領(lǐng)先業(yè)界其他模型。

未來該模型還將用于新聞事件抽取分析、新聞評論聚合分析、新聞信息個(gè)性化推薦等更多領(lǐng)域,全面提升大模型對傳媒領(lǐng)域任務(wù)的適配能力,加快傳媒行業(yè)融合發(fā)展步伐。

百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜表示,百度與人民網(wǎng)的合作由來已久,此次聯(lián)合發(fā)布媒體行業(yè)大模型,是人工智能前沿技術(shù)在媒體行業(yè)的最新實(shí)踐成果。

人民網(wǎng)輿情數(shù)據(jù)中心相關(guān)負(fù)責(zé)人表示,人民網(wǎng)輿情數(shù)據(jù)中心一直著力打造“輿情領(lǐng)航者”、“數(shù)據(jù)國家隊(duì)”和“數(shù)字經(jīng)濟(jì)高端智庫”,依托人民網(wǎng)在內(nèi)容科技戰(zhàn)略上的整體布局,積極探索AI技術(shù)在輿情場景的應(yīng)用,推動輿情服務(wù)由人力密集型向智能密集型轉(zhuǎn)變。希望此次與百度在傳媒行業(yè)大模型的共建中能發(fā)揮雙方優(yōu)勢,加速人工智能新技術(shù)在媒體行業(yè)落地。

大模型背后的底氣:技術(shù)賦能多個(gè)行業(yè)、應(yīng)用版圖不斷擴(kuò)大

文心大模型是百度自主研發(fā)的產(chǎn)業(yè)級知識增強(qiáng)大模型體系,全景圖由模型層、工具與平臺層、產(chǎn)品與社區(qū)層構(gòu)成。

在模型層,文心大模型已經(jīng)包括36個(gè)大模型,涵蓋基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型的三級體系,全面滿足產(chǎn)業(yè)應(yīng)用需求,構(gòu)建了業(yè)界規(guī)模最大的產(chǎn)業(yè)大模型體系;在工具與平臺層,通過大模型開發(fā)套件、文心API和提供全流程開箱即用大模型能力的EasyDL和BML開發(fā)平臺,全方位降低應(yīng)用門檻;產(chǎn)品與社區(qū)層,包括AI藝術(shù)與輔助創(chuàng)作平臺“文心一格”、產(chǎn)業(yè)級搜索系統(tǒng)“文心百中”和旸谷社區(qū),讓更多人零距離感受到最先進(jìn)的AI大模型技術(shù)帶來的新體驗(yàn)。

以ERNIE為代表的基礎(chǔ)大模型是文心大模型最重要的基礎(chǔ),也是百度開展的歷史最悠久的模型。從2019年至今,ERNIE已經(jīng)迭代到了3.0版本,每一個(gè)大版本都有基礎(chǔ)技術(shù)的創(chuàng)新。人民網(wǎng)-百度·文心大模型正是基于文心ERNIE 3.0打造。

作為百億參數(shù)知識增強(qiáng)的大模型,文心ERNIE 3.0首次在百億級預(yù)訓(xùn)練模型中引入大規(guī)模知識圖譜,促進(jìn)了結(jié)構(gòu)化知識和無結(jié)構(gòu)文本之間的信息共享,大幅提升了模型對于知識的記憶和推理能力。相比較于沒有知識增強(qiáng)的大模型,文心大模型的學(xué)習(xí)效率更高,且在實(shí)體問答、知識預(yù)測、可控文本生成等多個(gè)場景上擁有更好的效果。

文心大模型在產(chǎn)業(yè)應(yīng)用過程中打磨技術(shù),并致力于持續(xù)降低應(yīng)用門檻,推動產(chǎn)業(yè)智能化升級。

目前,文心大模型已大規(guī)模應(yīng)用于百度搜索、信息流、智能音箱等互聯(lián)網(wǎng)產(chǎn)品,顯著提升了百度的產(chǎn)品效果和用戶體驗(yàn)。從外部落地應(yīng)用來看,文心大模型已通過飛槳開源開放平臺、百度智能云等賦能到工業(yè)、能源、金融、通信、媒體、教育等多個(gè)行業(yè)。

在媒體行業(yè),文心大模型的理解和生成創(chuàng)作能力激發(fā)創(chuàng)意,提升內(nèi)容多樣性,可降低制作成本;在保險(xiǎn)領(lǐng)域應(yīng)用中,文心大模型的智能解析能力,能使文本處理效率提升30倍;在醫(yī)療領(lǐng)域應(yīng)用中,文心大模型將每份病歷的檢查時(shí)間,從30分鐘縮短到了秒級別……

從技術(shù)研發(fā)到落地應(yīng)用,大模型發(fā)展已經(jīng)進(jìn)入產(chǎn)業(yè)落地的關(guān)鍵期,與產(chǎn)業(yè)場景需求的高度契合是大模型真正助力產(chǎn)業(yè)發(fā)展的重要前提。聯(lián)合行業(yè)頭部企業(yè)研制行業(yè)大模型就是百度文心的重要實(shí)踐。隨著人民網(wǎng)的加入,文心大模型再添新成員,應(yīng)用版圖進(jìn)一步擴(kuò)大。截至目前,文心已累計(jì)發(fā)布11個(gè)行業(yè)大模型,涵蓋電力、燃?xì)狻⒔鹑?、航天、傳媒、城市、影視、制造、社科等領(lǐng)域,實(shí)現(xiàn)顯著的效果提升,產(chǎn)業(yè)生態(tài)初步形成。

責(zé)任編輯:李楠

分享到:版權(quán)聲明:凡注明來源“流媒體網(wǎng)”的文章,版權(quán)均屬流媒體網(wǎng)所有,轉(zhuǎn)載需注明出處。非本站出處的文章為轉(zhuǎn)載,觀點(diǎn)供業(yè)內(nèi)參考,不代表本站觀點(diǎn)。文中圖片均來源于網(wǎng)絡(luò)收集整理,僅供學(xué)習(xí)交流,版權(quán)歸原作者所有。如涉及侵權(quán),請及時(shí)聯(lián)系我們刪除!

關(guān)鍵詞: 人工智能 傳媒行業(yè)

責(zé)任編輯:QL0009

為你推薦

關(guān)于我們| 聯(lián)系我們| 投稿合作| 法律聲明| 廣告投放

版權(quán)所有 © 2020 跑酷財(cái)經(jīng)網(wǎng)

所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀網(wǎng)站聲明。本站不作任何非法律允許范圍內(nèi)服務(wù)!

聯(lián)系我們:315 541 185@qq.com