齊魯網(wǎng)·閃電新聞10月21日訊 10月21日上午,2023(GIAC)智能視聽(tīng)大會(huì)在青島舉行,人民網(wǎng)研究院在開(kāi)幕式暨主論壇發(fā)布《新技術(shù)浪潮下的智能視聽(tīng)步入深度變革新階段——2023年人工智能賦能網(wǎng)絡(luò)視聽(tīng)產(chǎn)業(yè)觀察報(bào)告》(以下簡(jiǎn)稱(chēng)《報(bào)告》)?!秷?bào)告》圍繞綜合視頻、短視頻、網(wǎng)絡(luò)直播和網(wǎng)絡(luò)音頻四種視聽(tīng)形態(tài)梳理了2023年人工智能賦能網(wǎng)絡(luò)視聽(tīng)創(chuàng)新應(yīng)用的典型案例,以及人工智能相關(guān)法規(guī)政策與行業(yè)規(guī)范發(fā)布情況,并探討了行業(yè)未來(lái)發(fā)展趨勢(shì),為智能視聽(tīng)未來(lái)發(fā)展提供參考。
人工智能推動(dòng)網(wǎng)絡(luò)視聽(tīng)行業(yè)“質(zhì)量與效率”變革
《報(bào)告》指出,2023年,人工智能技術(shù)的突破式發(fā)展與創(chuàng)新應(yīng)用,給視聽(tīng)行業(yè)帶來(lái)了“質(zhì)量與效率”變革,推動(dòng)視聽(tīng)產(chǎn)品實(shí)現(xiàn)更多創(chuàng)意、更高效率、更新體驗(yàn)與更高品質(zhì)。
在綜合視頻領(lǐng)域,2023年,隨著AI大模型和多模態(tài)AI技術(shù)的融合發(fā)展,人工智能生成內(nèi)容的創(chuàng)作能力、通用化能力以及工業(yè)化水平快速提升。影視創(chuàng)作中的AI前沿技術(shù)應(yīng)用進(jìn)入新階段,貫通影視內(nèi)容策劃、開(kāi)發(fā)、制作和宣發(fā)等各個(gè)環(huán)節(jié)。
相對(duì)于專(zhuān)業(yè)的影視制作,AI技術(shù)在短視頻方面的應(yīng)用門(mén)檻相對(duì)更低。在關(guān)鍵詞自動(dòng)提取、字幕自動(dòng)生成等基本操作基礎(chǔ)上,文本自動(dòng)配音、文本轉(zhuǎn)視頻、數(shù)字人播報(bào)、個(gè)性化文案、多元風(fēng)格等升級(jí)功能在2023年加速發(fā)展。作為創(chuàng)作基礎(chǔ)工具的AI模型與產(chǎn)品、平臺(tái)加速發(fā)展,初步獲得可觀的商業(yè)流量。
網(wǎng)絡(luò)直播領(lǐng)域,人工智能技術(shù)進(jìn)一步應(yīng)用到電商直播、音樂(lè)會(huì)直播、體育直播等多種場(chǎng)景中。其中,大批數(shù)字人虛擬主播涌入直播間帶貨,成為當(dāng)前網(wǎng)絡(luò)直播行業(yè)的火熱景象。不過(guò),數(shù)字人直播目前處在發(fā)展應(yīng)用的初期,效果有待提升優(yōu)化,數(shù)字人在一些平臺(tái)的使用規(guī)則尚處于探索中。
網(wǎng)絡(luò)音頻領(lǐng)域,2023年,部分垂直類(lèi)音頻平臺(tái)通過(guò)引入AI大模型,促進(jìn)AI前沿技術(shù)在音頻產(chǎn)業(yè)落地應(yīng)用。未來(lái),AI音頻行業(yè)將觸發(fā)各細(xì)分應(yīng)用場(chǎng)景全面變革,圍繞音頻生成、語(yǔ)音交互、識(shí)別翻譯、個(gè)性化推薦等領(lǐng)域,應(yīng)用產(chǎn)品將覆蓋在線辦公、移動(dòng)社交、廣告營(yíng)銷(xiāo)、學(xué)校教育、體育比賽、居家養(yǎng)老等多元場(chǎng)景。
法規(guī)政策與行業(yè)規(guī)范陸續(xù)出臺(tái)劃定行業(yè)發(fā)展“紅線”
《報(bào)告》還梳理了近一年來(lái)我國(guó)出臺(tái)的人工智能相關(guān)的法規(guī)政策與行業(yè)規(guī)范,包括《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》、《生成式人工智能服務(wù)管理暫行辦法》、《科技倫理審查辦法(試行)》等。
隨著人工智能技術(shù)的進(jìn)一步成熟和應(yīng)用場(chǎng)景的擴(kuò)展,人工智能創(chuàng)新應(yīng)用給行業(yè)和全社會(huì)帶來(lái)的治理挑戰(zhàn)不容忽視。國(guó)家相關(guān)部門(mén)及時(shí)出臺(tái)法規(guī)政策,相關(guān)行業(yè)規(guī)范及平臺(tái)自治規(guī)定也陸續(xù)發(fā)布,推動(dòng)人工智能技術(shù)合理有效利用,及時(shí)劃定發(fā)展“底線”與“紅線”。
生成式人工智能迭代升級(jí)打造視聽(tīng)行業(yè)深度變革新起點(diǎn)
《報(bào)告》最后展望了人工智能賦能網(wǎng)絡(luò)視聽(tīng)的未來(lái)發(fā)展趨勢(shì)。
一是網(wǎng)絡(luò)視聽(tīng)將成為AI大模型垂直應(yīng)用探索落地核心場(chǎng)景。AI技術(shù)發(fā)展的重點(diǎn)未來(lái)將轉(zhuǎn)向?qū)嵱眯院涂沙掷m(xù)性方向,關(guān)注如何將大模型與實(shí)際應(yīng)用場(chǎng)景相結(jié)合,實(shí)現(xiàn)真正的商業(yè)化應(yīng)用。網(wǎng)絡(luò)視聽(tīng)始終是信息網(wǎng)絡(luò)新技術(shù)創(chuàng)新應(yīng)用的前沿領(lǐng)域,未來(lái)也將進(jìn)一步成為大模型垂直應(yīng)用探索落地的核心場(chǎng)景,催生新業(yè)態(tài)新模式。
二是生成式人工智能迭代升級(jí)打造視聽(tīng)行業(yè)深度變革新起點(diǎn)。目前,生成式人工智能的底層技術(shù)和產(chǎn)業(yè)生態(tài)已形成了新格局,未來(lái)該技術(shù)在更多行業(yè)的海量應(yīng)用場(chǎng)景有望打開(kāi)。在此背景下,“平均水平的基礎(chǔ)勞動(dòng)”加速被取代,未來(lái)視聽(tīng)創(chuàng)作焦點(diǎn)更多轉(zhuǎn)向高質(zhì)量創(chuàng)意、藝術(shù)審美與內(nèi)容共情,推動(dòng)更高水平競(jìng)爭(zhēng)。技術(shù)應(yīng)用與生產(chǎn)方式的突破性創(chuàng)新,也將成為整個(gè)視聽(tīng)產(chǎn)業(yè)新變局的起點(diǎn),推動(dòng)視聽(tīng)形態(tài)、場(chǎng)景、體驗(yàn)、產(chǎn)業(yè)布局的多維變革,并對(duì)文化發(fā)展、社會(huì)交往等方面產(chǎn)生深遠(yuǎn)影響。
三是新技術(shù)交叉融合發(fā)展將助力“視聽(tīng)+”產(chǎn)業(yè)新生態(tài)。當(dāng)前,人工智能新技術(shù)的發(fā)展演進(jìn)不是單一升級(jí),而是與5G、VR等新技術(shù)發(fā)展相互融合、多點(diǎn)突破,以技術(shù)的融合發(fā)展應(yīng)用提升創(chuàng)新密度、解決復(fù)雜問(wèn)題、豐富產(chǎn)品體驗(yàn)。另一方面,在“萬(wàn)物皆媒”的時(shí)代,視聽(tīng)具備巨大的信息交流“基礎(chǔ)設(shè)施”優(yōu)勢(shì),使得網(wǎng)絡(luò)視聽(tīng)行業(yè)不斷與各行業(yè)交叉融合發(fā)展,推動(dòng)形成“大視聽(tīng)”的產(chǎn)業(yè)發(fā)展新生態(tài)。隨著技術(shù)融合與產(chǎn)業(yè)融合相互促進(jìn),跨模態(tài)、多元化、邊界消融將成為重要特征。
四是治理協(xié)調(diào)性有效性的加強(qiáng)促使AI治理框架逐步完善。在人工智能快速發(fā)展過(guò)程中,如何建立合理審慎的AI倫理和治理框架,塑造負(fù)責(zé)任的AI生態(tài),越來(lái)越受到社會(huì)各界的重視。在當(dāng)前政策措施基礎(chǔ)上,下一階段圍繞人工智能技術(shù)應(yīng)用的敏捷治理、分類(lèi)分級(jí)管理將進(jìn)一步加強(qiáng),人工智能治理體系逐步完善。在智能視聽(tīng)方面,尤其需要統(tǒng)籌推進(jìn)“技術(shù)”監(jiān)管與“內(nèi)容”治理,實(shí)現(xiàn)發(fā)展與規(guī)范的動(dòng)態(tài)平衡。
《報(bào)告》認(rèn)為,2023年,面對(duì)人工智能新浪潮帶來(lái)的巨大沖擊,一方面防止“高估一項(xiàng)技術(shù)在短期內(nèi)的影響”,另一方面防止“低估其在長(zhǎng)期內(nèi)的影響”,人工智能賦能視聽(tīng)行業(yè)的創(chuàng)新探索仍任重道遠(yuǎn)。