齊魯網·閃電新聞10月21日訊 10月21日上午,2023(GIAC)智能視聽大會在青島舉行,人民網研究院在開幕式暨主論壇發布《新技術浪潮下的智能視聽步入深度變革新階段——2023年人工智能賦能網絡視聽產業觀察報告》(以下簡稱《報告》)。《報告》圍繞綜合視頻、短視頻、網絡直播和網絡音頻四種視聽形態梳理了2023年人工智能賦能網絡視聽創新應用的典型案例,以及人工智能相關法規政策與行業規范發布情況,并探討了行業未來發展趨勢,為智能視聽未來發展提供參考。
人工智能推動網絡視聽行業“質量與效率”變革
《報告》指出,2023年,人工智能技術的突破式發展與創新應用,給視聽行業帶來了“質量與效率”變革,推動視聽產品實現更多創意、更高效率、更新體驗與更高品質。
在綜合視頻領域,2023年,隨著AI大模型和多模態AI技術的融合發展,人工智能生成內容的創作能力、通用化能力以及工業化水平快速提升。影視創作中的AI前沿技術應用進入新階段,貫通影視內容策劃、開發、制作和宣發等各個環節。
相對于專業的影視制作,AI技術在短視頻方面的應用門檻相對更低。在關鍵詞自動提取、字幕自動生成等基本操作基礎上,文本自動配音、文本轉視頻、數字人播報、個性化文案、多元風格等升級功能在2023年加速發展。作為創作基礎工具的AI模型與產品、平臺加速發展,初步獲得可觀的商業流量。
網絡直播領域,人工智能技術進一步應用到電商直播、音樂會直播、體育直播等多種場景中。其中,大批數字人虛擬主播涌入直播間帶貨,成為當前網絡直播行業的火熱景象。不過,數字人直播目前處在發展應用的初期,效果有待提升優化,數字人在一些平臺的使用規則尚處于探索中。
網絡音頻領域,2023年,部分垂直類音頻平臺通過引入AI大模型,促進AI前沿技術在音頻產業落地應用。未來,AI音頻行業將觸發各細分應用場景全面變革,圍繞音頻生成、語音交互、識別翻譯、個性化推薦等領域,應用產品將覆蓋在線辦公、移動社交、廣告營銷、學校教育、體育比賽、居家養老等多元場景。
法規政策與行業規范陸續出臺劃定行業發展“紅線”
《報告》還梳理了近一年來我國出臺的人工智能相關的法規政策與行業規范,包括《互聯網信息服務深度合成管理規定》、《生成式人工智能服務管理暫行辦法》、《科技倫理審查辦法(試行)》等。
隨著人工智能技術的進一步成熟和應用場景的擴展,人工智能創新應用給行業和全社會帶來的治理挑戰不容忽視。國家相關部門及時出臺法規政策,相關行業規范及平臺自治規定也陸續發布,推動人工智能技術合理有效利用,及時劃定發展“底線”與“紅線”。
生成式人工智能迭代升級打造視聽行業深度變革新起點
《報告》最后展望了人工智能賦能網絡視聽的未來發展趨勢。
一是網絡視聽將成為AI大模型垂直應用探索落地核心場景。AI技術發展的重點未來將轉向實用性和可持續性方向,關注如何將大模型與實際應用場景相結合,實現真正的商業化應用。網絡視聽始終是信息網絡新技術創新應用的前沿領域,未來也將進一步成為大模型垂直應用探索落地的核心場景,催生新業態新模式。
二是生成式人工智能迭代升級打造視聽行業深度變革新起點。目前,生成式人工智能的底層技術和產業生態已形成了新格局,未來該技術在更多行業的海量應用場景有望打開。在此背景下,“平均水平的基礎勞動”加速被取代,未來視聽創作焦點更多轉向高質量創意、藝術審美與內容共情,推動更高水平競爭。技術應用與生產方式的突破性創新,也將成為整個視聽產業新變局的起點,推動視聽形態、場景、體驗、產業布局的多維變革,并對文化發展、社會交往等方面產生深遠影響。
三是新技術交叉融合發展將助力“視聽+”產業新生態。當前,人工智能新技術的發展演進不是單一升級,而是與5G、VR等新技術發展相互融合、多點突破,以技術的融合發展應用提升創新密度、解決復雜問題、豐富產品體驗。另一方面,在“萬物皆媒”的時代,視聽具備巨大的信息交流“基礎設施”優勢,使得網絡視聽行業不斷與各行業交叉融合發展,推動形成“大視聽”的產業發展新生態。隨著技術融合與產業融合相互促進,跨模態、多元化、邊界消融將成為重要特征。
四是治理協調性有效性的加強促使AI治理框架逐步完善。在人工智能快速發展過程中,如何建立合理審慎的AI倫理和治理框架,塑造負責任的AI生態,越來越受到社會各界的重視。在當前政策措施基礎上,下一階段圍繞人工智能技術應用的敏捷治理、分類分級管理將進一步加強,人工智能治理體系逐步完善。在智能視聽方面,尤其需要統籌推進“技術”監管與“內容”治理,實現發展與規范的動態平衡。
《報告》認為,2023年,面對人工智能新浪潮帶來的巨大沖擊,一方面防止“高估一項技術在短期內的影響”,另一方面防止“低估其在長期內的影響”,人工智能賦能視聽行業的創新探索仍任重道遠。