李兵:“白澤”跨模態大模型高效賦能數字版權保護
              2023-06-30 14:33:06 來源:

              人民網北京6月30日電 (王紹紹)28日下午,2023中國新產業(北京)峰會在人民網一號演播廳舉行,本屆峰會以“智能新時代、產業新未來”為主題,邀請多位頭部企業與專精特新企業代表、專家學者齊聚一堂,共同探討智能元年,科技與產業的融合共生,探討賦能中小企業發展的新路徑、新場景。


              (資料圖片)

              人民中科首席科學家李兵。人民網 王紹紹攝

              機器輔助內容的生成、傳播、聚合,給數字內容及其版權的智能化運營帶來新機會、新模式的同時,也給版權保護帶來了全新的挑戰。人民中科首席科學家李兵介紹,基于“白澤”跨模態大模型,用戶可高效率、低成本的智能化掃描、識別和分析互聯網上的海量多模態數字內容,判斷內容被使用和傳播的情況。

              李兵表示,隨著技術的進步,內容呈現方式日趨視頻化、互動化,內容形態已經從傳統的文本、圖片發展到以音視頻為主的多模態。自動化工具的普及,使制作變得更加大眾化、個人化的同時,使用和傳播別人的內容也變得十分容易和方便,尤其是最近幾年出現了基于生成式人工智能(AIGC)的全自動方法,效率遠超以往的手工編輯或基于編輯軟件的半自動方式。

              李兵介紹,“白澤”是海量多源異構跨模態數據預訓練的基礎模型,并使用了先進的跨模態智能理解技術,能夠對文本、圖像、視頻等多種模態信息進行統一理解、統一表達、統一度量,從而實現跨模態生成、跨模態搜索、開集視頻標簽、跨模態對話、細粒度跨模態搜索等功能。“白澤”數字版權保護平臺正是基于“白澤”跨模態大模型強大的內容理解與發現能力,能夠實現一站式智能化的版權運營與監測,具有以下特點:

              服務功能全:平臺實現了從版權管理、內容監測、固證取證、統計分析的一站式服務。只需提交目標內容,平臺便自動進行監測,發現線索后可自動審核、自動取證,有效解決了線索發現難、手動取證時間長、人力成本高等問題。

              監測范圍廣:平臺實現了跨平臺的內容掃描,覆蓋數十家主流平臺,實現從實時、三個月、半年、一年到更長時間內發布內容的監測。

              監測手段多:平臺除了支持文本、圖像、視頻單模態內容輸入,還支持多種模態、多種線索內容同時輸入,并支持多線索邏輯運算操作,充分利用跨模態理解和協同能力,發現數字內容、數字商品中的違規、偽造、雷同等信息。

              監測精度高:平臺能夠實現文件級、片段級、秒級以及幀級的目標內容精準發現。從而實現快速精準取證。

              抗攻擊型強:數字內容及其版權的監測需要適應長期的博弈對抗,平臺適應大面積裁剪、背景填充、屏幕翻拍、人臉變換、畫中畫、重編碼、馬賽克等多達20多種的常用手段,實現對抗環境下的目標內容發現。

              監測速度快:平臺采用了自主研發的基于“教導主任-教師-學生”的模型蒸餾與加速算法,能夠實現在億級規模上的秒級響應,從而實現對大規模復雜數據的快速監測能力。

              監測數據豐富:平臺能夠提供版權違規內容,違規賬號,違規賬號屬性以及關系、違規態勢等多維度的監測信息,為探索版權運營提供了新模式和新的機制,也為未來相關數字版權標準定制和實施提供了非常重要的支撐依據。

              “下一步,‘白澤’數字版權保護平臺將繼續完善版權登記和聚集、版權監測和保護、版權交易和資產化、版權運營和傳播等核心模塊,為數字內容的優質發展提供可信的人工智能技術。”李兵說。

              (責編:楊虞波羅、高雷)關注公眾號:人民網財經
              關鍵詞:
              責任編輯:zN_3059