商湯科技執(zhí)行商務(wù)總監(jiān)李星冶。
紅網(wǎng)時(shí)刻新聞?dòng)浾?吳公然 攝影 張必聞 長(zhǎng)沙報(bào)道
(相關(guān)資料圖)
還記得童話里那支“畫什么,什么就活過(guò)來(lái)”的神筆嗎?如今,人工智能(AI)正將這份奇妙的創(chuàng)造力賦予每一個(gè)普通人。
在11月12日舉行的2025中國(guó)新媒體大會(huì)上,商湯科技執(zhí)行商務(wù)總監(jiān)李星冶向記者描繪了這樣一幅圖景:無(wú)需專業(yè)的攝像機(jī)、復(fù)雜的剪輯軟件和深厚的拍攝功底,你只需對(duì)著電腦說(shuō)幾句話,一個(gè)情節(jié)完整、鏡頭流暢、角色生動(dòng)的短視頻就能一鍵生成。
這并非遙不可及的科幻場(chǎng)景,而是商湯科技在此次大會(huì)上帶來(lái)的現(xiàn)實(shí)解決方案。
從“高門檻”到“一句話的事”
繼去年首次亮相并展示AI大模型的巨大潛力后,今年商湯科技再度受邀,不僅參與論壇分享行業(yè)洞察,更首次攜其重磅產(chǎn)品登陸新媒體技術(shù)展臺(tái)。
商湯科技用兩款“硬核”應(yīng)用——AI視頻創(chuàng)作Agent平臺(tái)“Seko”和“如影”數(shù)字人視頻生成平臺(tái)的圖片數(shù)字人功能,向業(yè)界宣告:生成式AI已從炫技的“概念期”,全面邁入與場(chǎng)景深度結(jié)合的“實(shí)用期”。
“過(guò)去,制作一個(gè)專業(yè)的短視頻,需要編劇、導(dǎo)演、拍攝、剪輯、后期等多個(gè)環(huán)節(jié),門檻高、周期長(zhǎng)、成本不菲。而現(xiàn)在,AI可以一個(gè)人承擔(dān)起整個(gè)團(tuán)隊(duì)的工作?!崩钚且痹诮榻B其核心產(chǎn)品Seko時(shí),作了一個(gè)生動(dòng)的比喻。
根據(jù)李星冶描繪,Seko就像一個(gè)高度智能的“導(dǎo)演團(tuán)隊(duì)”,你只需要用最自然的語(yǔ)言告訴它你的創(chuàng)意,比如“我想做一個(gè)關(guān)于太空咖啡館的1分鐘科幻短劇”,它就能自動(dòng)將這個(gè)指令拆解成寫劇本、設(shè)計(jì)分鏡、確保角色形象一致、配音配樂等子任務(wù),然后調(diào)動(dòng)專業(yè)的AI模型分頭執(zhí)行,最終直接給你一個(gè)成片。
這種被稱為“創(chuàng)編一體”的模式,徹底打破了傳統(tǒng)視頻制作中需要在不同軟件間反復(fù)切換、調(diào)整復(fù)雜參數(shù)的束縛。
李星冶強(qiáng)調(diào),這不僅是效率的飛躍,更是創(chuàng)作民主化的體現(xiàn)?!拔覀冋吹健畡?chuàng)編一體’的成片智能體成為行業(yè)趨勢(shì)?!?/p>
“它一方面滿足了影視、廣告等專業(yè)領(lǐng)域?qū)π屎唾|(zhì)量的兼顧需求;另一方面,也極大地降低了門檻,讓非專業(yè)用戶也能輕松實(shí)現(xiàn)創(chuàng)作夢(mèng)想,不再被復(fù)雜的技術(shù)技能所限制?!崩钚且边M(jìn)一步解釋道。
目前,Seko已經(jīng)與多家專業(yè)短劇、漫劇制作團(tuán)隊(duì)、自媒體和專業(yè)工作室達(dá)成合作,正在將這種全新的工作流變?yōu)樾袠I(yè)常態(tài)。
一張照片即可生成擬真視頻
依托商湯日日新大模型的多模態(tài)能力,只需上傳一張人物照片,輸入文字腳本或音頻文件,AI就能自動(dòng)生成人物動(dòng)態(tài)視頻,并支持多種語(yǔ)言,實(shí)現(xiàn)了與真人幾乎無(wú)差別的口型匹配、動(dòng)作呼應(yīng)和情緒表達(dá)。
與市面上多數(shù)停留在5-10秒短片段的圖生視頻工具不同,如影圖片數(shù)字人能夠穩(wěn)定生成長(zhǎng)達(dá)3分鐘以上的動(dòng)態(tài)視頻,全程保持人物ID、背景風(fēng)格的高度一致性。
如影圖片數(shù)字人還能通過(guò)提示詞,如“揮手”,精準(zhǔn)驅(qū)動(dòng)人物肢體動(dòng)作,甚至支持快速大幅度手部動(dòng)作,解決“動(dòng)作僵硬、與內(nèi)容脫節(jié)”問(wèn)題。
在媒體傳播中,自媒體創(chuàng)作者可以用自己的照片生成口播短視頻,新聞機(jī)構(gòu)也能借助3D人物圖實(shí)現(xiàn)多語(yǔ)種播報(bào)。就像這次2025中國(guó)新媒體技術(shù)展的數(shù)字形象代言人“妹陀”,就是使用了如影圖片數(shù)字人技術(shù)生成。
“看起來(lái)是一個(gè)3D建模加渲染出來(lái)的數(shù)字人,但實(shí)際上只用了一張AI圖片和一段提示詞,可以說(shuō)降低了傳統(tǒng)數(shù)字人技術(shù)將近90%的時(shí)間和成本”,李星冶介紹道。
除此之外,“如影”數(shù)字人平臺(tái)的核心能力也正為企業(yè)營(yíng)銷和直播帶貨帶來(lái)革命性變化。
“想象一下,一個(gè)成熟的真人直播間,想要復(fù)制到不同平臺(tái)或?qū)崿F(xiàn)24小時(shí)不間斷直播,通常需要投入大量的人力、設(shè)備和場(chǎng)地成本?!?/p>
李星冶分享了一個(gè)令人震撼的案例,“但通過(guò)‘如影’數(shù)字人平臺(tái),我們可以無(wú)需視頻采集,直接復(fù)刻一個(gè)現(xiàn)有的直播間,實(shí)現(xiàn)‘當(dāng)日復(fù)刻,當(dāng)日開播’。這讓數(shù)字人直播間的運(yùn)營(yíng)效率相比傳統(tǒng)模式提升了整整10倍?!?/p>
“如影”的背后,是商湯自研的“日日新SenseNova”大模型體系在提供強(qiáng)大支持。
它整合了文本生成、語(yǔ)音合成、動(dòng)作生成等多種AI能力,讓用戶可以像“拼樂高”一樣,快速創(chuàng)建一個(gè)高度擬人、音畫同步的個(gè)性化數(shù)字人,用于生成高質(zhì)量的短視頻、進(jìn)行直播帶貨等。
值得一提的是,該平臺(tái)已通過(guò)中國(guó)信通院的“可信虛擬人生成內(nèi)容管理系統(tǒng)”測(cè)評(píng),確保了生成內(nèi)容的安全與可信。
目前,“如影”已廣泛應(yīng)用于教育、金融、營(yíng)銷等多個(gè)領(lǐng)域,成為企業(yè)降本增效的利器。
AI技術(shù)推動(dòng)新媒體行業(yè)邁向高質(zhì)量發(fā)展
基于過(guò)去一年的行業(yè)實(shí)踐,李星冶也分享了商湯科技對(duì)于AI大模型與新媒體融合的思考。
價(jià)值核心從“可生成”轉(zhuǎn)向“生成可控”?!霸缙诘腁I生成工具,大家驚嘆于它能‘畫出來(lái)’‘做出來(lái)’。但現(xiàn)在,行業(yè)更關(guān)心的是能否精準(zhǔn)地控制生成結(jié)果,以體現(xiàn)創(chuàng)作者的獨(dú)特意圖和滿足商業(yè)化需求?!崩钚且敝赋?,尤其是在短劇、廣告片等專業(yè)領(lǐng)域,豐富的可編輯性至關(guān)重要,這直接關(guān)系到內(nèi)容能否真正落地,并確保其合規(guī)與安全。
未來(lái)發(fā)展不能靠“單打獨(dú)斗”,必須“共建生態(tài)”?!癆I大模型技術(shù)在新媒體領(lǐng)域的落地,絕非一家公司推出一款產(chǎn)品就能成功的。”李星冶強(qiáng)調(diào),“它需要與廣大的內(nèi)容創(chuàng)作者、平臺(tái)方、行業(yè)伙伴攜手,共同構(gòu)建一個(gè)繁榮的生態(tài),才能滿足千變?nèi)f化的場(chǎng)景需求,讓AI真正融入產(chǎn)業(yè)血脈,發(fā)揮其最大價(jià)值?!?/p>
中國(guó)新媒體大會(huì)作為行業(yè)發(fā)展的“風(fēng)向標(biāo)”,始終敏銳捕捉并推動(dòng)著技術(shù)變革在媒體領(lǐng)域的深度融合。
李星冶認(rèn)為,AI企業(yè)積極參與大會(huì),不僅展示前沿技術(shù),更通過(guò)實(shí)際的產(chǎn)品與解決方案,為整個(gè)新媒體生態(tài)持續(xù)注入三重關(guān)鍵動(dòng)能:
一是重塑內(nèi)容生產(chǎn)流程,實(shí)現(xiàn)“降本增效”。AI技術(shù)正推動(dòng)內(nèi)容創(chuàng)作從高成本、長(zhǎng)周期的傳統(tǒng)模式,轉(zhuǎn)向低成本、快迭代的智能化生產(chǎn),大幅降低專業(yè)創(chuàng)作門檻。
二是提升商業(yè)轉(zhuǎn)化效率,拓展?fàn)I銷邊界。以數(shù)字人直播間為代表的AI工具,以更高性價(jià)比和靈活部署能力,為直播電商、品牌營(yíng)銷等領(lǐng)域提供了更高效的轉(zhuǎn)化路徑。
三是推動(dòng)傳統(tǒng)文化破圈,激活文化IP價(jià)值。通過(guò)技術(shù)手段賦能文博資源,AI能夠助力傳統(tǒng)文化以更生動(dòng)、更貼近年輕語(yǔ)境的形態(tài)實(shí)現(xiàn)當(dāng)代傳播,完成從文化資源到文化資產(chǎn)的轉(zhuǎn)化。
可以預(yù)見,隨著AI深度融入內(nèi)容創(chuàng)作全鏈路,一個(gè)更具創(chuàng)造力、運(yùn)營(yíng)更高效、生態(tài)更多元的新媒體時(shí)代正加速到來(lái)。
本文為湖南頻道原創(chuàng)文章,轉(zhuǎn)載請(qǐng)附上原文出處鏈接和本聲明。
本文鏈接:https://hn.rednet.cn/content/646955/56/15425751.html
熱門
聯(lián)系我們:435 226 40 @qq.com
版權(quán)所有 重播新聞網(wǎng) zzx33.com 京ICP備2022022245號(hào)-17