近日,美國開放人工智能研究中心OpenAI發(fā)布首個(gè)視頻生成模型“sora”,該模型通過接收文本指令,即可生成60秒的短視頻。此消息一出,引爆全球網(wǎng)絡(luò),AI技術(shù)變革又一次震撼了整個(gè)世界。
那么,sora為什么一出來就受到全世界的關(guān)注,它的厲害之處又在哪里呢?
sora:開局即王炸
“一位時(shí)尚的女士走在亮著霓虹燈和廣告牌的東京街頭。她穿著黑色皮夾克、紅色長裙和黑色靴子,手提一只黑色包包。她戴著太陽鏡,涂著紅色口紅。她走路既自信又隨意。街道潮濕,地面上的水能夠像鏡面一樣反射色彩斑斕的燈光,路上有很多行人來來往往。”
整個(gè)視頻下來,無論是動(dòng)作順暢度還是背景適配度都和真人拍攝別無二致,值得注意的是,在這短短的59秒視頻中,視頻畫面除了有遠(yuǎn)景、中景、特寫等景別的變換之外,還有清晰的AI模特的微表情、皮膚紋理、斑點(diǎn)等細(xì)節(jié)畫面呈現(xiàn)。sora做到了保持視覺品質(zhì)的同時(shí)又遵循用戶提示,并且還能夠進(jìn)行穩(wěn)定輸出。
相較之下,之前主流的AI生成視頻都在4-6秒之間,且畫面粗陋卡頓不流暢,而sora出道即王炸,將時(shí)長直接拉長到分級(jí)以上,畫面清晰流暢,直接穩(wěn)坐“霸主”地位。
此外,對(duì)于sora,不少人在感嘆科技發(fā)展迅猛的同時(shí)也對(duì)它的發(fā)展應(yīng)用表現(xiàn)出了極大的關(guān)注。
變革與更新:
sora將對(duì)這些行業(yè)產(chǎn)生影響
信達(dá)證券傳媒互聯(lián)網(wǎng)及海外聯(lián)席首席分析師劉旺表示:“如果sora模型全面推廣,會(huì)直接推動(dòng)上游AI服務(wù)器、AI芯片、光通信等行業(yè)發(fā)展,推動(dòng)云廠商基礎(chǔ)設(shè)施建設(shè);在B端,sora能夠快速生成高質(zhì)量視頻內(nèi)容,大幅提高內(nèi)容制作效率,影視、廣告營銷、游戲、IP等內(nèi)容行業(yè)都有可能受益。”對(duì)于一些復(fù)雜精細(xì)化不高、個(gè)性化要求不強(qiáng)、內(nèi)容大于畫面的領(lǐng)域,sora模型生成的AI視頻拿來就可以使用。
新技術(shù)的發(fā)展往往會(huì)迎來行業(yè)的新機(jī)遇,同時(shí)也會(huì)帶來行業(yè)的新變革。隨著Sora及其他一些大模型的逐步開放和商用,一些文化產(chǎn)業(yè)中部分重復(fù)性的、缺少技術(shù)含量的勞動(dòng)有較大可能會(huì)被取代,但同時(shí)也會(huì)打破一些固有的生產(chǎn)方式。
1.傳統(tǒng)娛樂影視領(lǐng)域
由于sora能夠分鐘生成媲美“大片”的視覺質(zhì)量,可能會(huì)給電影、電視、動(dòng)畫和短視頻行業(yè)帶來新的變革。未來,AI視頻隨著技術(shù)的不斷成熟,攝影師、剪輯人員、動(dòng)畫師等職業(yè)會(huì)不會(huì)顯得不那么重要?演員會(huì)不會(huì)也隨著技術(shù)和行業(yè)的發(fā)展而變得可有可無?
但另一方面,Sora技術(shù)可以生成逼真且富有想象力的視頻內(nèi)容,為傳統(tǒng)娛樂影視領(lǐng)域帶來全新的創(chuàng)意和表現(xiàn)方式。通過Sora技術(shù),制作人員可以更加自由地探索不同的視覺效果和敘事方式,打破傳統(tǒng)影視制作的限制,為觀眾帶來更加震撼和獨(dú)特的視覺體驗(yàn)。
2.教育學(xué)習(xí)領(lǐng)域
AI發(fā)展已經(jīng)成為潮流,大學(xué)也會(huì)增設(shè)關(guān)于AI人工智能相關(guān)的專業(yè),而原本的視頻、動(dòng)畫等以前熱門專業(yè)也將會(huì)變成冷門專業(yè)。
可以說,人工智能的任何進(jìn)步,幾乎都會(huì)與高等教育產(chǎn)生千絲萬縷的聯(lián)系,有些甚至可能直接改變高等教育的現(xiàn)有形態(tài)。一方面,老師可以利用Sora模型,將文字教材轉(zhuǎn)化為生動(dòng)的視頻教程,提高學(xué)生的興趣活躍度;另一方面,Sore技術(shù)可以構(gòu)建虛擬課堂和實(shí)驗(yàn)室,學(xué)生可以通過虛擬環(huán)境進(jìn)行實(shí)驗(yàn)操作、觀察模擬實(shí)驗(yàn)過程,并與教師進(jìn)行實(shí)時(shí)互動(dòng),打破地域和時(shí)間的限制,提高教育的靈活性和可及性。
3.廣告營銷領(lǐng)域
在sora發(fā)布的視頻中,把時(shí)間點(diǎn)剛好卡在了一般廣告時(shí)長之間,大幅度降低視頻的制作成本,這可能會(huì)使得廣告的投放成本也相應(yīng)降低,從而為廣告商提供更多的預(yù)算空間來進(jìn)行更廣泛的廣告投放。這使得品牌方對(duì)廣告商提出了更高的要求。
另一方面,Sora的即時(shí)生成能力使得廣告制作可以在短時(shí)間內(nèi)完成,這對(duì)于需要快速響應(yīng)市場(chǎng)變化的廣告營銷來說,具有極大的優(yōu)勢(shì),對(duì)于突發(fā)事件或熱門話題,廣告商可以迅速制作相關(guān)的廣告內(nèi)容,以抓住市場(chǎng)機(jī)遇。
4.新聞社交領(lǐng)域
新聞具有時(shí)效性,在未來,熱點(diǎn)事件可以利用sora直接生成現(xiàn)場(chǎng)虛擬記者進(jìn)行報(bào)道或者利用sora還原新聞現(xiàn)場(chǎng)畫面,保障了時(shí)效性,同時(shí)也保證了一定的流量。在未來,AI將成新聞工作者職業(yè)發(fā)展的必修課。
另一方面,傳統(tǒng)新聞信息獲取方式多為文字解說,由于sora技術(shù)的普及和應(yīng)用,可能使得用戶更傾向于通過視頻形式獲取新聞信息,視頻直觀、生動(dòng)的特點(diǎn)可以更加生動(dòng)地展示新聞事件和現(xiàn)場(chǎng)情況,增加新聞信息獲取方式的多樣性。
技術(shù)在發(fā)展,行業(yè)在變革。那么,面對(duì)變革浪潮,企業(yè)該如何應(yīng)對(duì)?
sora給企業(yè)數(shù)字化轉(zhuǎn)型帶來的思考:
數(shù)字化+AI
sora作為一個(gè)由OpenAI研發(fā)的先進(jìn)人工智能模型,對(duì)企業(yè)數(shù)字化轉(zhuǎn)型具有重大意義。sora的能力不僅限于制作視頻,而是代表了人工智能在理解和模擬現(xiàn)實(shí)世界方面的巨大進(jìn)步。在AI技術(shù)高速發(fā)展的今天,企業(yè)必須以正確的認(rèn)知來面對(duì)與引進(jìn)先進(jìn)技術(shù),以先進(jìn)技術(shù)帶動(dòng)企業(yè)發(fā)展。
1.內(nèi)容創(chuàng)作和自動(dòng)化。sora能夠創(chuàng)造包含復(fù)雜場(chǎng)景和角色的60秒視頻,這意味著企業(yè)可以利用AI自動(dòng)化生產(chǎn)內(nèi)容,快速創(chuàng)建營銷視頻、產(chǎn)品演示、客戶案例研究等,從而提升品牌形象和產(chǎn)品影響力。極大提高效率并降低成本。
2.通過數(shù)據(jù)分析提升客戶個(gè)性化體驗(yàn)。sora展示了人工智能在處理和生成復(fù)雜數(shù)據(jù)方面的能力,企業(yè)可以結(jié)合AI的視頻分析工具,對(duì)用戶觀看視頻的行為進(jìn)行分析,并根據(jù)客戶的行為數(shù)據(jù)和偏好,定制個(gè)性化的視頻內(nèi)容,提升客戶體驗(yàn),增強(qiáng)溝通效果。
3.創(chuàng)新驅(qū)動(dòng)業(yè)務(wù)發(fā)展。sora的出現(xiàn)激發(fā)了企業(yè)在創(chuàng)意領(lǐng)域的探索,如電影制作、游戲開發(fā)等領(lǐng)域,企業(yè)可以嘗試新的創(chuàng)意項(xiàng)目,開辟新的業(yè)務(wù)領(lǐng)域。
被吹爆的sora
為什么沒有被企業(yè)馬上投入使用?
《麻省理工科技評(píng)論(MIT Technology Review)》主筆Will Douglas Heaven寫道:“Sora發(fā)布出來的視頻已經(jīng)是從大量的成果中挑選出的佼佼者了。”雖然Sora展現(xiàn)出了強(qiáng)大的能力,但現(xiàn)階段它還不夠完美。
1.研發(fā)成本高:企業(yè)原有研發(fā)模型與sora 模型融合打造新模型,需要花費(fèi)大量的人財(cái)物成本,且還需要一大筆費(fèi)用來維護(hù)模型穩(wěn)定。
2.缺乏相應(yīng)技術(shù)人員:sora技術(shù)涉及復(fù)雜的機(jī)器學(xué)習(xí)和人工智能算法,精通AI和機(jī)器學(xué)習(xí)領(lǐng)域的專家相對(duì)稀缺,企業(yè)可能難以招聘到足夠的專業(yè)人才來開發(fā)和維護(hù)sora技術(shù)。
3.涉及公司隱私安全:企業(yè)在使用sora處理視頻內(nèi)容時(shí),要注意避免主要信息泄露。一些攻擊者可以通過分析AI模型輸出的結(jié)果,推斷出模型的內(nèi)部結(jié)構(gòu)和參數(shù),從而破解模型,生成逼真的假數(shù)據(jù)。同時(shí)還要注意視頻內(nèi)容的版權(quán)問題。
4.sora技術(shù)的不穩(wěn)定性:目前sora 模型開發(fā)只在于初始階段,從sora生成的一些視頻中,會(huì)出現(xiàn)一些不符合常規(guī)的畫面。比如,隨著時(shí)間推移,有的人物、動(dòng)物或物品會(huì)消失、變形或者生出分身;或者出現(xiàn)一些違背物理常識(shí)的鬧鬼畫面,像穿過籃筐的籃球、懸浮移動(dòng)的椅子。
小結(jié)
善用工具,一直以來都是人類的天性。包括sora在內(nèi)的視頻生成AI只是一個(gè)工具,視頻的創(chuàng)意來源還是需要人類提供。在數(shù)字化+AI時(shí)代里,企業(yè)需要積極擁抱變革,抓住機(jī)遇,應(yīng)對(duì)挑戰(zhàn),不斷創(chuàng)新和發(fā)展,以適應(yīng)未來的需求和變化。