很多科技界的老饕都還記得,2021年4月舉辦的NVIDIA的GTC線上峰會,英偉達(NVIDIA)創始人兼CEO黃仁勛變身主廚,將發布場地挪到了自家廚房。超過一個多小時的發布會中,其中有14秒的畫面中,老黃的廚房、標志性的皮衣,甚至他的表情、動作、頭發……全都是合成出來的數字人和背景。當時業界一片嘩然,大呼被老黃“騙了三個月居然沒發現!”
但隨著AIGC技術的快速發展,到今天,無論多么真實的數字人表演,14秒的時長都已經不夠滿足觀眾們的胃口了。那么各位觀眾和老司機,一小時三十分鐘的長度,恰似一部電影的長度的真人數字人表演夠不夠?老黃的廚房注定要被囿于晝夜與愛,那么星際科幻大片和防暑降溫小貼士一起出現夠不夠?
7月27日14點,中國北京,天氣溫度適中,沒有炎日,適合出門。東三環邊上的康萊德酒店,“新視界·新壹視頻大模型發布會”的藍色系主視覺,科技感十足。在接下來不到兩個小時的時間里,這里,將會發生改變視頻創作的里程碑事件。
觀眾還沒進到會議內場,就被場外兩塊屏幕吸引難以移步。數字人的對話、互動并不鮮見,但與3D數字人對話的流暢程度、語音語義的理解程度,能否解決復雜多變的實際應用場景的問題能力,甚至數字人的形象設計,都是給觀眾留下深刻印象的關鍵因素之一。
以往科技圈開發布會,都是以“自嗨”的形式來推進的。但這次卻一反常態,還在暖場時段,李冰冰、黃曉明、賈乃亮、王祖藍、龔俊、楊超越等20多位當紅演藝圈明星都發來祝福和關注的視頻,祝福的話各有不同,但他們都共同提到了“新壹視頻大模型”,到底是何方神圣?
會議開始,更出人意料的場面出現了。沒有美女帥哥主持人身著華麗的禮服出場,也沒有幽默風趣的主持人給現場助興,但每個觀眾的臉上從發布會開始的第一秒鐘開始就都充滿著不可思議的表情——全世界第一場由真人數字人作為全程主持人的發布會就此誕生了。
新壹科技創始人、董事長韓坤和他上百位從四面八方趕來的朋友們,以及幾百位慕名而來的媒體和用戶齊坐在臺下,“大家好,我是你們的老朋友韓坤,我正以數字人的身份出席這場發布會,并擔任主持人。雖然我是個冰冷的數字人,但我還是能夠體會到比這個夏天北京天氣更熱烈的現場氣氛。”全場掌聲雷動。
從主持人的專業性要求來說,這個開場白有些平淡,但了解韓坤和他的團隊在過去幾年經歷的人都明白,這一刻的平淡下面,是何等的激潮澎湃。據內部員工透露,看到韓坤數字人主持人開口說話的一刻,“以為就是給他本人真人錄的視頻而已。”
為了穩妥,擔心受到網絡、硬件、以及其他不可控因素的影響,技術團隊曾建議在發布會現場和其他公司一樣,展示一些demo和視頻文件即可,“很多大廠都這樣”,大家如是說。但韓坤大手一揮,當場拒絕,“要做就來真的!”。
臺下的韓坤真人本人面色平靜,神態自如,但目光如炬,此刻他仿佛站在視頻+AI的時間坐標軸上,回顧從前是成就和輝煌,抬頭遠眺是光榮和夢想。
在由韓坤的數字人主持人介紹引導之后,終于輪到他本人登臺演講了。他和他的團隊,在過去將近20年的時間里深耕視頻行業引領視頻行業趨勢,20年的團隊技術積累終于把創造力賦予了機器,20年來親眼見證從PGC、UGC到AIGC視頻生產力變革,韓坤用他特有的平穩的語調娓娓道來,并沒有太多情緒上的波動,仿佛一切就是順其自然而已。
截至7月底,2023年中國已經發布過100多個大模型,仿佛不發大模型,就沒資格上牌桌一樣。這種情況下,韓坤直接把目光落在了面向垂直場景、解決垂直需求的垂直大模型上面。
韓坤邀請了好幾位好朋友一起登臺發布新壹視頻大模型,這是中國第一個聚焦在視頻領域的大模型,是以視頻生成為核心的多模態AIGC模型。“新壹視頻大模型它不僅僅是一個工具,更是一個理解你、理解視頻、理解美學的藝術家。”韓坤表情平靜,淡淡地微笑,平靜地介紹。
隨后能讓韓坤真正激動的時刻終于到了。從事了將近20年視頻行業的工作,韓坤還沒有過當導演的行動,但這次,出于對《流浪地球》的喜愛以及對新壹視頻大模型的信心,韓坤當場宣布要拍一部《流浪星球3》。不用擼袖子,他直接就對著全場觀眾演示起如何通過新壹視頻大模型來創作一部科幻大片的。
韓坤對著新壹秒創平臺對話框輸入了幾個關于人類駕駛地球、駛離太陽系并遇到危險的關鍵詞,新壹視頻大模型的AI幫寫功能立刻就生成了一段腳本,速度和內容都讓連臺下坐著的一位編劇嘆為觀止。
韓坤介紹,腳本會在新壹視頻大模型里面進行一個圖片的訓練,然后大模型會完成腳本生成成分鏡頭的圖片。隨后韓坤表示想要一段有交響樂感覺的配樂,很快AI也替他完成了,韓坤很滿意。隨后就是見證奇跡的時刻了。
短短不到5分鐘,一部將近一分鐘時長的宇宙科幻大片《流浪星球3》的預告片就完整地呈現了在現場觀眾面前。
全場觀眾掌聲雷動,全新創作的短片,人物表情自然,動作流暢,場景變化也非常壯觀,完全是為真正的《流浪地球3》做了一次預演。要知道,放在傳統的電影工業來說,編劇、導演、演員、特效制作、燈光、美術、拍攝、剪輯、配音、配樂……普通人的科幻夢是遙不可及的。
韓坤表示,新壹視頻大模型實現了從腳本生成,到AI作圖、AI視頻、AI音樂,再到智能剪輯配音的AI全流程視頻創作。讓每個人都能實現高質量、高效率、低成本、無門檻的視頻創作。
除了創作《流浪星球3》這樣的科幻大片,通過新壹視頻大模型的秒創平臺,也可以創作像夏日防暑這樣的適合在朋友圈去分享的這種視頻小貼士。隨后新壹科技CEO雷濤在現場直接演示起了如何在短短不到5分鐘的時間里,從一段簡單的文字描述生成一段夏日防暑避暑小秒鐘的視頻制作。
其AI幫寫功能可以快速地把作者想法變成文章(腳本),隨后秒創就開始用把這些文案分成若干個片段,每個片段則匹配一個視頻,隨后就到了一個視頻的草稿。隨后,可以根據創作者個人喜好,分別可以加入數字人播報,對片段素材進行AI作畫的優化、或者對片段素材進行AI制作視頻,以及還可以調背景音樂、配音等等,如此之后,就可以生成一段完整的視頻了。
類似這樣的視頻如果去剪輯可能要花上幾個小時的時間,但是現在通過秒創幾分鐘就可以完成,為了達到這個效果,秒創除了提供圖片、視頻、聲音、數字人生成等AIGC的功能以外,還提供了一個千萬級結構化視頻庫為用戶提供匹配服務。
對于頭部大廠還在發布會現場放錄制視頻或者Demo,新壹科技的發布會則凸顯一個真實實時演示。使用基于新壹視頻大模型的秒創平臺可以極大地提高視頻創作者的工作效率,降低創作的門檻,這也使創作者從繁瑣的體力勞動中解放出來,從事真正有創造力的工作。
而在前文提到的英偉達黃仁勛的廚房發布會上僅僅展示的14秒特效,則是由幾十個工程師經歷3個多月才完成的。要造“假的老黃”,得到攝影棚里拍上幾千張各種角度的照片,通過一套3D掃描把他臉上的每道褶子都采集成數據。
而韓坤介紹,通過多模態的合成,新壹科技可以將真人錄制的視頻和音頻素材,快速生成2D寫實數字人,基于新壹視頻大模型可以在24小時之內完成一個數字人的訓練。
此外,新壹數字人平臺也可以選擇各種風格的3D形象,3D數字人更適合去制作直播、實時交互場景。3D數字人設計自由度更高,同時它支持豐富的表情動作,而且通過算法可以去驅動它的根據上下文語境去調整表情和動作,讓交流更加生動有趣。雷濤現場演示了推薦最近上映的電影,以及北京秋天的穿衣建議,讓在場觀眾近距離、生動地體會到數字人帶來的全新互動體驗。
而從14秒到一分鐘,再到數字人主持人主持一場長達一個半小時的發布會,體現了AIGC技術的大爆發,也體現了韓坤和他的新壹科技團隊深厚的AI技術積累和對視頻業務的精深掌握。
數字人并不是僅僅是一個娛樂工具,或者一個簡單的對話體驗,未來幾年所有活躍在互聯網上的人都會擁有自己的數字分身,每個人都可以打造一個自己的虛擬IP。隨著元宇宙在產品技術端的突破和需求端的釋放,數字人將正式迎來爆發式增長。
正是基于對數字人產業的極大信心,新壹科技還在發布會現場推出了一款明星數字人產品——秒祝。秒祝通過對于明星視頻進行訓練,將明星的形象和聲音完美還原出來,生成對應的明星數字人形象,最終呈現給用戶的是以明星數字人為主角的個性化定制的祝福視頻。
海外市場,2017年創辦的Cameo在2020年已吸引了超過4萬“名人”入駐,平臺年交易額超過1億美元,年增長率超過450%。基于近20年視頻行業資源的積累,新壹科技和國內大部分明星都有合作和信任基礎,在發布會開場之前的暖場視頻中,就有李冰冰、黃曉明等20多位明星發來了祝福視頻。有了這樣的資源基礎,新壹科技在秒祝產品上取得進展和突破,只是時間問題。
秒祝通過幫助明星和粉絲建立聯系,從而構建了新型的明星與粉絲的關系,通過秒祝平臺粉絲只要支付少量的費用就可以購買明星個性化的祝福視頻。
而對于企業用戶來講,數字人祝福或者是數字人代言這樣的成本比請明星真人便宜的多,它的交付也要便捷和穩定得多。明星數字人產品的應用場景也將延伸到會議、活動、廣告銷售等等,能夠為明星和企業創造更大的價值。
看起來極為簡單的操作,其背后卻是韓坤和他的新壹科技團隊多年苦練內功厚積薄發的小片段。事實上,他們在人工智能領域的探索最早可追溯到2018年以前,彼時他們通過一下科技的自有內容平臺,積累了海量的音視頻數據和視頻業務經驗。
2020年底,韓坤和他的團隊就將研發重心轉向AIGC視頻生成領域,定位也從專注移動視頻應用的公司,轉向以視頻為核心應用場景的人工智能公司。
了解韓坤和他的團隊的人都知道,新壹是在一下科技的基礎上新建的,這樣決定了新壹科技絕非是一匹黑馬突然出現在世人面前,而是以一家在視頻領域有深厚積累的頭部企業的身份重新回到公眾視野中來。
從韓坤創辦的酷六網成為第一家在納斯達克上市的視頻網站,到一下科技時期秒拍開創互聯網產品一周連續三次登陸《新聞聯播》的紀錄,再到秒拍和一直播同時拿下短視頻和直播全網用戶滲透率第一名,以及曾經成為國內最大的視頻生產平臺、牢牢占據免費應用下載排行榜的榜首10多天的小咖秀,韓坤和他的團隊本身就是一段將近20年來不斷創造視頻行業奇跡、一直引領視頻行業趨勢的傳奇。
盡管一下科技曾遭遇挫折,但韓坤和他的團隊沒有消沉,反而義無反顧投入到AIGC視頻的業務中來。四年來的臥薪嘗膽,沉默礪劍,如今光寒十四州。韓坤對此如是說:
“這是我們新的開始,我們把釋放AIGC視頻生產力作為公司新的定位,這也是公司要達成的首要目標。我們的團隊起了新壹這個名字,是因為我們決定是從零到一去新建,之所以這樣決定不是因為它容易,而是這樣做最難。我們的決心和信心源自這次新建不是在零的基礎上新建,而是在過去無數次一下一下敲擊鍵盤積累代碼、一點一點積累技術、一幀一幀完善視頻產品、一秒一秒與時間賽跑的基礎上新建。零是我們對于過去取得輝煌的態度,壹是我們對于未來不勝不歸的決心。”
隨著對于釋放AIGC視頻生產力目標的確立,韓坤認為,新壹團隊已經成為一支有新的思想、更加有戰斗力的團隊。他明確指出:“AIGC會徹底改變我們的未來,未來,誰用AI多誰厲害,這次我相信我們將再次引領時代趨勢,繼續引領產業進步和發展,我們的新征程、新團隊、新開始,一定會成功。”
如前文所述,這次新壹科技的新發布,乃是厚積薄發。根據當場披露的研發規劃路線圖,新壹科技清晰構建了一個生態,即基于新壹視頻大模型的推出以秒祝和數字人為代表的AIGC平臺,在多個不同的垂直場景里面提供產品和服務,覆蓋B端和C端用戶。接下來公司還將發布一個面向政務的垂直模型平臺。
今天的視頻產業將通過AIGC實現飛躍,目前互聯網80%的流量都是視頻流量,但只有20%的內容實現了視頻化,剩下80%的內容的視頻化將由AIGC完成,新壹視頻大模型出現是正當其時。
中央電視臺導演、國家一級編劇夏蒙在現場感慨地表示,“之前拍攝一部紀錄片,從拍攝到制作,周期要超過半年。在AI科技面前,我覺得我們的努力有時候不堪一擊。我唯一相信的是美是不會改變的,無論我們科技怎么發達,它都需要記錄者。但AI的興起一定會顛覆現有的影視的格局,無論如何我們阻擋不了AI前進的腳步。”
AI前進的腳步就是由新壹科技這樣的企業一步一步走出來的,讓我們拭目以待,新壹科技,新的開始,壹定成功。