AI正在加速行業(yè)變革。OpenAI其正探索視頻數(shù)據(jù)生成模型的大規(guī)模訓(xùn)練。
AI企業(yè)OpenAI今日正式發(fā)布視頻生成模型sora,Sora是視覺(jué)數(shù)據(jù)的通用模型,它可以生成不同時(shí)長(zhǎng)、長(zhǎng)寬比和分辨率的視頻和圖像,最多可達(dá)一分鐘的高清視頻。
具體來(lái)說(shuō),Sora在可變持續(xù)時(shí)間、分辨率和寬高比的視頻和圖像上聯(lián)合訓(xùn)練文本條件擴(kuò)散模型。Sora利用對(duì)視頻和圖像潛在代碼的時(shí)空補(bǔ)丁進(jìn)行操作的變壓器架構(gòu)。
Sora能夠生成具有多個(gè)角色、特定類型的運(yùn)動(dòng)以及主體和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場(chǎng)景。該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式。
該模型對(duì)語(yǔ)言有深入的理解,使其能夠準(zhǔn)確地解釋提示并生成引人注目的字符來(lái)表達(dá)充滿活力的情感。Sora還可以在單個(gè)生成的視頻中創(chuàng)建多個(gè)鏡頭,準(zhǔn)確地保留角色和視覺(jué)風(fēng)格。
OpenAI的結(jié)果表明,擴(kuò)展視頻生成模型是構(gòu)建物理世界通用模擬器的一條有前途的途徑。
比如,一位時(shí)尚女性走在充滿溫暖霓虹燈和動(dòng)畫(huà)城市標(biāo)牌的東京街道上。
她穿著黑色皮夾克、紅色長(zhǎng)裙和黑色靴子,拎著黑色錢包。她戴著太陽(yáng)鏡,涂著紅色口紅。她走路自信而隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來(lái)走去。
Sora展示的海龜也是栩栩如生。
比如,幾只巨大的毛茸茸的猛犸象正踏著白雪皚皚的草地走近,它們長(zhǎng)長(zhǎng)的毛茸茸的皮毛在風(fēng)中輕輕飄動(dòng),遠(yuǎn)處覆蓋著積雪的樹(shù)木和雄偉的雪山,午后的陽(yáng)光下有縷縷云彩,太陽(yáng)高掛在天空中?!?/span>
距離產(chǎn)生了溫暖的光芒,低攝像頭視角令人驚嘆地捕捉到了大型毛茸茸的哺乳動(dòng)物,具有美麗的攝影和景深?!?/span>
比如,動(dòng)畫(huà)場(chǎng)景的特寫(xiě)鏡頭是一個(gè)毛茸茸的小怪物跪在一根融化的紅色蠟燭旁邊。藝術(shù)風(fēng)格是3D和現(xiàn)實(shí)的,重點(diǎn)是燈光和紋理。這幅畫(huà)的基調(diào)是驚奇和好奇,怪物睜大眼睛、張開(kāi)嘴巴凝視著火焰。它的姿勢(shì)和表情傳達(dá)出一種天真和俏皮的感覺(jué),就好像它第一次探索周圍的世界一樣。暖色調(diào)和戲劇性燈光的使用進(jìn)一步增強(qiáng)了圖像的舒適氛圍。
OpenAI CEO Sam Altman已經(jīng)在線接單,稱今天開(kāi)始為有限數(shù)量的創(chuàng)作者提供訪問(wèn)權(quán)限?!皉emarkable moment.(非凡的時(shí)刻。)”
從目前的效果來(lái)看,這對(duì)廣告行業(yè)、動(dòng)畫(huà)行業(yè)、對(duì)影視行業(yè)可能都會(huì)產(chǎn)生一系列的變革。
資訊來(lái)源:雷遞網(wǎng)