AI的下個(gè)進(jìn)化和爆點(diǎn)

劍俠客 2024-10-30 應(yīng)急救援 7 次瀏覽 0個(gè)評(píng)論

　　隨著AI技術(shù)的飛速發(fā)展，視頻生成領(lǐng)域正迎來(lái)前所未有的變革。本文將深入探討AI在視頻生成方面的最新進(jìn)展、未來(lái)趨勢(shì)以及可能帶來(lái)的大眾機(jī)會(huì)。你是否準(zhǔn)備好迎接這個(gè)充滿(mǎn)潛力的新領(lǐng)域？

　　產(chǎn)品視角看技術(shù)一般不看原理就看效果。

　　每天會(huì)我花點(diǎn)時(shí)間觀察AI的最新進(jìn)展。方法是有API的主要方法就是建立測(cè)試集各種測(cè)，視頻這類(lèi)的我主要就看非官方出品的到底做成什么樣了，是不是具有普遍性。

　　看多了上面這些視頻后，我是兩點(diǎn)感想：

　　第一，視頻生成這事真的要到爆的時(shí)候了。

　　第二，GPT5這檻大概率是能過(guò)去的，雖然是不是OpenAI先過(guò)不好說(shuō)。

　　在這個(gè)新機(jī)會(huì)點(diǎn)徹底爆開(kāi)和現(xiàn)在之間其實(shí)是AI的小低潮：為什么說(shuō)AI會(huì)迎來(lái)自己的小低潮？

　　模型方的官方視頻因?yàn)橛欣可妫疃嗫梢钥纯疵珙^，不太能信。

　　所以得換個(gè)視角，如果一般用戶(hù)以一定頻次和量級(jí)持續(xù)往出爆精彩視頻，那就差不多到臨界點(diǎn)了。你看當(dāng)年MJ火起來(lái)之前也是這樣，持續(xù)各種圖片被爆出來(lái)。因?yàn)樯缃痪W(wǎng)絡(luò)上持續(xù)爆視頻這事必須滿(mǎn)足倆條件：

　　第一個(gè)是質(zhì)量得讓人驚訝。超出原有認(rèn)知。

　　第二個(gè)得相對(duì)容易和便宜，很多人都能做了。

　　前一個(gè)是時(shí)機(jī)，后一個(gè)是基礎(chǔ)。缺一個(gè)也不行?，F(xiàn)在那有誰(shuí)沒(méi)事爆圖片的，即使圖片比過(guò)去做的還驚艷，也沒(méi)人看啊。

　　現(xiàn)在看這倆條件基本滿(mǎn)足了，只差一點(diǎn)點(diǎn)。一旦這個(gè)滿(mǎn)足了，就變成AI的下個(gè)大眾型機(jī)會(huì)點(diǎn)。

　　AIGV（Video）這是我杜撰的一個(gè)詞，但確實(shí)應(yīng)該區(qū)分生成文本、圖片和視頻。因?yàn)樗麄冇绊懥考?jí)就不可能一樣。國(guó)內(nèi)的頭部主播收入和過(guò)去博主收入就不在一個(gè)數(shù)量級(jí)上，甚至都不是十倍百倍的差異。假如抖音上市等于多少個(gè)小紅書(shū)和知乎呢？

　　現(xiàn)在這個(gè)視頻生態(tài)面臨洗牌，一波人要上機(jī)關(guān)槍了，另一波人還是大刀長(zhǎng)矛，所以這影響恐怕比過(guò)去文章生成大的多。他會(huì)推進(jìn)視頻平臺(tái)往不可測(cè)的方向發(fā)展。

　　視頻平臺(tái)外的部分我們反倒是能看的清楚一些，甚至發(fā)展路線過(guò)去都操練過(guò)一遍了。

　　先是新版李一舟會(huì)出一波。這時(shí)候的內(nèi)容生成面臨雙重專(zhuān)業(yè)性，一部分是視頻生成的模型，一部分則是視頻本身的某些技巧。

　　也還是會(huì)有套殼的工具，Heygen這種不完全產(chǎn)生視頻的工具都每年2000萬(wàn)美金，這里的新工具應(yīng)該價(jià)值更大。

　　然后大量AI生成的內(nèi)容會(huì)進(jìn)入各個(gè)平臺(tái)。各個(gè)平臺(tái)估計(jì)會(huì)有點(diǎn)糾結(jié)，但最終還是會(huì)像現(xiàn)在這樣，基本還是允許，最多加個(gè)標(biāo)注。

　　再往后會(huì)往縱深發(fā)展，不停留在宣傳片這個(gè)層次，而是向短?。ǘ巫印?dòng)畫(huà)等）發(fā)展。這時(shí)候會(huì)再炸一下，因?yàn)楹蜕弦徊ǖ倪M(jìn)展就重疊了。之前AI碰撞局上，周瑋分享過(guò)他寫(xiě)短篇小說(shuō)的Agent，聽(tīng)過(guò)后你就知道這類(lèi)產(chǎn)品再結(jié)合上視頻生成能力，特別的契合。這類(lèi)產(chǎn)品的價(jià)值空間一下子就會(huì)上來(lái)很多。

　　再之后估計(jì)就是長(zhǎng)劇和直播。其中直播稍微復(fù)雜點(diǎn)，因?yàn)橐徒?jīng)常說(shuō)的動(dòng)捕做結(jié)合，做到特別逼真恐怕還要花點(diǎn)時(shí)間。

　　最后肯定是電影。扔本小說(shuō)，AI改出劇本，AI生成電影，這是什么感覺(jué)？

　　先縱后橫的AI

　　之前文章中提到過(guò)幾次，AI和互聯(lián)網(wǎng)最大的不一樣是先縱后橫，像打深井，現(xiàn)在這里深井又多了一口。

　　文圖是一口井，視頻是一口井，并且更深更大。

　　更有意思的是這是個(gè)大眾機(jī)會(huì)，大廠好像也不能基于這個(gè)做什么壟斷產(chǎn)品。

　　每個(gè)人差不多是平等的，它輔助你的創(chuàng)意實(shí)現(xiàn)，培養(yǎng)一批工具和教工具的人。

　　先縱后橫會(huì)導(dǎo)致這這么一個(gè)狀態(tài)：它不會(huì)一下子炸的那么厲害，比如一下子就出個(gè)微信，但會(huì)持續(xù)炸。

　　這時(shí)候面對(duì)它的基本方法論根本不是高瞻遠(yuǎn)矚，而是要回到現(xiàn)場(chǎng)，需要AI碰撞局這類(lèi)把案例聚集起來(lái)的，讓大家能鮮活感受AI應(yīng)用現(xiàn)場(chǎng)的手段。

　　再簡(jiǎn)單了說(shuō)就是實(shí)事求是，得知道情況是什么，別人干成什么樣了，然后形成自己判斷，自己不理解的就當(dāng)不存在，至少不能用來(lái)做事。

　　這和互聯(lián)網(wǎng)非常不一樣。那個(gè)是一波大浪沖到底過(guò)去就過(guò)去了。

　　我之前發(fā)了這么個(gè)視頻，沒(méi)想到自己讀者群（進(jìn)讀者群大家發(fā)私信吧）里還有幾個(gè)這方面專(zhuān)家，又多聊了幾句我就發(fā)現(xiàn)這是個(gè)成熟產(chǎn)業(yè)。

　　上面的生成視頻技術(shù)一成熟再加上視頻里的這套技術(shù)，有可能催生這種產(chǎn)品：

　　一個(gè)人有一個(gè)自己的分身，這個(gè)分身就是視頻里那種產(chǎn)品，然后生成腳本、生成內(nèi)容、發(fā)布是全自動(dòng)的，你對(duì)著說(shuō)它就能發(fā)布內(nèi)容。剪映什么的就不要了。這市場(chǎng)應(yīng)該還很大，真有愿意干的可以試試。

　　這東西就每人多一個(gè)手機(jī)，但這手機(jī)能自己動(dòng)起來(lái)，生成內(nèi)容發(fā)布內(nèi)容，和直播架子、話(huà)筒什么的其實(shí)差不多，需要的量還很大。有人估計(jì)用去做水軍，但那是做水軍違法，就和有人用手機(jī)打詐騙電話(huà)，但不能說(shuō)是電話(huà)的問(wèn)題類(lèi)似，無(wú)人機(jī)不也用來(lái)扔炸彈么。

　　看著視頻的進(jìn)展，我就比較確定GPT5肯定會(huì)來(lái)。

　　現(xiàn)在GPT5是個(gè)符號(hào)，也說(shuō)不清到底是什么，隱喻就是AI能再進(jìn)展一步。倒不一定是OpenAI的下個(gè)版本，它標(biāo)識(shí)著通用智能是否還能再跳一級(jí)，智能的通用性每跳一級(jí)，其影響和單純生成視頻肯定不一樣。參見(jiàn)：AI與人類(lèi)的中線。

　　為什么說(shuō)GPT5一定會(huì)來(lái)呢？

　　比如說(shuō)理解物理世界有自己世界模型這事，在生成文字和圖片的時(shí)候理不理解物理世界是不關(guān)鍵的。但生成視頻的時(shí)候如果不理解物理世界，細(xì)微的地方是做不好的。

　　解讀為什么可以看論文，但看結(jié)果就是AI對(duì)物理世界的理解在深入，它在形成屬于它自己的世界模型。

　　假如有一天AIGV（Video）能夠生成現(xiàn)實(shí)世界的各種電視劇，也能夠生成各種精彩的奇幻電影，那它的世界模型就必然同時(shí)覆蓋現(xiàn)實(shí)空間和虛擬世界（比如漫威宇宙）。

　　從這個(gè)角度看視頻生成和GPT5差不多是同步的。

　　是不是OpenAI反倒是不好說(shuō)，OpenAI宮斗了一場(chǎng)后看著有點(diǎn)抓瞎，總是很隨性的發(fā)產(chǎn)品，然后Sam Altman不解決公司迫在眉睫的問(wèn)題，沒(méi)事去發(fā)表涉政言論，這怎么看也路子不對(duì)。但這是另外的故事了。

　　想到AI的終極可能會(huì)想到無(wú)處安放的自己，并恐慌，但看過(guò)程其實(shí)它也在創(chuàng)造一個(gè)個(gè)大眾型機(jī)會(huì)。在這個(gè)時(shí)間點(diǎn)，這類(lèi)充滿(mǎn)活性，還給一般人機(jī)會(huì)的領(lǐng)域沒(méi)想的那么多了。還是應(yīng)該多擁抱和碰撞。如果說(shuō)之前階層固化的程度是1，那AI之后的世界里可能是100(在我預(yù)測(cè)的不好的結(jié)局里），所以在不良脈絡(luò)里這可能是最后的機(jī)會(huì)。

　　專(zhuān)欄作家

　　琢磨事，微信公眾號(hào)：琢磨事，人人都是產(chǎn)品經(jīng)理專(zhuān)欄作家。聲智科技副總裁。著有《終極復(fù)制：人工智能將如何推動(dòng)社會(huì)巨變》、《完美軟件開(kāi)發(fā)：方法與邏輯》、《互聯(lián)網(wǎng)+時(shí)代的7個(gè)引爆點(diǎn)》等書(shū)。

　　本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

　　題圖來(lái)自 Unsplash，基于 CC0 協(xié)議

　　該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

轉(zhuǎn)載請(qǐng)注明來(lái)自福建福昇消防服務(wù)集團(tuán)有限公司，本文標(biāo)題：《AI的下個(gè)進(jìn)化和爆點(diǎn)》