Sora火爆的當下,國內大模型企業如何追趕Sora,難點在哪兒?2月23日晚,360集團創始人周鴻祎獨家回應了新京報貝殼財經記者的這一問題。他認為,Sora的技術路線如果被開源,國內將能很快趕上,但在追趕Sora時,算力有可能成為門檻,對此,集中國內所有AI企業的算力或許是方法之一。
周鴻祎接受記者采訪。 新京報貝殼財經記者羅亦丹/攝
文生視頻技術路線方向已被Sora確定 但工程化思路需要探索
Sora發布后,周鴻祎曾一連發了十多條視頻談論這一文生視頻大模型,他認為Sora對物理世界的很多描述符合常識,符合人類對世界的認識,因此不能把Sora僅看作一個文生視頻的工具,而要看到背后人工智能的發展。
對于Sora采用的技術,周鴻祎稱目前Pika、Runway等文生視頻公司可能只是使用了文生圖模型的相關技術,但Sora將文生圖模型技術與文生文模型技術結合了起來,因此才能達到令人驚嘆的效果。
周鴻祎對貝殼財經記者表示,Sora所代表的技術路線出爐后,國外也有兩條路線的斗爭,一條是OpenAI的閉源,另一條是以Meta為代表的開源,“開源路線的目標就要打破閉源,他們會不斷去猜測閉源是怎么做的,最后再開源出來。開源出來的好處是,很多小公司和大公司的個人成員會積極地在開源項目中借鑒他人成果,同時再貢獻自己的成果,其化學作用會非常明顯?!?/p>
在他看來,一旦Sora的技術被開源出來,國內就能很快跟上。一個可供參考的事實是,一年前的今天ChatGPT沖擊科技圈,而國內企業僅用了不到一年的時間就達到了GPT3.5的技術水平。
周鴻祎告訴貝殼財經記者,他近幾日跟很多AI專家有過交流,發現目前許多技術里用到的模型和算法都是公開的,他認為OpenAI最大的能力一個是找方向,另一個就是工程化思路非常嚴謹。因此,現在需要把工程化的思路探索出來,“此前大家學習ChatGPT的過程中,同樣也是在方向已確定的情況下,解決‘具體一個坎怎么過’、‘碰到一個山怎么翻’,踩很多坑,驗證許多具體的方法,這需要時間?!?/p>
Sora可能會生成更長視頻 追趕Sora國內應集中算力
周鴻祎同時認為,在追趕Sora方面,算力可能也是一個坎。
此前,有專家分析稱,Sora的參數規模不大,約為30億。對此周鴻祎持反對態度,“這就弄錯了一個概念,視頻的參數和文本的參數是不能簡單做對比的,文本有10萬字,視頻只有640×480,但是它兩個所占的存儲量完全不在一個數量級上。所以Sora可能不僅有30億參數,第二就算只有30億參數,他視頻分析對算力的消耗應該是遠遠超過千億模型的。所以,當現在國內顯卡都被卡脖子之后,算力就可能會是一個問題?!?/p>
“Sora為什么只能做1分鐘視頻,我猜測因為它和4秒6秒有本質的差別,4秒和6秒是因為全部用像素來生成,沒有這個世界的知識。4、6秒之后這個圖怎么樣?你就想不出來了。”周鴻祎猜測,Sora能生成一分鐘的視頻,就意味著也能生成10分鐘、60分鐘的視頻,但是為什么不做呢?是由于算力和成本的限制。
同樣,算力問題也出現在中國的AI行業中。對此,周鴻祎表示,他正在思考是否要提出如下建議,“目前,Meta已經有50萬塊GPU,明年可能會買百萬塊,微軟應該也會按照百萬級別去下訂單。而國內的所有人工智能公司加在一起可能有50萬塊GPU,但都分散在各個公司里?!?/p>
在他看來,是否能夠把國內的GPU算力都集中起來,“我之所以最近一直在科普,是因為Sora不僅僅是一個文生視頻的工具,如果是的話我們落后就落后了,無非是廣告落后一點、電影拍得慢一點,這些落后除了可能對娛樂業造成影響外,不會影響大國競爭,但實際上Sora預示著AGI(通用人工智能)的一個關鍵節點,所以我認為這對國家很重要。”
記者聯系郵箱:luoyidan@xjbnews.com
新京報貝殼財經記者 羅亦丹
編輯 徐超
校對 張彥君