陳湘瑾 / 報導
2024/ 06/ 08 12:24

又一陸版「Sora」!影像生成模型「可靈」開放邀測體驗

大陸近期紛紛推出自行研發的影像生成模型,繼北京生數科技4月發表「Vidu」,大陸短影音應用程式「快手」近日也推出影像生成大模型「可靈」,據陸媒報導,目前在快手的剪輯應用程式「快影」開放邀測體驗。

 

據每經網8日報導,可靈為快手AI團隊研發,具備諸多優勢,包括生成大幅度合理運動,模擬物理世界特性,具備強大概念組合能力和想像力,生成的影像分辨率高達1080p,時長高達2分鐘,且支持自由的寬高比。

 

可靈與Open AI今年2月發表的「Sora」採用相似的技術路線,結合多項自研技術創新,效果對標Sora。

 

報導指出,可靈使用的是與Sora一樣的Diffusion Transformer架構,該架構能巧妙融合時間與空間的資訊,對影片數據進行綜合分析和處理,無論是快速移動的物體、劇烈變化的場景,還是複雜的人物動作都能被精確捕捉,使生成的影片內容動態性十足,同時具有很高的物理世界真實感。

 

此前,大陸清華大學聯合北京生數科技有限公司4月發布文字描述生成影片的人工智慧模型「Vidu」,同樣以Sora為競爭標竿,目前Vidu能夠一鍵生成長達16秒、畫質1080P的高清影片內容。

陝西暴雨山洪沖垮高速公路橋樑 已11死仍有20輛車失聯影/疫情後最大大陸團抵金 官員行程曝光低調不受訪四川火災釀16死、30傷 大樓內部呈立體燃燒狀態中共三中全會今閉幕 邱垂正:研判將宣示「左傾政策」四川一百貨公司施工不慎引發大火 造成16人死亡
討論區