别等OpenAI了，全球首个类Sora抢先开源！所有训练细节/模型权重全公开，成本仅1万美元( 三 ) _Sora

和采用全注意力机制的DiT相比，随着帧数的增加，STDiT实现了高达5倍的加速效果，这在处理长视频序列等现实任务中尤为关键。

文章插图
欢迎持续关注Open-Sora开源项目：https://github.com/hpcaitech/Open-Sora
作者团队提及，他们将会继续维护和优化Open-Sora项目，预计将使用更多的视频训练数据，以生成更高质量、更长时长的视频内容，并支持多分辨率特性，切实推进AI技术在电影、游戏、广告等领域的落地。
参考资料：
[1] https://arxiv.org/abs/2212.09748 Scalable Diffusion Models with Transformers
[2] https://arxiv.org/abs/2310.00426 PixArt-α: Fast Training of Diffusion Transformer for Photorealistic Text-to-Image Synthesis
[3] https://arxiv.org/abs/2311.15127 Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets
[4] https://arxiv.org/abs/2401.03048 Latte: Latent Diffusion Transformer for Video Generation
[5] https://huggingface.co/stabilityai/sd-vae-ft-mse-original
[6] https://github.com/google-research/text-to-text-transfer-transformer
[7] https://github.com/haotian-liu/LLaVA
[8] https://hpc-ai.com/blog/open-sora-v1.0

【别等OpenAI了，全球首个类Sora抢先开源！所有训练细节/模型权重全公开，成本仅1万美元】

别等OpenAI了，全球首个类Sora抢先开源！所有训练细节/模型权重全公开，成本仅1万美元( 三 )

推荐阅读

手机能放在冰箱里吗会坏吗手机能放在冰箱里吗

泰国@泰国“狼人女孩”找到真命天子！将面部清理干净后，原来这么美

活力百分百|出门穿这“蕾丝”打底衫，看着就年轻15岁，40岁老婆真会打扮

物件|这个厂曾生产出被誉为“皇帝女儿”的物件，可还有揭西街坊记得它的辉煌

沙河股份|深圳板块午后继续走强建科院等5股涨停

她将泅渡一个女诗人的泪湖中：严防死守，重启中美航班？美国再出损招

连云港海事局|连云港海事局：9月28日至30日在黄海南部进行实弹射击

福建电视台综合频道：哈啰单车被弃荒地、随意破坏？执法人员：双方都得处罚

几乎零差评的10大烧脑电影，全程高能反转不断，你看懂几部？

使用 Face-api.js 在 Web 上进行人脸检测

蓝天情感|就不要勉强自己了！，看图猜成语：没有过人的智商

沙滩露营有哪些注意事项？

在西安铁一中国际班就学是一种怎么样的体验

SSD|曝黑鲨5系列已备案：或为首款骁龙898+SSD存储旗舰手机！

喝荷叶茶能减肥吗？荷叶茶的副作用

电脑使用技巧电脑64G内存真的必要吗？运行速度能有大提升？过来人都这么说

电竞|LOL“祖安文化”被点名，严惩乐言和南风只是个开始，以后会更严

川报观察|助农增收犍为举办首届“8.8吃货节”

「GameRes游资网」游戏运营活动效果分析（一）：活动流程

呆萌小跟班|老鹰官推晒球员投篮手势：投手都知道投篮后续动作重要性