站内搜索 | 手机版

媒体界 - 推动中国媒体行业创新，促进业内人士交流分享！

媒体界 > 资讯速递 > 正文内容

智源发布Emu3：原生多模态世界模型，能否一统图像文本视频？

发布时间：2024-10-22 07:21 来源：ITBEAR 作者：赵云飞

智源研究院近期推出了全新的原生多模态世界模型——Emu3，该模型在文本、图像和视频三种模态数据的理解和生成上展现出卓越能力。其独特之处在于，仅需基于下一个token预测，无需依赖扩散模型或组合方法，便能实现多模态数据的统一处理。

在图像生成任务中，Emu3的表现优于SD-1.5与SDXL模型，获得了人类偏好评测的高度认可。同时，在视觉语言理解任务中，Emu3也展现出了强大的实力，其对于12项基准测试的平均得分超越了LlaVA-1.6。在视频生成任务中，Emu3同样表现出色，VBench基准测试得分高于OpenSora 1.2。

Emu3配备了一个强大的视觉tokenizer，能够将视频和图像转换为离散token，这些token可以与文本tokenizer输出的离散token一同送入模型中。这一特性为Any-to-Any任务提供了更加统一的研究范式。

Emu3的研究结果充分证明了下一个token预测作为多模态模型范式的强大潜力，它不仅能实现超越语言本身的大规模多模态学习，还能在多模态任务中取得先进性能。目前，Emu3已开源关键技术和模型，为相关研究提供了有力支持。

更多>同类内容

早C晚A的年轻人，A不动了

10-22

2024年十大顶级战略技术趋势报告（英文版）

10-22

通过京东APP关闭白条

10-22

哈趣投影Q1预售开启，320CVIA流明一体化云台仅679元！

10-21

古尔曼爆料：苹果iPad 11明年底亮相，8GB内存成亮点

10-21

一加新品发布：SUPERVOOC全能充120W双口套装亮相！

10-21

京东在珠海成立贸易公司含新能源汽车整车销售业务

10-21

科尔尼2024年全球城市排名：国内城市排名上升上海位列第8

10-21

国诚投顾：鸿蒙发布会在即，消费电子值得关注

10-21

中国移动广东公司系统全面恢复，向受影响客户致歉

10-21

漫步者HECATE G3000炫酷上市，270°光透设计仅549元！

10-21

专注农业机械电动化、智能化、无人化，「知申禾行」获数千万级天使轮融资 | 首发

10-21

宠物智能硬件“风口”不再？今年投资事件仅4起，出海产品毛利最高或达70%

10-21

御泥坊的母公司、水羊股份收购美国高奢护肤品牌 RéVive，旗下海外品牌组合增至三个

10-21

一个时代又要结束了？全球最大钻石商利润暴跌45%，天然钻石最终败给了河南

10-21

点击查看更多 +

全站最新

索泰辟谣：印尼工厂未量产RTX 5090，视频实为4070 Ti Super

索泰辟谣：印尼工厂未量产RTX 5090，视频实为4070 Ti Super

高通新旗舰骁龙8 Elite亮相：Oryon CPU加持，GPU性能飙升40%

高通新旗舰骁龙8 Elite亮相：Oryon CPU加持，GPU性能飙升40%

AMD锐龙9000X3D系列处理器来袭，11月7日正式发售！

AMD锐龙9000X3D系列处理器来袭，11月7日正式发售！

骁龙8至尊版引领端侧AI，NPU性能暴涨12倍！

骁龙8至尊版引领端侧AI，NPU性能暴涨12倍！

高通携手腾讯推进端侧AI，7B/3B模型引领新时代！

高通携手腾讯推进端侧AI，7B/3B模型引领新时代！

高通骁龙8至尊版受捧，首批旗舰新机即将亮相！

高通骁龙8至尊版受捧，首批旗舰新机即将亮相！

小米15系列全球首发骁龙8至尊版，性能再升级！

小米15系列全球首发骁龙8至尊版，性能再升级！

苹果新款妙控外设曝光：USB-C端口上位，位置或将调整？

苹果新款妙控外设曝光：USB-C端口上位，位置或将调整？

热门内容

本栏最新

智源发布Emu3：原生多模态世界模型，能否一统图像文本视频？

智源发布Emu3：原生多模态世界模型，能否一统图像文本视频？

早C晚A的年轻人，A不动了

早C晚A的年轻人，A不动了

2024年十大顶级战略技术趋势报告（英文版）

2024年十大顶级战略技术趋势报告（英文版）

通过京东APP关闭白条

通过京东APP关闭白条

哈趣投影Q1预售开启，320CVIA流明一体化云台仅679元！

哈趣投影Q1预售开启，320CVIA流明一体化云台仅679元！

古尔曼爆料：苹果iPad 11明年底亮相，8GB内存成亮点

古尔曼爆料：苹果iPad 11明年底亮相，8GB内存成亮点

一加新品发布：SUPERVOOC全能充120W双口套装亮相！

一加新品发布：SUPERVOOC全能充120W双口套装亮相！

京东在珠海成立贸易公司含新能源汽车整车销售业务

京东在珠海成立贸易公司含新能源汽车整车销售业务

媒体界腾讯QQ:642361(注明:媒体界) 媒体界使命：推动中国媒体行业创新，促进业内人士交流分享！
Copyright © 2016-2023 mws.com.cn All rights reserved. 鲁ICP备11015305号