苹果英伟达合作开源ReDrafter，LLM推理速度飙升2.7倍！

发布时间：2024-12-19 08:07 来源：ITBEAR 作者：赵云飞

苹果公司近期宣布与英伟达携手合作，共同推出了一项名为Recurrent Drafter（简称ReDrafter）的创新技术，这项技术旨在显著提升人工智能大语言模型（LLM）的推理速度。这一消息是在12月18日通过苹果公司的官方博文发布的。

据悉，ReDrafter技术已经成功融入英伟达的TensorRT-LLM推理加速框架中。这一整合使得在英伟达GPU上运行的LLM模型，每秒生成的tokens数量最高可提升2.7倍。这一显著的性能提升，不仅有效减少了用户在使用过程中的延迟感受，还大幅度降低了计算成本。

苹果公司的机器学习专家强调，随着LLM在生产应用程序中的广泛应用，提高推理效率已经成为降低计算成本和减少用户延迟的关键因素。ReDrafter技术的推出，正是对这一需求的积极响应。

ReDrafter的核心在于其独特的RNN草稿模型，该模型结合了波束搜索（beam search）和动态树注意力（dynamic tree attention）技术。这一创新设计使得开源模型在每一步生成过程中最多可以产生3.5个tokens，从而超越了以往推测性解码技术的性能表现。

为了将ReDrafter技术应用于实际生产环境，苹果公司与英伟达展开了深度合作。双方共同努力，将ReDrafter成功集成到英伟达的TensorRT-LLM框架中。这一合作不仅展现了苹果与英伟达在技术创新方面的深厚实力，也体现了双方在推动AI技术发展方面的共同愿景。

为了支持ReDrafter技术的集成，英伟达对其TensorRT-LLM框架进行了多项优化。这包括添加新的运算符以及公开现有运算符，以增强框架对复杂模型和解码方法的适应能力。这些优化措施为ReDrafter技术的顺利应用提供了有力保障。

基准测试结果显示，在使用集成了ReDrafter的TensorRT-LLM框架的英伟达GPU上，数百亿参数规模的生产模型的解码速度得到了显著提升，最高可达2.7倍。这一成果不仅显著降低了用户体验延迟，还减少了GPU的使用数量和功耗，从而进一步降低了运营成本。

这一合作成果的发布，标志着苹果与英伟达在AI技术领域的合作迈出了重要一步。未来，双方将继续携手共进，共同推动AI技术的创新与发展，为更多用户提供更加高效、智能的服务。

更多>同类内容

既要下沉又要升咖，星巴克的胜算到底在哪？

11-24

荣耀MagicOS 9.0公测机型新功能上线，122版本升级亮点多多

11-24

瓦尔基里VK03-M机箱预售，6.2英寸屏+9风扇位，首发仅需299元！

11-24

保时捷合作方与货拉拉纠纷始末：双方已和解，承诺加强管理

11-24

彩虹-4无人机引领新纪元，首获国内大型民用无人机特殊适航证

11-24

荣耀300系列新机配置大揭秘：电池5300mAh，快充达100W，还有无线充电？

11-24

2024年11月23日最新！今日人民币对美元汇率是多少？

11-24

瓦尔基里VK MAG 75系列机械键盘上市，低至149元起，多种配置可选！

11-24

东京VS香港：国际金融中心之争，谁将更胜一筹？

11-24

成立十年，没有爆款，AI是否Rokid AR眼镜的杀手锏？

11-23

新疆“复兴号”动车即将贯通南疆东疆，单程729公里缩短旅时

11-23

小米汽车筹备“精英驾驶”，SU7 Ultra车主12月抢先体验驾校课程

11-23

2024中国消费市场新风向：理性消费与健康追求引领潮流

11-23

罗德口袋无线领夹麦上市，便携续航强，定价995元

11-23

《GTA6》开发正酣，R星承诺将公布更多震撼内容！

11-23

点击查看更多 +

全站最新

荣耀Magic7 RSR保时捷版：100倍AI长焦，手机秒变超级望远镜？

奇瑞风云A8L混动新车发布，十万级家轿市场迎来新选择！

苹果大动作：iPhone 17 Air将超薄，可折叠iPhone与MacBook在路上

OPPO自研“风驰游戏内核”，芯片级技术能否重塑游戏体验？

小米平板7S Pro曝光：14英寸3.2K OLED大屏配万毫安大电池

长虹百寸巨幕电视100Q10T Max上市，XDR Mini LED仅售19997元！

中国及全球清洁电器市场：新趋势、新机遇何在？

既要下沉又要升咖，星巴克的胜算到底在哪？

热门内容

本栏最新

既要下沉又要升咖，星巴克的胜算到底在哪？

荣耀MagicOS 9.0公测机型新功能上线，122版本升级亮点多多

瓦尔基里VK03-M机箱预售，6.2英寸屏+9风扇位，首发仅需299元！

保时捷合作方与货拉拉纠纷始末：双方已和解，承诺加强管理

彩虹-4无人机引领新纪元，首获国内大型民用无人机特殊适航证

荣耀300系列新机配置大揭秘：电池5300mAh，快充达100W，还有无线充电？

2024年11月23日最新！今日人民币对美元汇率是多少？

瓦尔基里VK MAG 75系列机械键盘上市，低至149元起，多种配置可选！