站内搜索 | 手机版

媒体界 - 推动中国媒体行业创新，促进业内人士交流分享！

媒体界 > 科技前沿 > 正文内容

微软创新 XOT 方法：助力语言模型推理实力提升

发布时间：2023-11-15 14:21 来源：媒体界

【媒体界】11月15日消息，微软近日推出了名为“Thought Harmony”(TH)的全新方法，旨在加强人工智能(AI)模型的推理能力。这一创新灵感源自谷歌 DeepMind 的 AlphaZero，采用了紧凑的神经网络结构。

微软与佐治亚理工学院和华东师范大学共同合作研发了这一算法，通过整合强化学习(reinforcement learning)和蒙特卡洛树搜索(MCTS)能力，进一步提升了模型在复杂决策环境中的解决问题效能。

据媒体界了解，微软研究团队表示，Thought Harmony方法可以使语言模型扩展到对其不熟悉的问题上，尤其在Game of 24、8-Puzzle和Pocket Cube等严苛测试中表现出显著提升。研究结果显示，Thought Harmony明显优于其他方法，甚至成功解决了其他方法在某些问题上失败的情况。然而，Thought Harmony并未达到百分之百的可靠性。

Thought Harmony框架主要包括以下关键步骤：

**1. 预训练阶段：** Thought Harmony在特定任务上进行预训练，利用蒙特卡洛树搜索(MCTS)模块学习与有效思维搜索相关的领域知识。轻量级的策略和价值网络指导搜索过程。

**2. 思维搜索：** 在推理过程中，预训练的MCTS模块使用策略/价值网络来有效地探索和生成语言模型(LLM)的思维轨迹。

**3. 思维修正：** LLM审查MCTS的思维过程，识别任何错误。修正的思维是通过额外的MCTS模拟产生的。

**4. LLM推理：** 将修正后的思维提供给LLM，为解决问题提供最终的提示。

这一全新的Thought Harmony方法标志着微软在人工智能领域的不断创新，为AI技术的发展开辟了新的可能性。

更多>同类内容

旗舰手机新趋势？小米、OPPO等四巨头或同推直屏与曲面屏版本

05-13

阿里云发布通义千问2.5，全面赶超GPT-4 Turbo

05-09

苹果iPad家族大调整旨在满足多样化用户需求

05-06

达尔优×cupid65双模机械键盘惊艳亮相优惠价1699元起

05-06

iPhone 16全新细节流出：不锈钢电池外壳与4K影像引领革新

05-06

小米汽车迅速崛起：SU7发布32天量产破万辆

04-29

三星Z Fold6即将登场：外观硬朗色彩丰富性能出众

04-23

达尔优EK87 Pro键盘震撼来袭：三模无线连接引领科技数码新风尚

04-23

小米手环9蓄势待发新款eSIM智能手表也将来袭

04-22

华为新品Pura 70系列发布影像与续航双双升级

04-22

iQOO携手华星光电，iQOO 13系列屏幕技术再升级引领行业新潮流

04-22

华为新旗舰Pura 70系列震撼登场挑战市场霸主地位

04-19

华为智能门锁Plus正式上市：3D深感摄像头带来全新解锁体验

04-19

华为Pura70系列惊艳亮相屏幕影像续航全面升级

04-18

内部测试在即骁龙8 Gen4新机携手小米15蓄势待发

04-17

点击查看更多 +

全站最新

引领未来出行新纪元：揭秘威睿公司电驱系统的非凡魅力

引领未来出行新纪元：揭秘威睿公司电驱系统的非凡魅力

奥运观赛AI新体验！通义APP上线“赛事百事通”等多款新功能

奥运观赛AI新体验！通义APP上线“赛事百事通”等多款新功能

FF提请合股+增发等6项提案贾跃亭建议投赞成票促成战略融资达成

FF提请合股+增发等6项提案贾跃亭建议投赞成票促成战略融资达成

景杰生物酪氨酸磷酸化修饰组学2.0：五大革新技术引领研究新高度

景杰生物酪氨酸磷酸化修饰组学2.0：五大革新技术引领研究新高度

爷爷不泡茶上海旗舰店盛大开业，融合湖北特色，迈向全球2000家新里程！

爷爷不泡茶上海旗舰店盛大开业，融合湖北特色，迈向全球2000家新里程！

五个女博士洞见：新零售浪潮下便利店业态的创新与变革

五个女博士洞见：新零售浪潮下便利店业态的创新与变革

固升医药亮相CPhi China 2024，维生素K1产品受热捧！

固升医药亮相CPhi China 2024，维生素K1产品受热捧！

LALIQUE 法国莱俪粉色风潮席卷设计上海！

LALIQUE 法国莱俪粉色风潮席卷设计上海！

热门内容

本栏最新

旗舰手机新趋势？小米、OPPO等四巨头或同推直屏与曲面屏版本

旗舰手机新趋势？小米、OPPO等四巨头或同推直屏与曲面屏版本

阿里云发布通义千问2.5，全面赶超GPT-4 Turbo

阿里云发布通义千问2.5，全面赶超GPT-4 Turbo

苹果iPad家族大调整旨在满足多样化用户需求

苹果iPad家族大调整旨在满足多样化用户需求

达尔优×cupid65双模机械键盘惊艳亮相优惠价1699元起

达尔优×cupid65双模机械键盘惊艳亮相优惠价1699元起

iPhone 16全新细节流出：不锈钢电池外壳与4K影像引领革新

iPhone 16全新细节流出：不锈钢电池外壳与4K影像引领革新

小米汽车迅速崛起：SU7发布32天量产破万辆

小米汽车迅速崛起：SU7发布32天量产破万辆

三星Z Fold6即将登场：外观硬朗色彩丰富性能出众

三星Z Fold6即将登场：外观硬朗色彩丰富性能出众

达尔优EK87 Pro键盘震撼来袭：三模无线连接引领科技数码新风尚

达尔优EK87 Pro键盘震撼来袭：三模无线连接引领科技数码新风尚

媒体界腾讯QQ:642361(注明:媒体界) 媒体界使命：推动中国媒体行业创新，促进业内人士交流分享！
Copyright © 2016-2023 mws.com.cn All rights reserved. 鲁ICP备11015305号