【媒体界】9月12日消息,微软近日宣布与“免费数字图书馆计划”Project Gutenberg 达成合作,通过人工智能技术为电子书库制作了一系列全新的有声书资源。这项合作充分利用了机器学习、自动文本选择和自然语音合成等多项AI技术,旨在为用户提供更加生动、丰富的阅读体验。
据媒体界了解,在这一引人注目的项目中,研究人员首先开发了一种算法,能够智能分析电子书的结构,自动区分正文和非关键内容,如页码、表格等,从而实现了电子书到有声书的自动转化。而后,借助WaveNet、Tacotron和FastSpeech等文本转语音技术,他们成功生成了质量高、自然流畅的朗读语音。更为惊人的是,这个团队还让系统能够识别书中的叙述者、对话和不同角色,从而调整语音,栩栩如生地呈现出故事情节的语音表达。
微软表示,该计划已经积累了超过35000小时的有声书语音数据,涵盖了各种经典文学、戏剧、传记等作品。这些宝贵的语音资源将以开源方式免费提供,进一步丰富了网络上的有声书内容。同时,用户还有机会使用自己的声音录制少量部分,实现“用自己的声音朗读整本书”的效果,为有声书领域增添了更多创意。这一举措也将为视障人士提供更加便捷的阅读方式,让阅读不再受限于文字。