3D视窗网
加入收藏 | 设为首页 | RSSrss
3D视窗网
 
您当前的位置:首页 > 消费

微软携手ProjectGutenberg,利用AI语音技术制作5000本

2023-09-12 11:43:41  IT之家   阅读:4796次   阅读量:6335   

,微软近日与“免费数字图书馆计划”Project Gutenberg 合作,利用 AI 为电子书库制作了超过 5000 本免费有声书。

图源Project Gutenberg 网站

据悉,在这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。

IT之家经过查询得知,项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。

微软表示,此次计划已收集整理了超过 35000 小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户也可以用自己录制的少量语音,生成“用自己的声音朗读整本书”的效果,这一项目相对丰富了网站有声书的内容,同时也为视障人士提供了便利。

参考

  • Thousands of free and open audiobooks powered by Microsoft AI

  • 论文 Large Scale Intelligent Microservices

广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
   
推荐资讯
偿二代二期周年下的险企众生相:猛增资、调业务、优投资
偿二代二期周年下的
汇聚千万热爱,一汽丰田千万用户达成
汇聚千万热爱,一汽
税务部门持续开展“便民办税春风行动”去年121条措施全部落地
税务部门持续开展“
《收获日3》Steam页面上线,2023年发售
《收获日3》Ste
最新资讯
热门阅读
  1. 阿维塔CEO:阿维塔12暂时没有四座版,1
  2. 五部门发布元宇宙产业创新发展三年行动计划
  3. LGMAGNIT118英寸MicroLED
  4. 中国市政中南院副总工程师万年红:科研创新助
  5. 威联通AINASTS-AI642上架:8核
  6. 城商行跟进下调存款利率“特色存款”成揽储新
  7. 英伟达RTX4060在Steam显卡统计中
  8. 花旗:美光科技MU.US有望迎来积极催化剂
  9. 8月集合资金信托市场发行、成立有升有降标品
  10. 找准县域发展支撑点
Copyright © 2014- 3d.s-sound.net All Rights Reserved. [ 3D视窗网 ]版权所有
网站地图  备案号:豫ICP备2022007296号  邮箱:boss_11@teag.net