1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

爱数智慧发布中文普通话真·萌童声TTS开源数据集

 2019-11-26 14:41  来源:互联网  我来投稿 撤稿纠错

  阿里云优惠券 先领券再下单

11月20日,爱数智慧发布中文普通话真·萌童声语音合成(TTS)开源数据集。该数据集由真童声录制,为中文童声语音合成数据集子集,时长为15分钟,文本主要为日常用语。据了解,数据集全集包含2235句话,时长超2小时。这也是该童声第一次用于TTS录制。

随着智能终端市场的扩张,人机交互逐渐成为与智能世界对话的入口。在人机互动过程中,语音合成(TTS)的自然度和表现力是用户最能直观感受到的部分。用户使用智能设备的频率增加,对合成语音的期望值也不断提高。

TTS数据是影响语音合成效果的重要因素。由于TTS数据的采集和标注要求严格,因而成品数据集较少。从采集环节来看,录音需要在专业的录音棚中进行,并严格控制噪声水平,才能最大限度还原发音人声音。录音过程中还需要有专业的录音师和监听人在场,便于及时矫正录音过程中的错误。从标注环节来看,TTS数据标注分为4个层级,包括发音校对、韵律层级、音素边界切分和分词词性。为了充分保留发音人的语义表达和发音习惯,标注准确率要求一般在99%左右。

智能设备使用者“低龄化”趋势明显,从而带动了童声数据的需求。受制于儿童识字水平和配合情况,市面上童声TTS数据库数量较少,且多为成年人模仿。童声TTS语料库呈现出明显的供需不平衡。

本次爱数智慧发布的TTS童声开源数据集采集环境为符合NC-20标准的录音间并根据儿童发音习惯对数据进行转写和全链条标注。考虑到句内停顿和句间停顿对听感的影响,在音素边界切分环节,标注人员除了对声韵母边界进行切分外,还对句中静音段和句首尾进行精准切分。

发音人是影响TTS数据质量的重要因素。该数据集的发音人为4岁小朋友妞妞。2019年初,发音韵律好的妞妞在上百位4-6岁小朋友中脱颖而出。因为发音韵律好能为用户带来更好的听感。

在与爱数智慧工作人员接触中,我们了解到妞妞性格活泼开朗,喜欢看冰雪奇缘和小马宝莉。在录制休息期间,想要看动画片时,就会黏着工作人员撒娇。录制工作已经结束很久,工作人员在提起妞妞时,言语间还是充满着浓浓的不舍与赞赏。这份由衷的赞赏,也让我们对这个真·萌童声充满期待!

为智能世界提供充足的数据生产力是这家公司创立的初衷。我们也期待爱数智慧用更多高质量的数据解锁更多应用场景,服务更广域的客户。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
人工智能
智慧生活

相关文章

  • IoT开发者为王,涂鸦智能硬核“靠边站”

    IoT盛宴:涂鸦向下,产品向上

    标签:
    人工智能
  • IPO观察丨黑芝麻智能递表港交所,车芯行业已迈向量产决战期?

    虽然我国汽车芯片行业还处在发展初期,但已经迸发出无限潜力。一方面,智能汽车的发展不断带动需求增长;另一方面,政策引导下,汽车芯片企业持续抢占高地。对此,在7月5日-7日举办的2023年中国汽车论坛上,中国汽车工业协会副秘书长李邵华就做出表示,“中国将成为未来汽车芯片发展的集聚地”。车规芯片行业近日的

    标签:
    人工智能
  • 倒计时2天丨云天励飞将亮相世界人工智能大会

    2023世界人工智能大会将于7月6日至8日在上海举办。云天励飞将在大会上展示自主设计开发的新一代边缘计算芯片DeepEdge10系列SoC芯片,并公布“天书”大模型的最新动态。欢迎莅临上海世博展览馆H1-C801展台参观交流!同时,云天励飞也将与中国电子、中国信通院、华为等合作伙伴,在WAIC的舞台

    标签:
    人工智能
  • 首届中国智慧生活大会(CIC)在京成功召开

    6月28日,首届中国智慧生活大会(CIC)在北京成功召开。本次大会是对贯彻扩大内需政策,落实国务院“三品战略”,结合“2023消费提振年”工作安排的积极响应。会议由中国电子视像行业协会、中国标准科技集团、中家院(北京)检测认证有限公司联合指导,洛图科技(RUNTO)主办,京东3C数码和植理文化协办。

    标签:
    智慧生活
  • 酷学院智能产品发布会:引领中大型企业学习新潮流

    近日,酷学院智能产品发布会在深圳闪亮登场。近200位现场观众和近万人次在线观看,共同见证了这一激动人心的时刻。发布会上,酷学院引领大家探索企业培训学习和人才发展领域的新高度,并揭幕其全新的产品智能升级和突破。酷学院产品负责人徐晨通过形象生动、逻辑严谨的讲述,揭晓了全新的智能企业培训和人才发展平台,以

    标签:
    人工智能
  • 对话李军:人工智能是“第五范式革命”

    2025国际人工智能程序设计精英挑战赛(IAEPC)在香港中文大学成功举办。作为主办方之一,欧美同学基金会理事长李军接受了大赛主持人艾诚采访。在采访中,李军认为IAEPC不仅是一场“冠军中的冠军”对决,更是一次全球AI人才的线下交流盛会。大赛“史无前例”的吸引了全球青年科技精英汇聚香港,更加推动和普

  • 对话施韩原与杜瑜皓:与参赛选手一起改变世界

    2025国际人工智能程序设计精英挑战赛(IAEPC)在香港中文大学成功举办。作为大赛发起人方之一及裁判委员会负责人,施韩原与杜瑜皓接受了大赛主持人艾诚采访。裁判委员会主席施韩原分享了此次大赛的亮点,IAEPC首次引入创新赛道,探索选手如何与AI合作进行答题。裁判委员会副主席杜瑜皓认为,选手最终目标并

  • 吴林林专访IAEPC冠军:与全球参赛者交流是最重要的一课

    2025国际人工智能程序设计精英挑战赛(IAEPC)在香港中文大学成功举办。来自深圳的学生吴林林作为主办方记者团成员,采访了大赛冠军选手之一。在吴林林的采访中,选手认为与来自全球的参赛者交流是自己学到的最重要的一课。在科技与AI之前,选手们可以平等、开放、友好的交流。以下是采访实录(有删节):吴林林

  • 吴林林专访黄锦辉:年轻人要像懂中文一样懂A

    2025国际人工智能程序设计精英挑战赛(IAEPC)在香港中文大学成功举办。来自深圳的学生吴林林作为主办方记者团成员,采访了大会嘉宾:全国政协委员、香港特别行政区立法会议员、香港中文大学工程学院副院长、IAEPC联合发起人黄锦辉先生。在吴林林的采访中,黄锦辉教授勉励年轻人要像懂中文和英语一样懂AI,

  • 本以为DeepSeek天下无敌了,没想到Manus更猛

    昨天新出了一个AI,据说比DeepSeek还牛,而截止到今早,已经有10万人在排队申请Manus邀请码了,而且它邀请码已经炒到10万了。这是北京的一家人工智能公司蝴蝶科技,创始人是一名来自华中科技大学的90后毕业生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能体产品出现了,名叫Manus

    标签:
    ai智能
  • 库克已纳投名状:苹果AI没得选,只能选百度

    苹果16弄了两个版本,一个是专门给中国人用的,准备用百度的AI,还要交钱。第二个是全世界都可以用的,用了ChatGPT,包括台湾、香港、澳门都可以用。以后都这样了。好,问题就出在这,苹果和百度的合作出现问题了,新闻连起来看,才能明白其中含义。新闻一:苹果正在和腾讯、字节初步接洽,考虑将二者的AI模型

  • AI加速时代的“进度条”,我们拨动了百分之几?

    “技术日新月异,人类生活方式正在快速转变,这一切给人类历史带来了一系列不可思议的奇点。我们曾经熟悉的一切,都开始变得陌生。”计算机之父约翰·冯·诺依曼曾这样说到。

    标签:
    ai智能
  • AI视频赛道,要变天了

    “毁灭你,与你何干?”,这是在刘慈欣的科幻小说《三体》里用来形容人类与三体人之间的战争的一句话。

    标签:
    ai智能
  • “创造市场”与“算法进化”,中美AI竞速的岔路口

    “人工智能的商业模式,是要创造一个市场,而非一个算法”。这是世界AI泰斗MichaelI.Jordan的观点。而当前的全球AI市场,占据主导地位的中美双方,却也走出了两条截然不同的技术路径,前者执着于前沿技术的探索,后者则发力应用优化和商业化落地。南辕北辙的两个方向,或许已经无法直接进行排位先后、优

    标签:
    ai智能