点赞
评论
收藏
分享
【官方】合成多音字、静音停顿、数字读法
王水2016-06-07 06:30:23发布1478221

在使用合成时,有时候会遇到部分场景下一些文字发音、停顿等效果不符合我们的预期。
针对于一些定制发音的需求,可以选择在文本中加入一些特殊的标记来指明预期。
一、cssml方法
只有在线合成xiaoyan发音人参数支持cssm标签。如果使用此项特性,需注意:
a)、在business中添加参数ttp=cssml。
b)、合成文本不支持unicode文本编码。

具体参见:
【官网】各平台语音合成cssml参数设置
http://bbs.xfyun.cn/forum.php?mod=viewthread&tid=10456&fromuid=33982
(出处: 语音云社区)

1) 指定文字读音。举例如下:
1、他姓<phoneme py="zeng1">曾</phoneme>
2、工会主席<phoneme lang="en">Chen Yuxing</phoneme>
3、“查”作为姓氏时应该读<phoneme lang="zh-cn">zha1</phoneme>
其中,phoneme是指明发音参数的标签,建议闭合。py是指明拼音的,最后一位的数字表示声调(1、2、3、4)。lang指明语言类型的,两种取值:en指定按照英文读法,zh-cn按照拼音读法。py和lang不能同时指定。

2) 在文本合成时加入自定义的静音停顿。举例如下:
1、风<break time="500ms"/>轻轻摇着树梢
其中,break是指明停顿的,time是停顿时间。以秒或者毫秒为单位。

3)标点的朗读规则指定。举例如下:
1、中国传统的节日有<punctuation speak_out="no">:</punctuation>
2、 <punctuation speak_out="yes">春节、端午节、中秋节等。</punctuation>
其中,punctuation用于指明标点符号的发音方式,建议闭合。speak_out有三个取值yes,no,default。yes:读出,no:静默,default:自动判断

4)指定文本中特殊串的性质,即相应的发音方式。如数字读法:
1、现在时钟已指向<sayas type="number">8</sayas>
2、我们一共有<sayas type="numberrdinal">13</sayas>个人
3、我住在<sayas type="number:digits">412</sayas>房间
4、双方比分是<sayas type="number:score">3:1</sayas>
5、取其中的<sayas type="number:fraction">1/3</sayas>
其中,sayas是文本性质标签,建议闭合。该用法可以抽象为:
1、<sayas type="string:extension"> </sayas>
string取值目前支持number,extension的范围以及意义如下:
1、ordinal : 按数值发音
2、digits : 按数字串发音
3、score : 按比分读法发音
4、fraction : 按分数读法发音

二、使用简单标记
除了cssml标记外,还可以通过简单标记来指定文本朗读规则。除方法一中列举中的发音人(xiaoyan、xiaoyu、xiaofeng、xiaoqi、catherine、mary)、小语种发音人外,均可使用改标记方法。包括离线在线发音人和webapi在线发音人。
1)设置单词发音方式。方法如下:
1、格式: [h] (=0/1/2)
2、参数:
0 – 自动判断单词发音方式
1 – 字母发音方式
2 – 单词发音方式
3、说明: 默认单词为自动判断。
文本举例:
1、hello[h0] word
其中,word就会按照单词进行发音

2)数字处理策略。方法如下:
1、格式: [n] (=0/1/2)
2、参数:
0 – 自动判断
1 – 数字作号码处理
2 – 数字作数值处理
3、说明: 默认为自动判断。
文本举例:
1、[n2]123[n1]456[n0]
其中,123将会按照数值处理,456则会按照号码处理,而后的文本中的数字,均会自动判断。

3)合成时,加入静音停顿。方法如下:
1、格式: [p] (=无符号整数)
2、参数: * – 静音的时间长度,单位:毫秒(ms)
文本举例:
1、你好[p500]科大讯飞
该句合成时,将会在“你好”后加入500ms的静音

4)指定汉字发音。方法如下:
1、格式: [=] (=拼音/音标)
2、参数: * – 为前一个汉字/单词设定的拼音/音标
3、说明: 汉字:声调用后接一位数字15分别表示阴平、阳平、上声、去声和轻声5个声调。
文本举例:
1、着[=zhuo2]手
其中,“着”字将读作“zhuó”

文本的标记还会继续完善,我们会不断完善介绍文档哦。
另外,不在该文档介绍范围内的标记功能,不会作为稳定支持哦。

评论(1条)
评论
Swift摇滚歌手st2u2025-04-07 09:44:02
00
1,在简单标记法的头部说方法一中的发音人在方法一中并没有全部列出? 2,小语种发音人是哪些呢? 3,简单标记法是只支持除外的发音人么,方法一里列的和小语种的不支持么?
关于作者
0作品数
0粉丝数
0获得的赞
作者热门内容更多
  • 文章
    【官方】合成多音字、静音停顿、数字读法
  • 文章
    【官网】平台SDK视频教程~持续更新中~
  • 文章
    【官方】离线命令词识别(语法识别)混合模式怎么用
  • 文章
    【官方】Android唤醒+混合模式Demo分享
相关热帖
【官方】合成多音字、静音停顿、数字读法
玩转数理化,随便问我都不怕
科大讯飞研究院刘聪:中国AI大模型既要“弯道超车”,也要“直道冲锋”
认知图谱:知识图谱+认知推理+逻辑表达 | 人工智能下一个十年
预训练新范式提示学习(Prompt-tuning,Prefix-tuning,P-tuning)
讯飞星火知识库文档问答Web API的使用(二)
售前在线咨询
4000-199-199