1. 主要标签
语音评测WebAPI接口返回结果中的data数据,即评测结果,包含的主要标签如下:
标签 | 说明 |
---|---|
recpaper | 该标签中间的内容即为评测结果,是开发者需要关心的部分。 |
rec_paper.read_syllable | 表明这是单字朗读评测(中文评测专有)结果。 |
rec_paper.read_word | 表明这是单词朗读评测结果。 |
rec_paper.read_sentence | 表明这是句子朗读评测结果。 |
rec_paper.read_chapter | 表明这是段落朗读评测结果。 |
rec_paper.read[xxx].sentence | 句子。 |
recpaper.read[xxx].sentence.word | 单词,句子的组成部分。 |
recpaper.read[xxx].sentence.word.syll | 音节,单词发音的组成部分。对于中文,一个音节对应一个字的发音。 |
recpaper.read[xxx].sentence.word.syll.phone | 音素,基本发音元素,音节的组成部分。 |
rec_tree | 该标签中的内容请忽略,预留字段,不需要关心 |
read_syllable、 read_word 、 read_sentence 、 read_chapter 标签中的属性记录了本次评测的各项得分、 整体时长等信息。 sentence、 word、 syllable 和 phone 标签记录的是云端引擎对评测语音的分析结果,如哪些是静音,静音时长多少,哪些是有效发音,每个字、词的音节发音是否正确等等。
2. 中文评测
以下为中文评测结果的属性说明
2.1. 中文字(read_syllable)
以下是各个层级的字段说明。
read_syllable
属性 | 含义 |
---|---|
total_score | 总分 |
phone_score | 声韵分(需开通 全维度 权限) |
fluency_score | 流畅度分(保留字段,值为0) |
tone_score | 调型分(需开通 全维度 权限) |
integrity_score | 完整度分(保留字段,值为0) |
except_info | 异常信息,详细请见 except_info列表 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
time_len | 朗读时长,单位:帧(10ms) |
sentence
属性 | 含义 |
---|---|
time_len | 朗读时长,单位:帧(10ms) |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
word
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容 |
time_len | 时长,单位:帧(10ms) |
syll
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
time_len | 时长,单位:帧(10ms) |
phone
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
is_yun | 是否是韵母,1表示“是”,0表示“否” |
mono_tone | 文本调型信息:TONE1(一声)TONE2(二声)TONE3(三声)TONE4(四声) |
time_len | 时长,单位:帧(10ms) |
perr_level_msg | 预留字段,请忽略 |
2.2. 中文词(read_word)
以下是各个层级的字段说明。
read_word
属性 | 含义 |
---|---|
total_score | 总分 |
phone_score | 声韵分(需开通 全维度 权限) |
fluency_score | 流畅度分(保留字段,值为0) |
tone_score | 调型分(需开通 全维度 权限) |
integrity_score | 完整度分(保留字段,值为0) |
except_info | 异常信息,详细请见 except_info列表 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
time_len | 朗读时长,单位:帧(10ms) |
sentence
属性 | 含义 |
---|---|
time_len | 朗读时长,单位:帧(10ms) |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
word
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容 |
time_len | 时长,单位:帧(10ms) |
syll
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
time_len | 时长,单位:帧(10ms) |
phone
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
is_yun | 是否是韵母,1表示“是”,0表示“否” |
mono_tone | 文本调型信息:TONE1(一声)TONE2(二声)TONE3(三声)TONE4(四声) |
time_len | 时长,单位:帧(10ms) |
perr_level_msg | 预留字段,请忽略 |
2.3. 中文句子(read_sentence)
以下是各个层级的字段说明。
read_sentence
属性 | 含义 |
---|---|
total_score | 总分 |
phone_score | 声韵分(需开通 全维度 权限) |
fluency_score | 流畅度分(需开通 全维度 权限) |
tone_score | 调型分(需开通 全维度 权限) |
integrity_score | 完整度分(需开通 全维度 权限) |
except_info | 异常信息,详细请见 except_info列表 |
is_rejected | 是否被拒true:被拒,表明引擎检测到乱读false:正常 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
time_len | 朗读时长,单位:帧(10ms) |
sentence
属性 | 含义 |
---|---|
total_score | 总分 |
phone_score | 声韵分(需开通 全维度 权限) |
fluency_score | 流畅度分(需开通 全维度 权限) |
tone_score | 调型分(需开通 全维度 权限) |
time_len | 朗读时长,单位:帧(10ms) |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
word
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容 |
time_len | 时长,单位:帧(10ms) |
syll
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
time_len | 时长,单位:帧(10ms) |
phone
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
is_yun | 是否是韵母,1表示“是”,0表示“否” |
mono_tone | 文本调型信息:TONE1(一声)TONE2(二声)TONE3(三声)TONE4(四声) |
time_len | 时长,单位:帧(10ms) |
perr_level_msg | 预留字段,请忽略 |
2.4. 中文篇章(read_chapter)
以下是各个层级的字段说明。
read_chapter
属性 | 含义 |
---|---|
total_score | 总分 |
phone_score | 声韵分(需开通 全维度 权限) |
fluency_score | 流畅度分(需开通 全维度 权限) |
tone_score | 调型分(需开通 全维度 权限) |
integrity_score | 完整度分(需开通 全维度 权限) |
except_info | 异常信息,详细请见 except_info列表 |
is_rejected | 是否被拒true:被拒,表明引擎检测到乱读false:正常 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
time_len | 朗读时长,单位:帧(10ms) |
sentence
属性 | 含义 |
---|---|
total_score | 总分 |
phone_score | 声韵分(需开通 全维度 权限) |
fluency_score | 流畅度分(需开通 全维度 权限) |
tone_score | 调型分(需开通 全维度 权限) |
time_len | 朗读时长,单位:帧(10ms) |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
word
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容 |
time_len | 时长,单位:帧(10ms) |
syll
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
time_len | 时长,单位:帧(10ms) |
phone
属性 | 含义 |
---|---|
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
is_yun | 是否是韵母,1表示“是”,0表示“否” |
mono_tone | 文本调型信息:TONE1(一声)TONE2(二声)TONE3(三声)TONE4(四声) |
time_len | 时长,单位:帧(10ms) |
perr_level_msg | 预留字段,请忽略 |
3. 英文评测
以下为英语评测结果的属性说明(注:一帧长度为 10ms)
3.1. 英文单词(read_word)
以下是各个层级的字段说明。
read_word
属性 | 含义 |
---|---|
beg_pos/end_pos | 多个单词开始/结束时间 |
content | 多个单词内容 |
except_info | 异常信息,详细请见 except_info列表 |
is_rejected | 是否被拒true:被拒,表明引擎检测到乱读false:正常 |
total_score | 总分 |
accuracy_socre | 准确度评分(需开通 全维度 权限) |
standard_score | (预留字段,暂不生效)标准度评分,评测发音地不地道 |
sentence
属性 | 含义 |
---|---|
beg_pos/end_pos | 句子开始/结束时间 |
content | 句子内容 |
index | 句子索引 |
word
属性 | 含义 |
---|---|
beg_pos/end_pos | 单词开始/结束时间 |
content | 单词内容 |
dp_message | 增漏读信息,详细请见 dp_message列表 |
global_index | 单词在全篇章索引 |
index | 单词在句子中的索引 |
property | 单词属性信息,详细请见 property列表 |
total_score | 单词总分 |
syll
属性 | 含义 |
---|---|
beg_pos/end_pos | 音节开始/结束时间 |
content | 音节内容(sil、 silv 表示静音, fil 表示噪音)详见 音标对照表 |
syll_score | 音节得分 |
syll_accent | 音节重读标记,标志是否需要重读(0:非重读,1:重读,2:半重读) |
phone
属性 | 含义 |
---|---|
beg_pos/end_pos | 音素开始/结束时间 |
content | 音素内容(sil、 silv 表示静音, fil 表示噪音)详见 音标对照表 |
dp_message | 增漏读信息,详细请见 dp_message列表 |
3.2. 英文句子(read_sentence)
以下是各个层级的字段说明。
read_sentence
属性 | 含义 |
---|---|
beg_pos/end_pos | 篇章开始/结束时间 |
content | 篇章内容 |
except_info | 异常信息,详细请见 except_info列表 |
is_rejected | 是否被拒true:被拒,表明引擎检测到乱读false:正常 |
word_count | 篇章中全部单词数量 |
total_score | 总分 |
accuracy_score | 准确度评分(需开通 全维度 权限) |
fluency_score | 流畅度评分(需开通 全维度 权限) |
integrity_score | 完整度评分(需开通 全维度 权限) |
standard_score | (预留字段,暂不生效)标准度评分,评测发音地不地道 |
sentence
属性 | 含义 |
---|---|
beg_pos/end_pos | 句子开始/结束时间 |
content | 句子内容 |
index | 句子索引 |
total_score | 句子评分 |
accuracy_score | 准确度评分(需开通 全维度 权限) |
fluency_score | 流畅度评分(需开通 全维度 权限) |
standard_score | (预留字段,暂不生效)标准度评分,评测发音地不地道 |
word_count | 句子中全部单词数量 |
word
属性 | 含义 |
---|---|
beg_pos/end_pos | 单词开始/结束时间 |
content | 单词内容 |
dp_message | 增漏读信息,详细请见 dp_message列表 |
global_index | 单词在全篇章索引 |
index | 单词在句子中的索引 |
property | 单词属性信息,详细请见 property列表 |
total_score | 单词总分 |
syll
属性 | 含义 |
---|---|
beg_pos/end_pos | 音节开始/结束时间 |
content | 音节内容(sil、 silv 表示静音, fil 表示噪音)详见 音标对照表 |
syll_score | 音节得分 |
syll_accent | 音节重读标记,标志是否需要重读(0:非重读,1:重读,2:半重读) |
phone
属性 | 含义 |
---|---|
beg_pos/end_pos | 音素开始/结束时间 |
content | 音素内容(sil、 silv 表示静音, fil 表示噪音)详见 音标对照表 |
dp_message | 增漏读信息,详细请见 dp_message列表 |
3.3. 英文篇章(read_chapter)
以下是各个层级的字段说明。
read_chapter
属性 | 含义 |
---|---|
beg_pos/end_pos | 篇章开始/结束时间 |
content | 篇章内容 |
except_info | 异常信息,详细请见 except_info列表 |
is_rejected | 是否被拒true:被拒,表明引擎检测到乱读false:正常 |
word_count | 篇章中全部单词数量 |
total_score | 总分 |
accuracy_score | 准确度评分(需开通 全维度 权限) |
fluency_score | 流畅度评分(需开通 全维度 权限) |
integrity_score | 完整度评分(需开通 全维度 权限) |
standard_score | (预留字段,暂不生效)标准度评分,评测发音地不地道 |
sentence
属性 | 含义 |
---|---|
beg_pos/end_pos | 句子开始/结束时间 |
content | 句子内容 |
index | 句子索引 |
total_score | 句子评分 |
accuracy_score | 准确度评分(需开通 全维度 权限) |
fluency_score | 流畅度评分(需开通 全维度 权限) |
standard_score | (预留字段,暂不生效)标准度评分,评测发音地不地道 |
word_count | 句子中全部单词数量 |
word
属性 | 含义 |
---|---|
beg_pos/end_pos | 单词开始/结束时间 |
content | 单词内容 |
dp_message | 增漏读信息,详细请见 dp_message列表 |
global_index | 单词在全篇章索引 |
index | 单词在句子中的索引 |
property | 单词属性信息,详细请见 property列表 |
total_score | 单词总分 |
syll
属性 | 含义 |
---|---|
beg_pos/end_pos | 音节开始/结束时间 |
content | 音节内容(sil、 silv 表示静音, fil 表示噪音)详见 音标对照表 |
syll_score | 音节得分 |
syll_accent | 音节重读标记,标志是否需要重读(0:非重读,1:重读,2:半重读) |
phone
属性 | 含义 |
---|---|
beg_pos/end_pos | 音素开始/结束时间 |
content | 音素内容(sil、 silv 表示静音,fil 表示噪音)详见 音标对照表 |
4. 音标对照表
讯飞音标<->国际音标XML 结果中音素和音节的音标标记(即 syll 和 phone 标签中的 content 属性) 并不是标准音标,以下是它们与国际标准音标的对应关系:
讯飞音标 | 标准音标 | 讯飞音标 | 标准音标 |
---|---|---|---|
aa | ɑː | f | f |
ae | æ | g | g |
ah | ʌ | hh | h |
ao | ɔː | jh | dʒ |
ar | eə | k | k |
aw | aʊ | l | l |
ax | ə | m | m |
ay | aɪ | n | n |
eh | e | ng | ŋ |
er | ɜː | p | p |
ey | eɪ | r | r |
ih | ɪ | s | s |
ir | ɪə | sh | ʃ |
iy | iː | t | t |
oo | ɒ | th | θ |
ow | əʊ | v | v |
oy | ɒɪ | w | w |
uh | ʊ | y | j |
uw | uː | z | z |
ur | ʊə | zh | ʒ |
b | b | dr | dr |
ch | tʃ | dz | dz |
d | d | tr | tr |
dh | ð | ts | ts |
5. dp_message属性说明
取值 | 含义 | 说明 |
---|---|---|
0 | 正常 | 引擎认为该单元读了,但不一定朗读正确 |
16 | 漏读 | 该单元没有读 |
32 | 增读 | 该单元是多读的文本内的内容 |
64 | 回读 | 该单元是重复读的相邻文本的内容 |
128 | 替换 | 该单元读成文本内其他的内容 |
6. property属性说明
取值 | 含义 | 说明 |
---|---|---|
2 | 意群停顿 | 表示该单词需要停顿一下 |
16 | 连读 | 表示该单词需要连读 |
32 | 重读 | 表示该单词需要重(zhong4)读 |
64 | 句末升调 | 表示该单词需要升调读 |
7. except_info列表
取值 | 说明 |
---|---|
0 | 无异常 |
28673 | 无语音输入或音量太小 |
28676 | 检测到语音为乱说类型 |
28680 | 音频数据信噪比太低 |
28690 | 音频数据出现截幅 |
Copyright © iflytek.com 2018 all right reserved,powered by Gitbook该文件修订时间:2019-05-07 07:12:51