1. 主要标签

语音评测WebAPI接口返回结果中的data数据,即评测结果,包含的主要标签如下:

标签说明
recpaper该标签中间的内容即为评测结果,是开发者需要关心的部分。
rec_paper.read_syllable表明这是单字朗读评测(中文评测专有)结果。
rec_paper.read_word表明这是单词朗读评测结果。
rec_paper.read_sentence表明这是句子朗读评测结果。
rec_paper.read_chapter表明这是段落朗读评测结果。
rec_paper.read[xxx].sentence句子。
recpaper.read[xxx].sentence.word单词,句子的组成部分。
recpaper.read[xxx].sentence.word.syll音节,单词发音的组成部分。对于中文,一个音节对应一个字的发音。
recpaper.read[xxx].sentence.word.syll.phone音素,基本发音元素,音节的组成部分。
rec_tree该标签中的内容请忽略,预留字段,不需要关心

read_syllable、 read_word 、 read_sentence 、 read_chapter 标签中的属性记录了本次评测的各项得分、 整体时长等信息。 sentence、 word、 syllable 和 phone 标签记录的是云端引擎对评测语音的分析结果,如哪些是静音,静音时长多少,哪些是有效发音,每个字、词的音节发音是否正确等等。

2. 中文评测

以下为中文评测结果的属性说明

2.1. 中文字(read_syllable)

以下是各个层级的字段说明。

read_syllable

属性含义
total_score总分
phone_score声韵分(需开通 全维度 权限)
fluency_score流畅度分(保留字段,值为0)
tone_score调型分(需开通 全维度 权限)
integrity_score完整度分(保留字段,值为0)
except_info异常信息,详细请见 except_info列表
beg_pos/end_pos始/末位置,单位:帧(10ms)
content试卷内容
time_len朗读时长,单位:帧(10ms)

sentence

属性含义
time_len朗读时长,单位:帧(10ms)
beg_pos/end_pos始/末位置,单位:帧(10ms)
content试卷内容

word

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
symbol拼音:数字代表声调, 5 和 5 以上表示轻声
content试卷内容
time_len时长,单位:帧(10ms)

syll

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
dp_message增漏读信息,详细请见 dp_message列表
symbol拼音:数字代表声调, 5 和 5 以上表示轻声
content试卷内容(sil、 silv 表示静音, fil 表示噪音)
rec_node_typepaper(试卷内容),sil(非试卷内容)
time_len时长,单位:帧(10ms)

phone

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
dp_message增漏读信息,详细请见 dp_message列表
content试卷内容(sil、 silv 表示静音, fil 表示噪音)
rec_node_typepaper(试卷内容),sil(非试卷内容)
is_yun是否是韵母,1表示“是”,0表示“否”
mono_tone文本调型信息:TONE1(一声)TONE2(二声)TONE3(三声)TONE4(四声)
time_len时长,单位:帧(10ms)
perr_level_msg预留字段,请忽略

2.2. 中文词(read_word)

以下是各个层级的字段说明。

read_word

属性含义
total_score总分
phone_score声韵分(需开通 全维度 权限)
fluency_score流畅度分(保留字段,值为0)
tone_score调型分(需开通 全维度 权限)
integrity_score完整度分(保留字段,值为0)
except_info异常信息,详细请见 except_info列表
beg_pos/end_pos始/末位置,单位:帧(10ms)
content试卷内容
time_len朗读时长,单位:帧(10ms)

sentence

属性含义
time_len朗读时长,单位:帧(10ms)
beg_pos/end_pos始/末位置,单位:帧(10ms)
content试卷内容

word

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
symbol拼音:数字代表声调, 5 和 5 以上表示轻声
content试卷内容
time_len时长,单位:帧(10ms)

syll

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
dp_message增漏读信息,详细请见 dp_message列表
symbol拼音:数字代表声调, 5 和 5 以上表示轻声
content试卷内容(sil、 silv 表示静音, fil 表示噪音)
rec_node_typepaper(试卷内容),sil(非试卷内容)
time_len时长,单位:帧(10ms)

phone

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
dp_message增漏读信息,详细请见 dp_message列表
content试卷内容(sil、 silv 表示静音, fil 表示噪音)
rec_node_typepaper(试卷内容),sil(非试卷内容)
is_yun是否是韵母,1表示“是”,0表示“否”
mono_tone文本调型信息:TONE1(一声)TONE2(二声)TONE3(三声)TONE4(四声)
time_len时长,单位:帧(10ms)
perr_level_msg预留字段,请忽略

2.3. 中文句子(read_sentence)

以下是各个层级的字段说明。

read_sentence

属性含义
total_score总分
phone_score声韵分(需开通 全维度 权限)
fluency_score流畅度分(需开通 全维度 权限)
tone_score调型分(需开通 全维度 权限)
integrity_score完整度分(需开通 全维度 权限)
except_info异常信息,详细请见 except_info列表
is_rejected是否被拒true:被拒,表明引擎检测到乱读false:正常
beg_pos/end_pos始/末位置,单位:帧(10ms)
content试卷内容
time_len朗读时长,单位:帧(10ms)

sentence

属性含义
total_score总分
phone_score声韵分(需开通 全维度 权限)
fluency_score流畅度分(需开通 全维度 权限)
tone_score调型分(需开通 全维度 权限)
time_len朗读时长,单位:帧(10ms)
beg_pos/end_pos始/末位置,单位:帧(10ms)
content试卷内容

word

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
symbol拼音:数字代表声调, 5 和 5 以上表示轻声
content试卷内容
time_len时长,单位:帧(10ms)

syll

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
dp_message增漏读信息,详细请见 dp_message列表
symbol拼音:数字代表声调, 5 和 5 以上表示轻声
content试卷内容(sil、 silv 表示静音, fil 表示噪音)
rec_node_typepaper(试卷内容),sil(非试卷内容)
time_len时长,单位:帧(10ms)

phone

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
dp_message增漏读信息,详细请见 dp_message列表
content试卷内容(sil、 silv 表示静音, fil 表示噪音)
rec_node_typepaper(试卷内容),sil(非试卷内容)
is_yun是否是韵母,1表示“是”,0表示“否”
mono_tone文本调型信息:TONE1(一声)TONE2(二声)TONE3(三声)TONE4(四声)
time_len时长,单位:帧(10ms)
perr_level_msg预留字段,请忽略

2.4. 中文篇章(read_chapter)

以下是各个层级的字段说明。

read_chapter

属性含义
total_score总分
phone_score声韵分(需开通 全维度 权限)
fluency_score流畅度分(需开通 全维度 权限)
tone_score调型分(需开通 全维度 权限)
integrity_score完整度分(需开通 全维度 权限)
except_info异常信息,详细请见 except_info列表
is_rejected是否被拒true:被拒,表明引擎检测到乱读false:正常
beg_pos/end_pos始/末位置,单位:帧(10ms)
content试卷内容
time_len朗读时长,单位:帧(10ms)

sentence

属性含义
total_score总分
phone_score声韵分(需开通 全维度 权限)
fluency_score流畅度分(需开通 全维度 权限)
tone_score调型分(需开通 全维度 权限)
time_len朗读时长,单位:帧(10ms)
beg_pos/end_pos始/末位置,单位:帧(10ms)
content试卷内容

word

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
symbol拼音:数字代表声调, 5 和 5 以上表示轻声
content试卷内容
time_len时长,单位:帧(10ms)

syll

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
dp_message增漏读信息,详细请见 dp_message列表
symbol拼音:数字代表声调, 5 和 5 以上表示轻声
content试卷内容(sil、 silv 表示静音, fil 表示噪音)
rec_node_typepaper(试卷内容),sil(非试卷内容)
time_len时长,单位:帧(10ms)

phone

属性含义
beg_pos/end_pos始/末位置,单位:帧(10ms)
dp_message增漏读信息,详细请见 dp_message列表
content试卷内容(sil、 silv 表示静音, fil 表示噪音)
rec_node_typepaper(试卷内容),sil(非试卷内容)
is_yun是否是韵母,1表示“是”,0表示“否”
mono_tone文本调型信息:TONE1(一声)TONE2(二声)TONE3(三声)TONE4(四声)
time_len时长,单位:帧(10ms)
perr_level_msg预留字段,请忽略

3. 英文评测

以下为英语评测结果的属性说明(注:一帧长度为 10ms)

3.1. 英文单词(read_word)

以下是各个层级的字段说明。

read_word

属性含义
beg_pos/end_pos多个单词开始/结束时间
content多个单词内容
except_info异常信息,详细请见 except_info列表
is_rejected是否被拒true:被拒,表明引擎检测到乱读false:正常
total_score总分
accuracy_socre准确度评分(需开通 全维度 权限)
standard_score预留字段,暂不生效)标准度评分,评测发音地不地道

sentence

属性含义
beg_pos/end_pos句子开始/结束时间
content句子内容
index句子索引

word

属性含义
beg_pos/end_pos单词开始/结束时间
content单词内容
dp_message增漏读信息,详细请见 dp_message列表
global_index单词在全篇章索引
index单词在句子中的索引
property单词属性信息,详细请见 property列表
total_score单词总分

syll

属性含义
beg_pos/end_pos音节开始/结束时间
content音节内容(sil、 silv 表示静音, fil 表示噪音)详见 音标对照表
syll_score音节得分
syll_accent音节重读标记,标志是否需要重读(0:非重读,1:重读,2:半重读)

phone

属性含义
beg_pos/end_pos音素开始/结束时间
content音素内容(sil、 silv 表示静音, fil 表示噪音)详见 音标对照表
dp_message增漏读信息,详细请见 dp_message列表

3.2. 英文句子(read_sentence)

以下是各个层级的字段说明。

read_sentence

属性含义
beg_pos/end_pos篇章开始/结束时间
content篇章内容
except_info异常信息,详细请见 except_info列表
is_rejected是否被拒true:被拒,表明引擎检测到乱读false:正常
word_count篇章中全部单词数量
total_score总分
accuracy_score准确度评分(需开通 全维度 权限)
fluency_score流畅度评分(需开通 全维度 权限)
integrity_score完整度评分(需开通 全维度 权限)
standard_score预留字段,暂不生效)标准度评分,评测发音地不地道

sentence

属性含义
beg_pos/end_pos句子开始/结束时间
content句子内容
index句子索引
total_score句子评分
accuracy_score准确度评分(需开通 全维度 权限)
fluency_score流畅度评分(需开通 全维度 权限)
standard_score预留字段,暂不生效)标准度评分,评测发音地不地道
word_count句子中全部单词数量

word

属性含义
beg_pos/end_pos单词开始/结束时间
content单词内容
dp_message增漏读信息,详细请见 dp_message列表
global_index单词在全篇章索引
index单词在句子中的索引
property单词属性信息,详细请见 property列表
total_score单词总分

syll

属性含义
beg_pos/end_pos音节开始/结束时间
content音节内容(sil、 silv 表示静音, fil 表示噪音)详见 音标对照表
syll_score音节得分
syll_accent音节重读标记,标志是否需要重读(0:非重读,1:重读,2:半重读)

phone

属性含义
beg_pos/end_pos音素开始/结束时间
content音素内容(sil、 silv 表示静音, fil 表示噪音)详见 音标对照表
dp_message增漏读信息,详细请见 dp_message列表

3.3. 英文篇章(read_chapter)

以下是各个层级的字段说明。

read_chapter

属性含义
beg_pos/end_pos篇章开始/结束时间
content篇章内容
except_info异常信息,详细请见 except_info列表
is_rejected是否被拒true:被拒,表明引擎检测到乱读false:正常
word_count篇章中全部单词数量
total_score总分
accuracy_score准确度评分(需开通 全维度 权限)
fluency_score流畅度评分(需开通 全维度 权限)
integrity_score完整度评分(需开通 全维度 权限)
standard_score预留字段,暂不生效)标准度评分,评测发音地不地道

sentence

属性含义
beg_pos/end_pos句子开始/结束时间
content句子内容
index句子索引
total_score句子评分
accuracy_score准确度评分(需开通 全维度 权限)
fluency_score流畅度评分(需开通 全维度 权限)
standard_score预留字段,暂不生效)标准度评分,评测发音地不地道
word_count句子中全部单词数量

word

属性含义
beg_pos/end_pos单词开始/结束时间
content单词内容
dp_message增漏读信息,详细请见 dp_message列表
global_index单词在全篇章索引
index单词在句子中的索引
property单词属性信息,详细请见 property列表
total_score单词总分

syll

属性含义
beg_pos/end_pos音节开始/结束时间
content音节内容(sil、 silv 表示静音, fil 表示噪音)详见 音标对照表
syll_score音节得分
syll_accent音节重读标记,标志是否需要重读(0:非重读,1:重读,2:半重读)

phone

属性含义
beg_pos/end_pos音素开始/结束时间
content音素内容(sil、 silv 表示静音,fil 表示噪音)详见 音标对照表

4. 音标对照表

讯飞音标<->国际音标XML 结果中音素和音节的音标标记(即 syll 和 phone 标签中的 content 属性) 并不是标准音标,以下是它们与国际标准音标的对应关系:

讯飞音标标准音标讯飞音标标准音标
aaɑːff
aeægg
ahʌhhh
aoɔːjh
arkk
awll
axəmm
aynn
ehengŋ
erɜːpp
eyrr
ihɪss
irɪəshʃ
iytt
ooɒthθ
owəʊvv
oyɒɪww
uhʊyj
uwzz
urʊəzhʒ
bbdrdr
chdzdz
ddtrtr
dhðtsts

5. dp_message属性说明

取值含义说明
0正常引擎认为该单元读了,但不一定朗读正确
16漏读该单元没有读
32增读该单元是多读的文本内的内容
64回读该单元是重复读的相邻文本的内容
128替换该单元读成文本内其他的内容

6. property属性说明

取值含义说明
2意群停顿表示该单词需要停顿一下
16连读表示该单词需要连读
32重读表示该单词需要重(zhong4)读
64句末升调表示该单词需要升调读

7. except_info列表

取值说明
0无异常
28673无语音输入或音量太小
28676检测到语音为乱说类型
28680音频数据信噪比太低
28690音频数据出现截幅

Copyright © iflytek.com 2018 all right reserved,powered by Gitbook该文件修订时间:2019-05-07 07:12:51