语音识别,包括听写、语法识别功能。语音识别技术(Auto Speech Recognize,简称ASR)即把人的自然语言音频数据转换成文本数据。

    听写,是基于自然语言处理,将自然语言音频转换为文本输出的技术。语音听写技术与语法识别技术的不同在于,语音听写不需要基于某个具体的语法文件,其识别范围是整个语种内的词条。在听写时,应用还可以上传个性化的词表,如联系人列表等,提高列表中词语的匹配率。

    语法识别,是基于语法规则,将与语法一致的自然语言转换为文本输出的技术。语法识别相比听写,有更高的匹配率,多用于要更准确结果且有限说法的语音控制,如空调的语音控制等。在使用语法识别时,应用需要先构建一个语法文件上传给服务器,并在会话时,传入语法ID,以使用该语法。