1. 概述
本文档是开发者集成科大讯飞MSC(Mobile Speech Client,移动语音终端)Linux版SDK的使用指南,定义了语音听写,语法识别,语音合成,语音评测,语音唤醒等服务接口的使用。关于各服务接口更详细的说明,请参考 MSC LInux API 文档 。在集成过程中如有疑问,可登录语音云开发者论坛,查找答案或与其他开发者交流
1. Linux语音SDK概述
MSC SDK的主要业务功能如下表所示:
名词 | 解释 |
---|---|
语音听写 | 将一段语音转换成文本,把语音中的文字信息提取出来,并可以优先识别用户手机特有的联系人和个性化数据。 |
语音合成 | 将一段文字转换成语音,可根据需要合成出不同音色、语速和语调的声音,让机器像人一样开口说话。 |
语法识别 | 判断用户所说的内容是否与预定义的语法相符合,主要用于识别用户是否下达某项指令,使用语法识别前,需要先定义语法。 |
语义理解 | 在语音听写基础上,分析理解用户的说话意图,返回结构化的指令信息。开发者可在语义开放平台定义专属的问答格式 。 |
语音评测 | 通过智能语音技术自动对发音水平进行评价,给出用户综合得分和发音信息。 |
语音唤醒 | 即设备(手机、玩具、家电等)在休眠(或锁屏)状态下也能检测到用户的声音,并根据声音提示进行相应操作,开启全语音交互,同时支持唤醒+识别、唤醒+语义的OneShot方案。 |