1. 讯飞开放平台语音识别音频文件格式说明

您可自行下载Cool Edit Pro软件查看音频格式是否满足以下要求:

1.pcm(pcm_s16le),wav,speex(speex-wb),推荐使用pcm

2.采样率为16000 或者 8000. 推荐使用16000,比特率为16bit

3.单声道

2. 音频文件格式转换工具ffmpeg

2.1. 简介

FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。 详情可参考:http://ffmpeg.org/

2.2. 示例

Mp3 转换为 16k 16bit 单声道 pcm

  1. ffmpeg -y -i test.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 16000 test.pcm

wav 转换为 16k 16bit 单声道 pcm

  1. ffmpeg -y -i test.wav -acodec pcm_s16le -f s16le -ac 1 -ar 16000 test.pcm

44100,16bit,单声道pcm 转换为 16k 16bit 单声道 pcm

  1. ffmpeg -y -f s16le -ar 44100 -ac 1 -i test.pcm -acodec pcm_s16le -f s16le -ac 1 -ar 16000 test.pcm

参数解释:

-y: 表示无需询问,直接覆盖输出文件;

-acodec: 用于设置音频的编码器和解码器;

-f s16le: 用于设置文件格式为 s16le;

-ar 16000: 用于设置音频采样频率为 16k;

-ac 1: 用于设置通道数为 1;

-i: 用于设置输入文件;

3. speex编码

讯飞开放平台rest_api支持speex编码压缩音频文件大小。由于服务端解压speex需要额外耗时,如果没有带宽等限制建议使用pcm格式。请注意压缩前的原始音频文件,必须为采样率16K、16bits、单声道的PCM或WAV格式。

接口支持开源speex编码和讯飞定制speex编码(建议使用讯飞定制speex,无需额外传speex-size参数)

说明:

  • 讯飞定制编解码工具下载(点击下载),使用讯飞定制编码时,需使用7级压缩,并且无需传speex_size参数

  • 标准speex编解码,需下载编译speex库。详情可参考:https://www.speex.org/

Copyright © iflytek.com 2018 all right reserved,powered by Gitbook该文件修订时间:2019-05-07 07:12:51