API 百度 语音识别功能踩坑(菜鸟版)

2018-05-25  本文已影响0人  x8q7

本文结合内容,摘自
http://ai.baidu.com/docs/#/ASR-API/top

描述:百度语音识别通过 REST API 的方式给开发者提供一个通用的 HTTP 接口。 上传需要完整的录音文件,录音文件时长不超过60s。

:浏览器由于无法跨域请求百度语音服务器的域名,因此无法使用本接口。

step 1: 获取 Access Token

建议使用post 传参,请求该地址:

https://openapi.baidu.com/oauth/2.0/token

所需参数如下:

grant_type:必须参数,固定为“client_credentials”
client_id:必须参数,应用的 API Key;
client_secret:必须参数,应用的 Secret Key;
mui框架,书写方式
mui.ajax('https://openapi.baidu.com/oauth/2.0/token', {
    data: {
        grant_type: "client_credentials",
        client_id: "",//此处为申请语音账户时的 API key
        client_secret: ""//此处为申请语音账户似的 Secret Key
    },
    dataType: 'json', //服务器返回json格式数据
    type: 'post', //HTTP请求类型
    timeout: 10000, //超时时间设置为10秒;
    success: function (data) {
        //服务器返回响应,根据响应结果,分析是否登录成功;
        console.log("获取token success----");
        //data.access_token  该值 为可用的 access_token 的值

    },
    error: function (xhr, type, errorThrown) {
        //异常处理;
        console.log(type);
        console.log(errorThrown);
    }
});

注:Access Token 有效期为一个月,开发者需要对 Access Token的有效性进行判断,过期 需要重新获取;

step 2 请求识别接口,将base64 转换为文字返回

请求之前

获取 本地录音(H5+ 书写方式)

// 扩展API加载完毕,现在可以正常调用扩展API 
document.addEventListener("plusready", onPlusReady, false);
var r = null;
function onPlusReady() {
    r = plus.audio.getRecorder();
    uuId = plus.device.imei;
    console.log(uuId);
}

function startRecord() {
    if (r == null) {
        console.log("Device not ready!");
        return;
    }
    r.record({
        filename: "_doc/audio/"
    }, function (path) {
        Audio2dataURL(path);//识别到音频文件,调用,转base64 方法
        console.log("Audio record success!");
    }, function (e) {
        console.log("Audio record failed: " + e.message);
    });
}

function stopRecord() {
    r.stop();
}

语音转为base64(H5+ 书写方式)

// 录音语音文件转base64字符串
function Audio2dataURL(path) {
    var urlArr;
    plus.io.resolveLocalFileSystemURL(path, function (entry) {
        entry.file(function (file) {
            var reader = new plus.io.FileReader();
            //urlSize 为 文件的字节 大小
            var urlSize = file.size;
            reader.onloadend = function (e) {
                //urlStr 的值,为返回转换的base64数据
                var urlStr = e.target.result;
                urlArr = urlStr.split(",")[1];
                //此处调用,发送给百度语引识别的 函数
                //例如:
                sendBaseUrl(urlArr, urlSize, token_val);
            };
            reader.readAsDataURL(file);
        }, function (e) {
            mui.toast("读写出现异常: " + e.message);
        })
    })

}

开始请求

 function sendBaseUrl(speechUrl, urlSize, token_val) {
    mui.ajax('https://vop.baidu.com/server_api', {
        //注意,data内部为json格式,所以,必须是字符串
        data: {
            "format": "amr",//格式支持pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)采样率
            "rate": 8000,//前方有坑,请绕行:此处文档参数16000,达不到这种高保真音频,故 使用8000
            "dev_pid": 1536,//普通话
            "channel": 1,//固定写法(声道)
            "cuid": "862245234377502,862989243244150",//设备的唯一id
            "speech": speechUrl,//base64的音频文件
            "len": urlSize,//文件的大小,字节数
            "token": token_val,//获取到的token值
        },
        headers: {
            'Content-Type': 'application/json'
        },
        dataType: 'json', //服务器返回json格式数据
        type: 'post', //HTTP请求类型
        timeout: 10000, //超时时间设置为10秒;
        success: function (data) {
            //服务器返回响应,根据响应结果,分析是否登录成功;
            console.log("识别ing------");
            console.log(JSON.stringify(data));

        },
        error: function (xhr, type, errorThrown) {
            //异常处理;
            console.log(type);
            console.log(errorThrown);
            console.log("识别fail");
        }
    });
}
tips:若有错误提示,且 已经走到成功回调,建议参照文档,查看错误码。

说明:本文用途学习交流,并不用于商用。

上一篇下一篇

猜你喜欢

热点阅读