智能音频文件识别产品API文档#


版权所有 翻版必究


目录

音频文件上传请求#

请求URL#

集群URL支持产品列表
北京http://api-audio-bj.fengkongcloud.com/audio/v4中文音频文件
上海http://api-audio-sh.fengkongcloud.com/audio/v4中文音频文件
硅谷http://api-audio-gg.fengkongcloud.com/audio/v4中文音频文件
英语音频文件
阿语音频文件

字符编码#

UTF-8

请求方法#

POST

建议超时时长#

1s

音频格式限制#

WAVMP3AACAMR3GPM4AWMAOGGAPEFLACALACWAVPACKSILK_V3

请求体限制#

所有请求参数大小总和不能超过18M

请求参数#

放在HTTP Body中,采用Json格式,具体参数如下:

请求参数名类型参数说明传入说明规范
accessKeystring公司密钥必传参数由数美提供
appIdstring应用标识必传参数

用于区分应用,可选值如下:

default:默认应用

额外应用值需数美单独分配提供

eventIdstring事件标识必传参数

用于区分场景数据
可选值:

default:默认事件

audiobook:有声书

education:教育音频

game:游戏语音房

live:秀场直播

ecommerce:电商直播

voiceroom:交友语音房

private:私密语音聊天

other:其他

typestring检测的风险类型必传参数

AUDIOPOLITICAL:一号领导人声纹识别

POLITICS:涉政识别

PORN:色情识别

AD:广告识别
ANTHEN:国歌识别

MOAN:娇喘识别

ABUSE:辱骂识别
GENDER:性别识别

TIMBRE:音色识别

SING:唱歌识别

LANGUAGE:语种识别

如需识别音色,唱歌,语种GENDER必传

如需做组合识别,通过下划线连接即可,例如POLITICS_PORN_MOAN涉政、色情和娇喘识别

建议传入:
POLITICS_PORN_AD_MOAN

contentTypestring待识别音频内容的格式必传参数

可选值:

URL:识别内容为音频url地址;

RAW:识别内容为音频的base64编码数据

contentstring待识别的音频内容必传参数

可以为url地址或者base64编码数据。

其中,base64编码数据上限15M,仅支持pcm、wav、mp3格式, 并且pcm格式数据必须采用16-bit小端序编码。推荐使用pcm、wav格式传输

datajson object本次请求相关信息必传参数最长1MB,详见data参数
btIdstring音频文件唯一标识必传参数唯一标识这条音频文件,方便将回调结果对应上,最高128位,不能重复
callbackstring回调http接口非必传参数当该字段非空时,服务将根据该字段回调通知用户审核结果

data#

其中,data的内容如下:

请求参数名类型参数说明传入说明规范
tokenIdstring用户账号非必传参数用于用户行为分析,建议传入用户UID
formatInfostring音频数据格式非必传参数当音频内容格式为RAW时必须存在,可选值:pcm、wav、mp3
rateint音频数据采样率非必传参数当音频数据格式为pcm时必须存在,范围限制8000-32000。
trackint音频数据声道数非必传参数

当音频数据格式为pcm时必须存在,可选值:

1: 单声道

2: 双声道

returnAllTextint返回音频片段的等级非必传参数

0:返回风险等级为非pass的音频片段

1:返回所有风险等级的音频片段

默认为0

langstring音频流语言类型非必传参数可选值如下,(默认值为zh):
zh:中文
en:英文
ar:阿拉伯语

同步返回参数#

放在HTTP Body中,采用Json格式,具体参数如下:

返回结果参数名参数类型参数说明是否必返规范
requestIdstring本次请求的唯一标识
codeint请求返回码

1100:成功

1901:QPS超限

1902:参数不合法

1903:服务失败

9101:无权限操作

messagestring请求返回描述,和请求返回码对应

回调结果#

放在HTTP Body中,采用Json格式,具体参数如下:

参数名类型参数说明是否必返规范
requestIdstring本次请求的唯一标识
btIdstring音频唯一标识
codeint请求返回码

1100:成功

1901:QPS超限

1902:参数不合法

1903:服务失败

9101:无权限操作

除message和requestId之外的字段,只有当code为1100时才会存在

messagestring请求返回描述,和请求返回码对应
riskLevelstring当前事件的处置建议

可能返回值:
PASS:通过

REVIEW:审核

REJECT:拒绝

建议:对接初期不直接使用结果,进行拦截尺度调优,符合预期后在进行使用

audioTextstring整段音频转译文本结果
audioTimeint整段音频的音频时长单位秒
audioDetailjson_array音频片段信息回调的音频片段信息,详见audioDetail参数
audioTagsjson_object音频标签返回性别、音色、是否唱歌等标签
requestParamsjson_object透传字段返回data下所有字段

audioDetail#

其中,audioDetail详细内容如下:

参数名类型参数说明是否必返规范
audioStarttimefloat音频片段起始时间相对音频开始的时间距离,单位是秒
audioEndtimefloat音频片段结束时间相对音频开始的时间距离,单位是秒
audioUrlstring音频片段链接mp3格式
riskLevelstring音频片段识别结果

可能返回值:
PASS:通过

REVIEW:审核

REJECT:拒绝

riskLabel1string一级风险标签
riskLabel2string二级风险标签
riskLabel3string三级风险标签
riskDescriptionstring风险原因
riskDetailjson_object风险详情详见riskDetail参数

riskDetail#

其中,riskDetail详细内容如下:

参数名类型参数说明是否必返规范
audioTextstring音频转译文本的结果
matchedListsjson_array命中的客户自定义名单信息命中客户自定义名单时返回,详见matchedLists参数
riskSegmentsjson_array高风险内容片段在涉政、暴恐、违禁、竞品、广告法等功能的时候存在,详见riskSegments参数

matchedLists#

riskDetail中,matchedLists详细内容如下:

参数名类型参数说明是否必返规范
namestring客户自定义名单名称
wordsjson_array命中的这个名单中的敏感词信息详见words参数

words#

matchedLists中,words详细内容如下:

参数名类型参数说明是否必返规范
wordstring敏感词
positionint_array敏感词所在位置

riskSegments#

riskDetail中,riskSegments详细内容如下:

参数名类型参数说明是否必返规范
segmentstring高风险内容片段
positionint_array高风险内容片段所在位置

audioTags#

其中,audioTags详细内容如下:

参数名类型参数说明是否必返规范
genderjson_object性别标签当type取值包含GENDER时返回
timbrejson_array音色标签当type取值包含TIMBRE时返回
songint唱歌标签

当type取值包含SING时返回

可能取值:

0:没有唱歌

1:有唱歌

languagejson_object语种识别type取值包含LANGUAGE时返回

audioTags中,gender详细内容如下:

参数名类型参数说明是否必返规范
labelstring性别标签名称

可能取值:

男性

女性

probabilityint对应性别可能性大小取值0-100,数值越高表示概率越大

audioTags中,timbre详细内容如下:

参数名类型参数说明是否必返规范
labelstring音色标签类别

可能取值:

大叔音

青年音

正太音

老年音

女王音

御姐音

少女音

萝莉音

大妈音

probabilityint对应音色标签可能性大小取值0-100,数值越高表示概率越大

audioTags中,language详细内容如下:

参数名类型参数说明是否必返规范
labelint语种识别类别标识

可能取值:

0:普通话

1:英语

2:粤语

probabilityint对应音色标签可能性大小取值0-100,数值越高表示概率越大

主动查询结果#

请求URL#

集群URL支持产品列表
北京http://api-audio-bj.fengkongcloud.com/query_audio/v4中文音频文件
上海http://api-audio-sh.fengkongcloud.com/query_audio/v4中文音频文件
硅谷http://api-audio-gg.fengkongcloud.com/query_audio/v4中文音频文件
英语音频文件
阿语音频文件

字符编码#

UTF-8

请求方法#

POST

建议超时时长#

1s

请求参数#

放在HTTP Body中,采用Json格式,具体参数如下:

请求参数名类型参数说明传入说明规范
accessKeystring公司密钥必传参数由数美提供
btIdstring音频文件唯一标识必传参数唯一标识这条音频文件,用于查询识别结果

返回参数#

放在HTTP Body中,采用Json格式,具体参数如下:

参数名类型参数说明是否必返规范
requestIdstring本次请求的唯一标识
btIdstring音频唯一标识
codeint请求返回码

1100:成功

1101:正在处理中

1901:QPS超限

1902:参数不合法

1903:解码失败

9100:余额不足

9101:无权限操作

除message和requestId之外的字段,只有当code为1100时才会存在

messagestring请求返回描述,和请求返回码对应
riskLevelstring当前事件的处置建议

可能返回值:
PASS:通过

REVIEW:审核

REJECT:拒绝

建议:对接初期不直接使用结果,进行拦截尺度调优,符合预期后在进行使用

audioTextstring整段音频转译文本结果
audioTimeint整段音频的音频时长单位秒
audioDetailjson_array音频片段信息回调的音频片段信息,详见audioDetail参数
audioTagsjson_object音频标签返回性别、音色、是否唱歌等标签

audioDetail#

audioDetail内每个元素的内容如下:

参数名类型参数说明是否必返规范
audioStarttimefloat音频片段起始时间相对音频开始的时间距离,单位是秒
audioEndtimefloat音频片段结束时间相对音频开始的时间距离,单位是秒
audioUrlstring音频片段链接mp3格式
riskLevelstring音频片段识别结果

可能返回值:
PASS:通过

REVIEW:审核

REJECT:拒绝

riskLabel1string一级风险标签
riskLabel2string二级风险标签
riskLabel3string三级风险标签
riskDescriptionstring风险原因
riskDetailjson_object风险详情详见riskDetail参数

riskDetail#

其中,riskDetail详细内容如下:

参数名类型参数说明是否必返规范
audioTextstring音频转译文本的结果
matchedListsjson_array命中的客户自定义名单信息命中客户自定义名单时返回,详见matchedLists参数
riskSegmentsjson_array高风险内容片段在涉政、暴恐、违禁、竞品、广告法等功能的时候存在,详见riskSegments参数

matchedLists#

riskDetail中,matchedLists详细内容如下:

参数名类型参数说明是否必返规范
namestring客户自定义名单名称
wordsjson_array命中的这个名单中的敏感词信息详见words参数

words#

matchedLists中,words详细内容如下:

参数名类型参数说明是否必返规范
wordstring敏感词
positionint_array敏感词所在位置

riskSegments#

riskDetail中,riskSegments详细内容如下:

参数名类型参数说明是否必返规范
segmentstring高风险内容片段
positionint_array高风险内容片段所在位置

audioTags#

其中,audioTags详细内容如下:

参数名类型参数说明是否必返规范
genderjson_object性别标签当type取值包含GENDER时返回
timbrejson_array音色标签当type取值包含TIMBRE时返回
songint唱歌标签

当type取值包含SING时返回

可能取值:

0:没有唱歌

1:有唱歌

languagejson_object语种识别type取值包含LANGUAGE时返回

audioTags中,gender详细内容如下:

参数名类型参数说明是否必返规范
labelstring性别标签名称

可能取值:

男性

女性

probabilityint对应性别可能性大小取值0-100,数值越高表示概率越大

audioTags中,timbre详细内容如下:

参数名类型参数说明是否必返规范
labelstring音色标签类别

可能取值:

大叔音

青年音

正太音

老年音

女王音

御姐音

少女音

萝莉音

大妈音

probabilityint对应音色标签可能性大小取值0-100,数值越高表示概率越大

audioTags中,language详细内容如下:

参数名类型参数说明是否必返规范
labelint语种识别类别标识

可能取值:

0:普通话

1:英语

2:粤语

probabilityint对应音色标签可能性大小取值0-100,数值越高表示概率越大

示例#

上传请求示例#

curl -v 'http://api-audio-bj.fengkongcloud.com/audio/v4' -d '{
"accessKey": "*************",
"appId": "default",
"eventId": "default",
"type": "PORN_AD_POLITICS_MOAN_ABUSE_GENDER_TIMBRE_SING_LANGUAGE",
"btId": "test1",
"contentType": "URL",
"content": "*************",
"callback": "*************",
"data": {
"returnAllText": 1,
"room": "general",
"tokenId": "token-short"
}
}'

同步返回示例#

{
"code": 1100,
"message": "成功",
"requestId":" *************",
"btId":"*************"
}

回调返回示例#

{
"requestId":"6a9cb980346dfea41111656a514e9109",
"btId":"1604311839040",
"code":1100,
"message":"正常",
"riskLevel":"PASS",
"audioDetail":[
{
"audioStarttime":0,
"audioEndtime":10,
"audioUrl":"https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0000.mp3",
"riskLevel":"PASS",
"riskLabel1":"normal",
"riskLabel2":"",
"riskLabel3":"",
"riskDescription":"正常",
"riskDetail":{
"audioText":""
}
},
{
"audioStarttime":10,
"audioEndtime":20,
"audioUrl":"https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0001.mp3",
"riskLevel":"PASS",
"riskLabel1":"normal",
"riskLabel2":"",
"riskLabel3":"",
"riskDescription":"正常",
"riskDetail":{
"audioText":""
}
},
{
"audioStarttime":20,
"audioEndtime":30,
"audioUrl":"https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0002.mp3",
"riskLevel":"PASS",
"riskLabel1":"normal",
"riskLabel2":"",
"riskLabel3":"",
"riskDescription":"正常",
"riskDetail":{
"audioText":""
}
},
{
"audioStarttime":30,
"audioEndtime":40,
"audioUrl":"https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0003.mp3",
"riskLevel":"PASS",
"riskLabel1":"normal",
"riskLabel2":"",
"riskLabel3":"",
"riskDescription":"正常",
"riskDetail":{
"audioText":""
}
},
{
"audioStarttime":40,
"audioEndtime":50,
"audioUrl":"https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0004.mp3",
"riskLevel":"PASS",
"riskLabel1":"normal",
"riskLabel2":"",
"riskLabel3":"",
"riskDescription":"正常",
"riskDetail":{
"audioText":""
}
},
{
"audioStarttime":50,
"audioEndtime":60,
"audioUrl":"https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0005.mp3",
"riskLevel":"PASS",
"riskLabel1":"normal",
"riskLabel2":"",
"riskLabel3":"",
"riskDescription":"正常",
"riskDetail":{
"audioText":""
}
},
{
"audioStarttime":60,
"audioEndtime":60,
"audioUrl":"https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0006.mp3",
"riskLevel":"PASS",
"riskLabel1":"normal",
"riskLabel2":"",
"riskLabel3":"",
"riskDescription":"正常"
}
],
"audioTags":{
"gender":{
"label":"女性",
"probability":95
},
"language":[
{
"confidence":0,
"label":2
},
{
"confidence":99,
"label":0
},
{
"confidence":0,
"label":1
}
],
"song":0,
"timbre":[
{
"label":"女性",
"probability":95
},
{
"label":"女王",
"probability":12
},
{
"label":"御姐",
"probability":37
},
{
"label":"少女",
"probability":56
},
{
"label":"大妈",
"probability":67
},
{
"label":"萝莉",
"probability":24
}
]
}
}

主动查询结果请求示例#

curl -v 'http://api-audio-bj.fengkongcloud.com/query_audio/v4' -d '{
"accessKey": "*************",
"btId": "*************"
}'

主动查询结果返回示例#

{
"requestId": "6a9cb980346dfea41111656a514e9109",
"btId": "1604311839040",
"code": 1100,
"message": "正常",
"riskLevel": "PASS",
"audioDetail": [
{
"audioStarttime": 0,
"audioEndtime": 10,
"audioUrl": "https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0000.mp3",
"riskLevel": "PASS",
"riskLabel1": "normal",
"riskLabel2": "",
"riskLabel3": "",
"riskDescription": "正常",
"riskDetail": {
"audioText": ""
}
},
{
"audioStarttime": 10,
"audioEndtime": 20,
"audioUrl": "https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0001.mp3",
"riskLevel": "PASS",
"riskLabel1": "normal",
"riskLabel2": "",
"riskLabel3": "",
"riskDescription": "正常",
"riskDetail": {
"audioText": ""
}
},
{
"audioStarttime": 20,
"audioEndtime": 30,
"audioUrl": "https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0002.mp3",
"riskLevel": "PASS",
"riskLabel1": "normal",
"riskLabel2": "",
"riskLabel3": "",
"riskDescription": "正常",
"riskDetail": {
"audioText": ""
}
},
{
"audioStarttime": 30,
"audioEndtime": 40,
"audioUrl": "https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0003.mp3",
"riskLevel": "PASS",
"riskLabel1": "normal",
"riskLabel2": "",
"riskLabel3": "",
"riskDescription": "正常",
"riskDetail": {
"audioText": ""
}
},
{
"audioStarttime": 40,
"audioEndtime": 50,
"audioUrl": "https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0004.mp3",
"riskLevel": "PASS",
"riskLabel1": "normal",
"riskLabel2": "",
"riskLabel3": "",
"riskDescription": "正常",
"riskDetail": {
"audioText": ""
}
},
{
"audioStarttime": 50,
"audioEndtime": 60,
"audioUrl": "https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0005.mp3",
"riskLevel": "PASS",
"riskLabel1": "normal",
"riskLabel2": "",
"riskLabel3": "",
"riskDescription": "正常",
"riskDetail": {
"audioText": ""
}
},
{
"audioStarttime": 60,
"audioEndtime": 60,
"audioUrl": "https://voice-bj-1251671073.cos.ap-beijing.myqcloud.com/20201102/6a9cb980346dfea41111656a514e9109_a0006.mp3",
"riskLevel": "PASS",
"riskLabel1": "normal",
"riskLabel2": "",
"riskLabel3": "",
"riskDescription": "正常"
}
],
"audioTags": {
"gender": {
"label": "女性",
"probability": 95
},
"language": [
{
"confidence": 0,
"label": 2
},
{
"confidence": 99,
"label": 0
},
{
"confidence": 0,
"label": 1
}
],
"song": 0,
"timbre": [
{
"label": "女性",
"probability": 95
},
{
"label": "女王",
"probability": 12
},
{
"label": "御姐",
"probability": 37
},
{
"label": "少女",
"probability": 56
},
{
"label": "大妈",
"probability": 67
},
{
"label": "萝莉",
"probability": 24
}
]
}
}

Demo#

目前提供了 go、java、lua、nodes、php、python 的 demo,代码位置:https://github.com/ishumei/api-demo/tree/master/v4

购买咨询