异步检测#
音频检测接口,可协助您识别音频中的涉政、色情、广告、暴恐等风险;同时可结合您的业务场景,识别未成年、音色、等内容。
接口说明#
异步检测接口,可返回识别结果。建议使用http协议接口调用。
音频要求#
音频类型:URL、BASE64。 音频格式:WAV、MP3、AAC、AMR、3GP、M4A、WMA、OGG、APE、FLAC、ALAC、WAVPACK、SILK_V3等。 音频大小:接口限制为18M。 音频地址:建议音频下载从CDN源站下载,并且源站不能为单点,否则可能存在音频下载失败,导致无法审核。
审核时间#
建议超时时间:同步请求接口建议设置10秒;异步批量请求接口建议设置5秒。 内部检测逻辑:音频检测接口的响应时间依赖音频的下载时间,请保证被检测音频所在的存储服务稳定可靠。具体时长和请求type、音频大小相关。
请求#
请求地址#
请求参数#
参数名称 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
accessKey | string | 公司密钥 | 是 | 由数美提供,具体内容见邮件。 |
appId | string | 应用标识 | 是 | 用于区分应用,需要联系数美服务开通,请使用数美单独提供的传值为准,默认内容见邮件。 |
eventId | string | 事件标识 | 是 | 用于区分场景数据,需要联系数美服务开通,请使用数美单独提供的传值为准,默认内容见邮件。 |
type | string | 检测的风险类型 | 否 | businesstype和type必传其一 AUDIOPOLITICAL:一号领导人声纹识别 POLITY:涉政识别 EROTIC:色情识别 ADVERT:广告识别 ADLAW:广告法识别 BAN:违禁识别 VIOLENT:暴恐识别 ANTHEN:国歌识别 MOAN:娇喘识别 DIRTY:辱骂识别 BANEDAUDIO:违禁歌曲 COPYRIGHTSONGS:版权歌曲 如需做组合识别,通过下划线连接即可,例如POLITY_EROTIC_MOAN涉政、色情和娇喘识别 建议传入: POLITY_EROTIC_MOAN_ADVERT。 |
businessType | string | 检测的业务标签类型 | 否 | type和 businessType 必须填其一 可选值: SING:唱歌识别 LANGUAGE:语种识别 GENDER:性别识别 TIMBRE:音色识别 VOICE:人声属性 MINOR:未成年识别 AUDIOSCENE:声音场景 AGE:年龄识别 如需识别音色、唱歌、语种GENDER必传 |
translationTargetLang | string | 翻译目标语种 | 否 | 将输入的文本翻译成目标语种。如需开通使用请联系数美商务 可选值: zh:中文 en:英文 |
contentType | string | 待识别音频内容的格式 | 是 | 可选值: URL:识别内容为音频url地址; RAW:识别内容为音频的base64编码数据 |
content | string | 待识别的音频内容 | 是 | 可以为url地址或者base64编码数据。 其中,base64编码数据上限15M,仅支持pcm、wav、mp3格式, 并且pcm格式数据必须采用16-bit小端序编码。推荐使用pcm、wav格式传输 |
btId | string | 音频文件唯一标识 | 是 | 唯一标识这条音频文件,方便将回调结果对应上,超过128位将被截断,不能重复 |
callback | string | 回调http接口 | 否 | 当该字段非空时,服务将根据该字段回调通知用户审核结果 |
acceptLang | string | 返回标签的语种类型 | 否 | 选择返回标签的语种类型 可选值: zh:中文 en:英文 不传入默认为返回中文标签 |
data | object | 是 | 请求的数据内容,data字段长度最长1MB | |
tokenId | string | 用户账号 | 否 | 用于用户行为分析,建议传入用户UID |
formatInfo | string | 音频数据格式 | 否 | 当音频内容格式为RAW时必须存在,可选值:pcm、wav、mp3 |
rate | int | 音频数据采样率 | 否 | 当音频数据格式为pcm时必须存在,范围限制8000-32000 |
track | int | 音频数据声道数 | 否 | 当音频数据格式为pcm时必须存在,可选值: 1: 单声道 2: 双声道 |
returnAllText | int | 返回音频片段的等级 | 否 | 可选值如下(默认为0): 0:返回风险片段识别结果 1:返回所有片段识别结果 该参数仅用于控制片段识别结果的返回,不影响整体识别结果的返回。 当选择“返回所有片段识别结果”时,片段识别结果中包含riskLevel为PASS、REVIEW和REJECT的片段识别结果; 当选择“返回风险片段识别结果”时,片段识别结果中仅包含riskLevel为REVIEW和REJECT的片段识别结果; 片段识别结果对应回调或者查询响应中的audioDetail字段。 |
audioDetectStep | int | 间隔审核步长 | 否 | 间隔审核步长,取值范围为1-36整数,取1表示跳过一个10S的音频片段审核,取2表示跳过两个,以此类推,不使用该功能时音频内容全部过审。 启用该功能时,建议开启returnAllText,采用每个片段的ASR识别结果。 |
receiveTokenId | string | 私聊场景下消息接收者的tokenId | 否 | 由数字、字母、下划线、短杠组成的长度小于等于64位的字符串 |
lang | string | 音频语言类型 | 否 | 可选值如下(默认值为zh): zh:中文 en:英文 ar:阿拉伯语 hi:印地语 es:西班牙语 fr:法语 ru:俄语 pt:葡萄牙语 id:印尼语 de:德语 ja:日语 tr:土耳其语 vi:越南语 it:意大利语 th:泰语 tl:菲律宾语 ko:韩语 ms:马来语 |
deviceId | string | 数美设备指纹标识 | 否 | 数美设备指纹生成的设备唯一标识 |
room | string | 房间号 | 否 | 房间号,建议传入 |
dataId | string | 数据标识 | 否 | 数据标识 |
ip | string | ipv4或ipv6地址 | 否 | 发送该音频的用户公网ip地址 |
level | int | 用户等级,针对不同等级的用户可配置不同拦截策略 | 否 | 可选值: 0:最低级用户,典型如新注册、完全不活跃或等级为0的用户等; 1:较低级用户,典型如低活跃或低等级用户等; 2:中等级用户,典型如具备一定活跃或等级中等的用户等; 3:较高级用户,典型如高活跃或高等级用户等; 4:最高级用户,典型如付费用户、VIP用户等 |
gender | string | 用户性别 | 否 | 可选值: male:男性 female:女性 |
extra | json object | 辅助参数 | 否 | |
passThrough | json_object | 透传字段 | 否 | 透传字段,该字段下所有内容会通过回调返回。 |
响应#
返回参数#
以下参数,除code、message、requestId以外,其他必返参数均为在code返回1100时为必返。