请求接口#

视频流检测接口，可识别：截帧画面中，涉政、色情、广告，暴恐等监管风险；同时可结合您的业务场景，识别人脸、LOGO、动植物等业务内容。音频片段中，涉政、色情、广告等监管风险；同时可结合您的业务场景，识别性别，音色，未成年等业务内容。

接口说明#

接口用于提交视频流鉴定等相关信息，稳定拉流后将持续回调对应的识别结果至指定的callback地址。

接口要求#

通信协议：http或https协议请求方法：POST方法字符编码：utf-8 参数格式：所有请求参数和返回参数都是采用json格式

支持协议#

普通流地址，目前支持rtmp、rtmps、hls、http、https协议,支持flv,m3u8等格式。

回调机制#

当用户收到推送结果，并返回HTTP状态码为200时，表示推送成功；否则系统将进行重试推送（直至达到重试次数上限）重试逻辑为间隔[5,10,15,20,25,30,35,40,45,50,55,60]秒后重试，12次之后依然失败则不在重试

重试拉流机制#

为防止网络异常导致的拉流失败问题发生，数美视频流服务设置了拉流失败后的重试机制，具体机制如下：普通流、即构/腾讯/火山流：总共会重试12次，每次持续五分钟，时间间隔为【5、10、15、20.....60秒】。例如，数美会先进行5分钟的持续拉流，拉不到的话，间隔5秒后再持续5分钟拉流，如果还拉不到则间隔10秒后再次进行5分钟拉流，以此类推。声网流：无重试，拉流5分钟超时后断开。

超时时间#

建议超时时间：7s 内部处理的超时时间为3s，且会重试一次。正常接口返回时间100ms之内

历史版本#

历史版本

请求#

请求地址#

集群	请求地址	支持产品列表
上海视频流集群	http://api-videostream-sh.fengkongcloud.com/videostream/v4	中文视频流
新加坡视频流集群	http://api-videostream-xjp.fengkongcloud.com/videostream/v4	中文视频流英语视频流阿语视频流

请求参数#

参数名称	类型	是否必传	最大长度	参数说明
accessKey	string	是	20	公司密钥。用于权限认证，开通服务时由数美提供
eventId	string	是	64	事件标识。需要与数美约定好取值。
appId	string	是	64	应用标识。此字段强校验，需要提前与数美约定好取值。
imgType	string	否	64	视频流中的画面需要识别的监管类型，和imgBusinessType至少传一个。可选值： POLITY：涉政识别 EROTIC：色情&性感违规识别 VIOLENT：暴恐&违禁识别 QRCODE：二维码识别 ADVERT：广告识别 IMGTEXTRISK：图片文字违规识别如果需要识别多个功能，通过下划线连接，如POLITY_QRCODE_ADVERT用于涉政、二维码和广告组合识别
audioType	string	否	64	视频流中的音频需要识别的监管类型，和audioBusinessType至少传一个。可选值： POLITY：涉政识别 EROTIC：色情识别 ADVERT：广告识别 BAN：违禁识别 VIOLENT：暴恐识别 DIRTY: 辱骂识别 ADLAW:广告法 MOAN：娇喘识别 AUDIOPOLITICAL：一号领导人声纹识别 ANTHEN：国歌识别 BANEDAUDIO：违禁歌曲 NONE：不检测音频如需做组合识别，通过下划线连接即可，例如POLITY_EROTIC用于涉政和色情识别
imgBusinessType	string	否	128	视频流中的画面需要识别的业务类型，和imgType至少传一个，可选值见业务标签类型
audioBusinessType	string	否	128	视频流中的音频业务识别类型，和audioType至少传一个。可选值： SING：唱歌识别 LANGUAGE：语种识别（中文、英文、粤语、藏语、维吾尔语、朝鲜语、蒙语、其他） MINOR：未成年人识别 GENDER：性别识别 TIMBRE：音色识别 VOICE：人声属性 AUDIOSCENE：声音场景 AGE：年龄识别 APPNAME：app名称识别如需识别音色、唱歌、语种，需要同时传入GENDER才能生效，如果需要识别多个功能，通过下划线连接
imgCallback	string	是	1024	图片回调地址将视频流中截帧图片的检测结果通过该地址回调给用户
audioCallback	string	否	1024	音频回调地址将视频流中音频片段的检测结果通过该地址回调给用户；需要识别音频时必传
data	object	是	-	请求的数据内容，大小不超过1M
streamType	string	是	-	视频流类型可选值为： NORMAL：普通流地址，目前支持rtmp、rtmps、hls、http、https协议 AGORA：声网审核 TRTC:腾讯审核 ZEGO：即构审核 VOLC：火山引擎审核 ALI：阿里云审核注意：使用RTC的SDK录制方案的时候，可能会在RTC侧产生额外的录制费用，具体费用请咨询相关RTC厂商
tokenId	string	是	64	用户账号标识。建议传入用户ID，可用于灌水、广告等行为维度的风险识别。
anchorName	string	否	-	主播名称，一般用于人审需要字段
audioDetectStep	int32	否	-	视频流中的音频审核步长。单位为个，取值范围为1-36整数，取1表示跳过一个10S的音频片段审核，取2表示跳过二个，以此类推。不使用该功能时音频内容全部过审
detectFrequency	int32	否	-	视频流中的画面截帧频率间隔。单位为秒，取值范围为1~60秒，遇到小数向下取整，不足1的按照1秒处理，如不传递默认3秒截帧一次。
detectStep	int32	否	-	视频流截帧图片检测步长。已截帧图片每个步长只会检测一次，取值大于等于1。不使用该功能时所有截帧全部过审
deviceId	string	否	128	数美设备指纹标识。由数美SDK生成，用于用户行为分析。
gender	string	否	-	用户性别，建议值： male：男性 female：女性 ambiguity：性别不明
imgBusinessDetectStep	int32	否	-	图片业务标签检测步长。每个步长只会检测一次imgBusinessType，取值大于等于1。< >默认值=1，代表所有片段都审核业务标签。
imgCompareBase	string	否	1024	要检测比对的基准图片。请求参数businessType字段包含标签`FACECOMPARE`时存在图片的url链接支持格式： jpg，jpeg，png，webp，gif，tiff，tif，heif 建议图片像素不小于256*256 基准图暂时不支持动图格式
ip	string	否	64	客户端公网IP地址。该参数用于IP维度的用户行为分析。
lang	string	否	-	语言类型。可指定对截帧及音频片段中文字内容检测的语种类型（默认为中文），可选值： zh：中文 en：英文 ar：阿拉伯语 hi：印地语 es：西班牙语 fr：法语 ru：俄语 pt：葡萄牙语 id：印尼语 de：德语 ja：日语 tr：土耳其语 vi：越南语 it：意大利语 th：泰语 tl：菲律宾语 ko：韩语 ms：马来语 auto:自动语种识别，需要找数美开通拦截标准
level	int32	否	-	用户等级，针对不同等级的用户可配置不同拦截策略。可选值：0：最低级用户，典型如新注册、完全不活跃或等级为0的用户等; 1：较低级用户，典型如低活跃或低等级用户等； 2：中等级用户，典型如具备一定活跃或等级中等的用户等； 3：较高级用户，典型如高活跃或高等级用户等； 4：最高级用户，典型如付费用户、VIP用户等
liveCover	string	否	-	直播封面直播封面，一般用于人审需要字段
liveTitle	string	否	-	直播标题直播标题，一般用于人审需要字段
receiveTokenId	string	否	64	消息接收者的tokenId由数字、字母、下划线、短杠组成的长度小于等于64位的字符串
returnAllImg	int32	否	-	返回截帧识别结果的风险等级。可选值如下：(默认值为0) 0：返回风险等级为非pass的图片审核信息。 1：返回所有风险等级的图片审核信息。
returnAllText	int32	否	-	返回音频识别结果的风险等级。可选值如下（默认为0）： 0：返回风险等级为非pass的音频片段与文本内容。 1：返回所有风险等级的音频片段与文本内容。
returnFinishInfo	int32	否	-	视频流结束回调通知。可选值如下：（默认值为0） 1：审核结束时发起结束通知，回调参数增加statCode状态码。 0：审核结束时不发送结束通知。
returnPreAudio	int32	否	-	是否返回前一片段信息。可选值如下： 1：返回的preAudioUrl字段包含前10秒和当前10秒共20秒的音频片段链接。 0：不返回前一片段信息。
returnPreText	int32	否	-	是否返回前一片段文本信息。可选值如下： 1：返回的content字段包含前10秒和当前10秒共20秒的音频片段文本内容 0：不返回前一片段文本信息。
room	string	否	64	直播间/游戏房间编号，可针对单个房间制定不同的策略
streamName	string	否	64	视频流名称用于后台界面展示，建议传入
url	string	否	600	要检测的视频流的普通流的url地址
agoraParam	object	否	-	声网录制参数（当streamType为AGORA时必传）
appId	string	是	64	声网提供的应用标识
channel	string	是	64	声网提供的频道名
channelProfile	int32	否	32	声网录制的频道模式，取值： 0: 通信（默认），即常见的 1 对 1 单聊或群聊，频道内任何用户可以自由说话； 1: 直播，有两种用户角色: 主播和观众。
enableH265Support	boolean	否	-	是否支持录制H.265视频流。 false：（默认）不支持录制 H.265 视频流。频道内的远端用户无法发 H.265 视频流。 true：支持录制 H.265 视频流。
enableIntraRequest	boolean	否	-	是否启用关键帧请求。该参数默认为true，可改善弱网下的音视频体验。如需使单流模式下录制的视频可指定播放位置，须将enableIntraRequest设为 false。 false：禁用关键帧请求，频道内的所有发流端均每2秒发送一次关键帧。禁用后，单流模式下录制的视频可指定播放位置。 true：由发流端控制是否启用关键帧请求。启用后，单流模式下录制的视频文件播放时无法指定播放位置。
subscribeMode	string	否	-	订阅模式。 AUTO: 自动订阅房间内的所有流，不设置subscribeMode时候的默认行为 UNTRUSTED: 配合untrustedUserIdList只订阅该列表指定的用户流，此种模式下如果untrustedUserIdList列表为空，参数错误，因为无法订阅任何流 TRUSTED: 配合trustedUserIdList只订阅该列表以外的用户流，此种模式下如果一定时间下没有trustedUserIdList名单外的用户进入房间，即untrustedUserIdList列表为空，数美将主动结束审核。
token	string	否	64	安全要求较高的用户可以使用 token进行认证，生成方式详见声网文档：(https://docs.agora.io/cn/Recording/token_server?platform=CPP) >建议将token的有效期设置超过频道的持续时间，防止token失效导致无法拉流。当前声网支持的最大token有效期为24小时，因此当频道持续时间超过24小时的时候，需要处理token失效的问题。处理方法：在请求参数中设置开启音频流结束回调通知（设置returnFinishInfo为1）。当回调接收到审核结束通知（statCode为1），并且原因是由于拉流的token无效或过期，如果频道仍然存在并且需要继续审核，则生成新的token，将频道重新送审。
uid	int32	否	64	32位无符号整数。当token存在时，必须提供生成token时所使用的用户ID。注意，此处需要区别实际房间中的用户uid，提供给服务端录制所用的uid不允许在房间中存在
trustedUserIdList	array	否	-	信任用户的列表，subscribeMode为TRUSTED时生效，不允许为空，数美不会订阅房间内该列表指定的用户流逗号拼接的UID数组，如[1,2]，用户上限17个
untrustedUserIdList	array	否	-	非信任用户的列表，subscribeMode为UNTRUSTED时生效，不允许为空，数美只订阅房间内该列表指定的用户流逗号拼接的UID数组，如[1,2]，用户上限17个
aliParam	object	否	-	阿里引擎录制参数（当streamType为ALI时必传）
room	string	是	64	房间ID，需要和生成token使用的的channelID完全一致。服务端以房间为单位拉流录制。room为唯一标志，相同的room不会重复拉流。
token	string	是	64	用于拉流端加入频道，生成方式详见文档：https://help.aliyun.com/zh/live/user-guide/token-based-authentication，每次上传审核都需要重新生成新的token。
userId	int32	否	32	阿里用户账号标识。
extra	object	否	-	辅助信息
passThrough	object	否	1024	客户传入透传字段。数美内部不会对该字段进行识别处理，随结果返回给用户。
trtcParam	object	否	-	腾讯录制参数（当streamType为TRTC时必传）
appScene	int32	是	1	应用场景，可选值： 0：视频通话场景 1：视频直播场景，默认值：0。详见：https://cloud.tencent.com/document/product/647/79634#45c6782b29cadc377b5763a5d8490340
demoSences	int32	是	-	录制类型可选值: 分流录制:2 合流录制:4
sdkAppId	int32	是	64	腾讯提供的sdkAppId
strRoomId	string	是	128	房间号码。取值说明：只允许包含（a-zA-Z），数字(0-9)以及下划线和连词符若您选用strRoomId时，需注意strRoomId和roomId两者都有值优先选用roomId
userId	string	是	32	分配给录制端的userId，限制长度为32bit，只允许包含（a-zA-Z），数字(0-9)以及下划线和连词符
userSig	string	是	128	录制userId对应的验证签名，相当于登录密码
roomId	int32	否	10	房间号码。取值范围：【1-4294967294】roomId与strRoomId必传一个，若两者都有值优先选用roomId 注意：目前一个房间最多只能审核8个用户
volcParam	object	否	-	火山引擎录制参数（当streamType为VOLC时必传）
appId	string	是	64	火山提供的应用标识
roomId	string	是	128	房间号
token	string	是	64	录制userId对应的验证签名，相当于登录密码
userId	string	是	32	分配给录制段的userId，限制长度为32bit，只允许包含（a-zA-Z），数字(0-9)以及下划线和连词符
zegoParam	object	否	-	即构录制参数（当streamType为ZEGO时必传）
roomId	string	是	64	zego的房间号
tokenId	string	是	64	zego提供的身份验证信息，获取zego的identify_token用于登录，生成方式详见zego文档：https://doc-zh.zego.im/article/15258 注意tokenId是唯一标识上传鉴黄每一次请求都需要重新生成新的
acceptLang	string	否	-	选择返回标签的语种类型可选值： zh：中文 en：英文不传入默认为返回中文标签

响应#

返回参数#

参数名称	类型	是否必返	参数说明
requestId	string	是	数美请求唯一标识
message	string	是	和code对应： 1100：成功 1901：QPS超限 1902：参数不合法 1903：服务失败 1904 : 流路数超限 9101：无权限操作
code	int32	是	1100：成功 1901：QPS超限 1902：参数不合法 1903：服务失败 1904 : 流路数超限 9101：无权限操作
detail	object	否
dupRequestId	string	否	表示重复的requestId 当errorcode为1001，表示重复推流时，会返回dupRequestId字段例如当第一次请求的时候没有收到返回，但该音频流实际已经开始审核了，没有requestId无法主动关闭审核可以再次请求，收到重复推流的信息，通过返回的dupRequestId调用关闭审核接口
errorcode	int32	否	1001：重复推流

流片段回调参数#

以下参数，除code、message、requestId以外，其他必返参数均为在code返回1100时为必返。

参数名称	类型	是否必返	参数说明
requestId	string	是	数美请求唯一标识
message	string	是	和code对应： 1100：成功 1901：QPS超限 1902：参数不合法 1903：服务失败 1904 : 流路数超限 9101：无权限操作
code	int32	是	1100：成功 1901：QPS超限 1902：参数不合法 1903：服务失败 1904 : 流路数超限 9101：无权限操作
statCode	int32	否	回调状态码。状态码对应关系： 0 ：审核结果回调 1 ：流结束结果回调
contentType	int32	否	用来区分音频和图片回调。可能取值如下： 1：该回调为图片回调 2：该回调为音频回调
auxInfo	object	否	辅助信息，请求参数data中extra的passThrough放入该值返回
passThrough	object	否	客户传入透传字段。数美内部不会对该字段进行识别处理，随结果返回给用户。
frameDetail	object	否	截帧图片信息风险详情。有风险片段或returnAllImg=1时返回
imgUrl	string	是	截帧图片地址
riskDescription	string	是	标签解释对于命中用户自定义名单时返回：命中自定义名单；当riskLevel为PASS时返回正常；其他情况展现形式为一级标签：二级标签：三级标签的中文名，仅供人了解风险原因时作为参考，程序请勿依赖该参数的值做逻辑处理
riskLabel1	string	是	一级风险标签，当riskLevel为PASS时返回normal
riskLabel2	string	是	二级风险标签,当riskLevel为PASS时为空
riskLabel3	string	是	三级风险标签, 当riskLevel为PASS时为空
riskLevel	string	是	识别结果，可能返回值： PASS：正常，建议直接放行 REVIEW：可疑，建议人工审核 REJECT：违规，建议直接拦截
allLabels	array	是	全部的风险标签列表
probability	float	否	置信度。可选值在0～1之间，值越大，可信度越高
riskDescription	string	否	当riskLevel为PASS时返回正常；其他情况展现形式为："一级标签:二级标签:三级标签"的中文名仅供人了解风险原因时作为参考，程序请勿依赖该参数的值做逻辑处理
riskLabel1	string	否	一级风险标签
riskLabel2	string	否	二级风险标签
riskLabel3	string	否	三级风险标签
riskLevel	string	否	识别结果，可能返回值： PASS：正常，建议直接放行 REVIEW：可疑，建议人工审核 REJECT：违规，建议直接拦截
riskDetail	object	否	风险详情信息
riskSource	int32	是	风险来源，可能取值： 1000：无风险 1001：文字风险 1002：视觉图片风险
face_num	int32	否	人脸数量
person_num	int32	否	人像数量
faces	array	否	图片中涉政人物的名称及位置信息。当命中人脸-人脸类型-多人脸时，数组元素会有多个，最多10（如果超过10个，选择probability最高的10个）
face_ratio	float	否	人脸占比，在区间0-1，数值越大，人脸占比越高
id	string	否	编号，图片同一个位置下的人在不同标签下的编号相同。如果同一个人在图片中出现n次，分配n个ID
name	string	否	人物名称
probability	float	否	置信度。可选值在0～1之间，值越大，可信度越高
location	array	否	人物位置信息，该数组有四个值，分别代表左上角的坐标和右下角的坐标。例如[207,522,340,567] 207代表的是左上角的x坐标 522代表左上角的y坐标 340代表的是右下角的x坐标 567代表的是右下角的y坐标
objects	array	否	物品信息。返回图片中标识或物品的名称及位置信息
id	string	否	物品或标识编号，保证同一个位置下的物品在不同标签下的编号相同
name	string	否	物品名称
probability	float	否	置信度。可选值在0～1之间，值越大，可信度越高
qrContent	string	否	返回图片中识别的二维码地址
location	array	否	物品位置信息该数组有四个值，分别代表左上角的坐标和右下角的坐标。例如[207,522,340,567] 207代表的是左上角的x坐标 522代表左上角的y坐标 340代表的是右下角的x坐标 567代表的是右下角的y坐标
ocrText	object	否	返回图片中文字识别内容，当请求参数imgType字段包含IMGTEXTRISK或ADVERT时存在
text	string	是	图片中识别出的文字
matchedLists	array	否	命中的客户自定义名单信息仅在命中客户自定义名单时返回
name	string	否	命中的名单名称
words	array	否	命中的这个名单中的敏感词信息
word	string	否	命中的敏感词
position	array	否	敏感词所在位置
riskSegments	array	否	高风险片段内容。检测图片包含涉政、暴恐、违禁、竞品、广告法等风险内容的时候存在
segment	string	否	辅助信息高风险内容片段
position	array	否	高风险内容片段所在位置下标从0开始计数
persons	array	否	图片中人物的名称及位置信息。当命中'人像-多人'标签时，数组元素会有多个，最多10（如果超过10个，选择probability最高的10个）
id	string	否	编号，保证同一个人在不同标签下的编号相同。如果同一个人在图片中出现n次，分配n个ID
person_ratio	float	否	人像占比。在区间0-1，数值越大，人脸占比越高
probability	float	否	置信度。可选值在0～1之间，值越大，可信度越高
location	array	否	人像位置坐标
auxInfo	object	是	辅助信息
beginProcessTime	int32	是	开始处理的时间（13位时间戳）
finishProcessTime	int32	是	结束处理的时间（13位时间戳）
detectType	int32	否	用来区分截帧图片是否过了检测可能取值如下：（仅当请求参数传了detectStep时才会返回该参数） 1：截帧图片过了检测 2：截帧图片没过检测
imgTime	string	否	截帧图片发生时间视频流截帧图片违规发生的时间（绝对时间）
room	string	否	房间号
similarityDedup	int32	否	辅助参数。可能取值如下：（仅当相似帧去重推审功能生效时，将外层riskLevel从reject/review变成pass时返回该参数，其他情况不返回该字段）值为1，相似帧去重推审功能生效
strUserId	string	否	用户标识，用于区分房间内违规用户，与请求参数中的userId无关，分流的用户id。以下情况会返回该字段： ZEGO流按房间号审核。 TRTC流分流审核。 VOLC流审核。 ALI流审核。
userId	int32	否	声网用户账号标识。仅分流情况下存在，返回的userId是实际房间中的用户id，与请求参数中的uid无关。
riskDetail	object	是	风险详情信息
riskSource	int32	是	风险来源，可能取值： 1000：无风险 1001：文字风险 1002：视觉图片风险
face_num	int32	否	人脸数量
person_num	int32	否	人像数量
faces	array	否	图片中涉政人物的名称及位置信息。当命中人脸-人脸类型-多人脸时，数组元素会有多个，最多10（如果超过10个，选择probability最高的10个）
face_ratio	float	否	人脸占比，在区间0-1，数值越大，人脸占比越高
id	string	否	编号，图片同一个位置下的人在不同标签下的编号相同。如果同一个人在图片中出现n次，分配n个ID
name	string	否	人物名称
probability	float	否	置信度。可选值在0～1之间，值越大，可信度越高
location	array	否	人物位置信息，该数组有四个值，分别代表左上角的坐标和右下角的坐标。例如[207,522,340,567] 207代表的是左上角的x坐标 522代表左上角的y坐标 340代表的是右下角的x坐标 567代表的是右下角的y坐标
objects	array	否	物品信息。返回图片中标识或物品的名称及位置信息
id	string	否	物品或标识编号，保证同一个位置下的物品在不同标签下的编号相同
name	string	否	物品名称
probability	float	否	置信度。可选值在0～1之间，值越大，可信度越高
qrContent	string	否	返回图片中识别的二维码地址
location	array	否	物品位置信息该数组有四个值，分别代表左上角的坐标和右下角的坐标。例如[207,522,340,567] 207代表的是左上角的x坐标 522代表左上角的y坐标 340代表的是右下角的x坐标 567代表的是右下角的y坐标
ocrText	object	否	返回图片中文字识别内容，当请求参数imgType字段包含IMGTEXTRISK或ADVERT时存在
text	string	是	图片中识别出的文字
matchedLists	array	否	命中的客户自定义名单信息仅在命中客户自定义名单时返回
name	string	否	命中的名单名称
words	array	否	命中的这个名单中的敏感词信息
word	string	否	命中的敏感词
position	array	否	敏感词所在位置
riskSegments	array	否	高风险片段内容。检测图片包含涉政、暴恐、违禁、竞品、广告法等风险内容的时候存在
segment	string	否	辅助信息高风险内容片段
position	array	否	高风险内容片段所在位置下标从0开始计数
persons	array	否	图片中人物的名称及位置信息。当命中'人像-多人'标签时，数组元素会有多个，最多10（如果超过10个，选择probability最高的10个）
id	string	否	编号，保证同一个人在不同标签下的编号相同。如果同一个人在图片中出现n次，分配n个ID
person_ratio	float	否	人像占比。在区间0-1，数值越大，人脸占比越高
probability	float	否	置信度。可选值在0～1之间，值越大，可信度越高
location	array	否	人像位置坐标
businessLabels	array	否	业务标签列表
businessDescription	string	是	业务标签中文描述，格式为"一级标签:二级标签:三级标签"的中文名称
businessLabel1	string	是	一级业务标签
businessLabel2	string	是	二级业务标签
businessLabel3	string	是	三级业务标签
probability	float	是	置信度。可选值在0～1之间，值越大，可信度越高
confidenceLevel	int32	否	置信等级，可选值在0～2之间，值越大，可信度越高
businessDetail	object	否	业务标签详情
face_num	int32	否	人脸数量
person_num	int32	否	人像数量
faces	array	否	图片中涉政人物的名称及位置信息。当命中人脸-人脸类型-多人脸时，数组元素会有多个，最多10（如果超过10个，选择probability最高的10个）
face_ratio	float	否	人脸占比，在区间0-1，数值越大，人脸占比越高
id	string	否	编号，图片同一个位置下的人在不同标签下的编号相同。如果同一个人在图片中出现n次，分配n个ID
name	string	否	人物名称
probability	float	否	置信度。可选值在0～1之间，值越大，可信度越高
location	array	否	人物位置信息，该数组有四个值，分别代表左上角的坐标和右下角的坐标。例如[207,522,340,567] 207代表的是左上角的x坐标 522代表左上角的y坐标 340代表的是右下角的x坐标 567代表的是右下角的y坐标
objects	array	否	物品信息。返回图片中标识或物品的名称及位置信息
id	string	否	物品或标识编号，保证同一个位置下的物品在不同标签下的编号相同
name	string	否	物品名称
probability	float	否	置信度。可选值在0～1之间，值越大，可信度越高
qrContent	string	否	返回图片中识别的二维码地址
location	array	否	物品位置信息该数组有四个值，分别代表左上角的坐标和右下角的坐标。例如[207,522,340,567] 207代表的是左上角的x坐标 522代表左上角的y坐标 340代表的是右下角的x坐标 567代表的是右下角的y坐标
persons	array	否	图片中人物的名称及位置信息。当命中'人像-多人'标签时，数组元素会有多个，最多10（如果超过10个，选择probability最高的10个）
id	string	否	编号，保证同一个人在不同标签下的编号相同。如果同一个人在图片中出现n次，分配n个ID
person_ratio	float	否	人像占比。在区间0-1，数值越大，人脸占比越高
probability	float	否	置信度。可选值在0～1之间，值越大，可信度越高
location	array	否	人像位置坐标
audioDetail	object	否	音频片段信息。有风险片段或returnAllText=1时返回
audioUrl	string	是	音频片段地址。
riskDescription	string	是	标签解释对于命中用户自定义名单时返回：命中自定义名单；当riskLevel为PASS时返回正常；其他情况展现形式为一级标签：二级标签：三级标签的中文名，仅供人了解风险原因时作为参考，程序请勿依赖该参数的值做逻辑处理
riskLabel1	string	是	一级风险标签，当riskLevel为PASS时返回normal
riskLabel2	string	是	二级风险标签,当riskLevel为PASS时为空
riskLabel3	string	是	三级风险标签, 当riskLevel为PASS时为空
riskLevel	string	是	识别结果，可能返回值： PASS：正常，建议直接放行 REVIEW：可疑，建议人工审核 REJECT：违规，建议直接拦截
vadCode	int32	是	是否静音片段。 0：静音片段 1：非静音片段
allLabels	array	是	全部的风险标签列表
riskDescription	string	是	风险描述。当riskLevel为PASS时返回：正常。格式为："一级风险标签：二级风险标签：三级风险标签"，的中文名称。对于命中用户自定义名单时返回：命中自定义名单。
riskLabel1	string	是	一级风险标签，当riskLevel为PASS时返回normal
riskLabel2	string	是	二级风险标签,当riskLevel为PASS时为空
riskLabel3	string	是	三级风险标签, 当riskLevel为PASS时为空
riskLevel	string	是	识别结果，可能返回值： PASS：正常，建议直接放行 REVIEW：可疑，建议人工审核 REJECT：违规，建议直接拦截
riskDetail	object	否	每一段内容的风险详情，如果type为NOVEL才返回。如果returnHtml参数为true只返回REJECT和REVIEW的风险内容片段，如果returnHtml参数为false会返回全部内容片段（包括REJECT和REVIEW和PASS）。<br/>
riskSource	int32	是	风险来源，可能取值： 1000：无风险 1001：文字风险 1002：视觉图片风险 1003：音频语音风险
audioText	string	否	该片段识别的文字内容
matchedLists	array	否	命中的客户自定义名单信息仅在命中客户自定义名单时返回
name	string	否	名单名称
words	array	否	命中的这个名单中的敏感词信息
word	string	否	命中的敏感词
position	array	否	高风险内容片段所在位置下标从0开始计数
riskSegments	array	否	高风险片段内容。检测图片包含涉政、暴恐、违禁、竞品、广告法等风险内容的时候存在
segment	string	否	辅助信息高风险内容片段
position	array	否	高风险内容片段所在位置下标从0开始计数
content	string	否	视频流中音频识别出的文字内容。当returnPreText值为1，且当前音频片段为reject时，返回当前10秒和前10秒共20秒的音频片段文本内容。否则仅返回当前片段文本内容。
preAudioUrl	string	否	前一个音频片段链接。当returnPreAudio值为1，且当前音频片段为reject时，返回当前10秒和前10秒共20秒的音频片段链接。否则不返回。
auxInfo	object	否	辅助信息
audioEndTime	string	是	违规内容结束时间（绝对时间）
audioStartTime	string	是	违规内容开始时间（绝对时间）
beginProcessTime	int32	是	开始处理的时间（13位时间戳）
finishProcessTime	int32	是	结束处理的时间（13位时间戳）
room	string	否	房间号
strUserId	string	否	用户标识，用于区分房间内违规用户，与请求参数中的userId无关，分流的用户id。以下情况会返回该字段： ZEGO流按房间号审核。 TRTC流分流审核。 VOLC流审核。 ALI流审核。
userId	int32	否	声网用户账号标识。仅分流情况下存在，返回的userId是实际房间中的用户id，与请求参数中的uid无关。
passThrough	object	否	客户传入透传字段。数美内部不会对该字段进行识别处理，随结果返回给用户。
businessLabels	array	否	业务标签列表
businessDescription	string	是	业务标签中文描述，格式为"一级标签:二级标签:三级标签"的中文名称
businessLabel1	string	是	一级业务标签
businessLabel2	string	是	二级业务标签
businessLabel3	string	是	三级业务标签
probability	float	是	置信度。可选值在0～1之间，值越大，可信度越高
confidenceLevel	int32	否	置信等级，可选值在0～2之间，值越大，可信度越高
riskDetail	object	否	风险详情信息
riskSource	int32	是	风险来源，可能取值： 1000：无风险 1001：文字风险 1003：音频语音风险
audioText	string	否	该片段识别的文字内容
matchedLists	array	否	命中的客户自定义名单信息仅在命中客户自定义名单时返回
name	string	否	名单名称
words	array	否	命中的这个名单中的敏感词信息
word	string	否	命中的敏感词
position	array	否	高风险内容片段所在位置下标从0开始计数
riskSegments	array	否	高风险片段内容。检测图片包含涉政、暴恐、违禁、竞品、广告法等风险内容的时候存在
segment	string	否	辅助信息高风险内容片段
position	array	否	高风险内容片段所在位置下标从0开始计数
tokenProfileLabels	array	否	账号属性标签。仅在tokenId传入且标签服务开通时返回
description	string	否	标签描述
label1	string	否	一级标签
label2	string	否	二级标签
label3	string	否	三级标签
timestamp	int32	否	打标签时间戳 13位Unix时间戳，单位：毫秒
tokenRiskLabels	array	否	账号风险标签。仅在tokenId传入且标签服务开通时返回
description	string	否	标签描述
label1	string	否	一级标签
label2	string	否	二级标签
label3	string	否	三级标签
timestamp	int32	否	打标签时间戳 13位Unix时间戳，单位：毫秒

流结束回调参数#

仅当returnFinishInfo为1时返回

参数名称	类型	是否必返	参数说明
requestId	string	是	数美请求唯一标识
message	string	是	和code对应： 1100：成功 1901：QPS超限 1902：参数不合法 1903：服务失败 1904 : 流路数超限 9101：无权限操作
code	int32	是	1100：成功 1901：QPS超限 1902：参数不合法 1903：服务失败 1904 : 流路数超限 9101：无权限操作
riskLevel	string	是	回调结束时返回整体流的处置建议。可能返回值： PASS：正常，建议直接放行 REVIEW：可疑，建议人工审核 REJECT：违规，建议直接拦截
statCode	int32	是	回调状态码，当returnFinishInfo为1时存在。状态码对应关系： 0 ：审核结果回调 1 ：流结束结果回调。
contentType	int32	是	用来区分音频和图片回调结束。可能取值如下： 1：该回调为图片审核结束回调 2：该回调为音频审核结束回调
pullStreamSuccess	bool	是	拉流是否成功。可能取值如下： true：拉流成功 false：拉流失败如果一张截图都没有获取成功即认为拉流失败
auxInfo	object	是	辅助信息
streamTime	int32	是	流审核时长。流结束后最后一次返回，代表送审时长，如有间隔审核逻辑时，和流真实时长可能不一致
requestParams	object	否	返回请求参数data中的所有字段。contentType为2时返回
detail	object	否	详情信息。contentType为1时返回
requestParams	object	是	返回请求参数data中的所有字段

示例#

请求示例#

{
    "accessKey": "*********",
    "appId": "defaulttest",
    "audioBusinessType": "SING_LANGUAGE",
    "audioCallback": "http://www.xxx.top/callbackxxx",
    "audioType": "POLITY_EROTIC_ADVERT_MOAN",
    "data": {
        "detectFrequency": 10,
        "detectStep": 1,
        "extra": {
            "passThrough": {
                "passThrough1": "111",
                "passThrough2": "222",
                "passThrough3": "333"
            }
        },
        "ip": "123.171.34.4",
        "lang": "zh",
        "returnAllImg": 1,
        "returnAllText": 1,
        "returnPreAudio": 1,
        "returnPreText": 1,
        "room": "5e1854a6a0a79d0001a09bc3",
        "streamType": "NORMAL",
        "tokenId": "123",
        "url": "http://rtmp.xxxx.cn/live/3637778raLSXdOdu.flv"
    },
    "eventId": "VIDEOSTREAM",
    "imgBusinessType": "BODY_FOOD_3CPRODUCTSLOGO",
    "imgCallback": "http://www.xxx.top/callbackxxx",
    "imgType": "POLITY_EROTIC_ADVERT"
}

返回示例#

{
    "code": 1100,
    "message": "成功",
    "requestId": "66fb85e3149bb9e13d6c72161cc6c6cf"
}

截帧图片回调示例#

{
    "auxInfo": {
        "passThrough": {
            "passThrough1": "111",
            "passThrough2": "222",
            "passThrough3": "333"
        }
    },
    "code": 1100,
    "contentType": 1,
    "frameDetail": {
        "allLabels": [
            {
                "riskDescription": "涉政:涉政:涉政",
                "riskLabel1": "politics",
                "riskLabel2": "shezheng",
                "riskLabel3": "shezheng",
                "riskLevel": "REJECT"
            }
        ],
        "auxInfo": {
            "beginProcessTime": 1639825248361,
            "detectType": 1,
            "finishProcessTime": 1639825248809,
            "imgTime": "2021-12-18 19:00:48.375",
            "room": "5e1854a6a0a79d0001a09bc3"
        },
        "businessLabels": [],
        "imgUrl": "http://bj.cos.ap-beijing.xxx.com/image/1639825145166_vs130_1639825248361471656.jpg",
        "riskDescription": "涉政:涉政:涉政",
        "riskDetail": {
            "ocrText": {
                "text": "第四页（ban第五页（violence"
            },
            "riskSource": 1002
        },
        "riskLabel1": "politics",
        "riskLabel2": "shezheng",
        "riskLabel3": "shezheng",
        "riskLevel": "REJECT"
    },
    "message": "成功",
    "requestId": "1639825145166_vs130_1639825248361471656"
}

音频片段回调示例#

{
    "audioDetail": {
        "allLabels": [
            {
                "riskDescription": "涉政:一号领导:一号领导",
                "riskLabel1": "politics",
                "riskLabel2": "yihaolingdao",
                "riskLabel3": "yihaolingdao",
                "riskLevel": "REJECT"
            }
        ],
        "audioText": "作作出重要指示强调在全面建设社会主义现代化国家新征程中职业教育前途广阔中共中央总书记国家主",
        "audioUrl": "http://bj-voice-mp3-1251671073.cos.ap-beijing.myqcloud.com/POST_VIDEOSTREAM%2FPOST_VIDEOSTREAM_AUDIO%2FMP3%2F20221027%2Fy28f8a4f1264085b321f12223wqed1121retestpvvvvv44321we12_3.mp3?q-sign-algorithm=sha1&q-ak=AKIDg9LHyOYSAcmfHekZ6NN6XidHflbASUHn&q-sign-time=1666876123%3B1669468123&q-key-time=1666876123%3B1669468123&q-header-list=host&q-url-param-list=&q-signature=f32da45be186fd4a8ed063e499d3f4e0f4f5fc19",
        "auxInfo": {
            "audioEndTime": "2022-10-27 21:08:42",
            "audioStartTime": "2022-10-27 21:08:32",
            "beginProcessTime": 1666876123332,
            "finishProcessTime": 1666876123893,
            "room": "y1123413312ewe24sv2"
        },
        "businessLabels": [],
        "content": "现代化国家新征程中职业教育前途广阔中共中央总书记国家主席中央军委主席习近平近日对职业教育工作作作出重要指示强调在全面建设社会主义现代化国家新征程中职业教育前途广阔中共中央总书记国家主",
        "preAudioUrl": "http://bj-voice-mp3-1251671073.cos.ap-beijing.myqcloud.com/POST_VIDEOSTREAM%2FPOST_VIDEOSTREAM_AUDIO%2FMP3%2F20221027%2Fy28f8a4f1264085b321f12223wqed1121retestpvvvvv44321we12_3_pre.mp3?q-sign-algorithm=sha1&q-ak=AKIDg9LHyOYSAcmfHekZ6NN6XidHflbASUHn&q-sign-time=1666876123%3B1669468123&q-key-time=1666876123%3B1669468123&q-header-list=host&q-url-param-list=&q-signature=449fdcab8a3c11d5132f43f78c61e6663f5c08d6",
        "riskDescription": "涉政:一号领导:一号领导",
        "riskDetail": {
            "audioText": "作作出重要指示强调在全面建设社会主义现代化国家新征程中职业教育前途广阔中共中央总书记国家主",
            "riskSource": 1001
        },
        "riskLabel1": "politics",
        "riskLabel2": "yihaolingdao",
        "riskLabel3": "yihaolingdao",
        "riskLevel": "REJECT"
    },
    "code": 1100,
    "contentType": 2,
    "message": "成功",
    "requestId": "y28f8a4f1264085b321f12223wqed1121retestpvvvvv44321we12_3",
    "statCode": 0
}

流结束回调示例#

{
    "auxInfo": {
        "streamTime": 70
    },
    "code": 1100,
    "contentType": 1,
    "detail": {
        "requestParams": {
            "detectFrequency": 10,
            "detectStep": 1,
            "extra": {
                "passThrough": {
                    "passThrough1": "111",
                    "passThrough2": "222",
                    "passThrough3": "333"
                }
            },
            "ip": "123.171.34.4",
            "lang": "zh",
            "returnAllImg": 1,
            "returnAllText": 1,
            "returnPreAudio": 1,
            "returnPreText": 1,
            "room": "5e1854a6a0a79d0001a09bc3",
            "streamType": "NORMAL",
            "tokenId": "123",
            "url": "http://rtmp.xxxx.cn/live/3637778raLSXdOdu.flv"
        }
    },
    "message": "成功",
    "pullStreamSuccess": true,
    "requestId": "5515ce1f9b474a6c4a3d79a8dfcaeaf4",
    "riskLevel": "PASS",
    "statCode": 1
}

附录#

业务标签类型#

业务标签识别类型	类型说明	备注
AGE	人脸-年龄	可识别未成年人
GENDER	人脸-性别
BEAUTY	人脸-颜值
RACE	人脸-人种如黑种人、白种人、黄种人
FACEDETECTION	人脸-人脸检测	如识别无人脸、真人、口罩人脸、正脸、侧脸等
FACECOMPARE	人脸比对
FAKEFACE	人脸-伪造人脸
FACECOMPARE	人脸-人脸对比
PUBLICFIGURE	人物-公众人物	如识别知名明星、网红等
TAINTEDSTAR	人物-劣迹人物
POSTURE	人像-人像姿态	如识别坐姿、跪姿等
DRESS	人像-人像穿着	如识别jk、汉服等
TEMPERAMENT	人像-人像气质	如成熟大叔、靓丽女神等
BODY	人体	如识别头发、眼睛、鼻子等
PICTUREFORM	画面属性-画面类型	如识别动漫、表情包等
PICTURESTRUCT	画面属性-画面结构	如识别宫格图、桥段图等
LOWVISION	画面属性-画面低质	如识别模糊、涂抹、马赛克等
LOWCONTNET	画面属性-内容低质	如识别点线密集、虫类密集等
LIVEPICTURE	画面属性-直播画面	如识别床上直播、开车直播等
SCREENSHOT	画面属性-APP截图（内容搬运）	如识别朋友圈截图、聊天截图等
FITNESS	场景主题-健身
CATE	场景主题-美食
MUSIC	场景主题-音乐
SPORTS	场景主题-体育
SCENERY	场景主题-自然风光	如识别天空、大海、草原等
CITYVIEW	场景主题-城市风光	如识别街景
3CPRODUCTSLOGO	LOGO-3C电子类品牌	如识别华为、小米、OPPO等LOGO
SHOPPINGAPPSLOGO	LOGO-购物比价类应用	如识别拼多多等LOGO
RETOUCHAPPSLOGO	LOGO-拍摄美化类应用	如识别快剪辑、秒拍等LOGO
SOCIALAPPSLOGO	LOGO-社交通讯类应用	如识别微博、小红书等LOGO
PHOTOMATERIALLOGO	LOGO-素材版权类应用	如识别CFP等LOGO
NEWSAPPSLOGO	LOGO-新闻阅读类应用	如识别新浪、视觉中国等LOGO
ENTERTAINMENTAPPSLOGO	LOGO-影音娱乐类应用	如识别抖音、快手等LOGO
SPORTSLOGO	LOGO-体育赛事	如识别奥运会等LOGO
APPARELLOGO	LOGO-鞋帽服饰类品牌	如识别VANS、H&M等LOGO
ACCESSORIESLOGO	LOGO-饰品首饰类品牌	如识别AudemarsPiguet、Nomos等LOGO
COSMETICSLOGO	LOGO-化妆品类品牌	如识别LOTTE、EyesLipsFace等LOGO
FOODLOGO	LOGO-食品类品牌	如识别Starbucks、LOTTE等LOGO
AUTOTRADEAPPSLOGO	LOGO-汽车交易平台类	如识别懂车帝、易车、太平洋汽车、爱卡等LOGO
VEHICLE	物品-交通工具
BUILDING	物品-建筑
TABLEWARE	物品-餐具
FOOD	物品-食物
HOMEAPPLICATION	物品-家用电器
OFFICESUPPLIES	物品-办公用品
FASHION	物品-穿着用品
SPORTEQUIPMENT	物品-运动器材
TOY	物品-玩具
MAKEUP	物品-化妆品
DRUGS	物品-药品
PAINTING	物品-绘画作品
ELECTRONIC	物品-电子产品
MEDICALIMAGE	物品-医疗影像
FURNITURE	物品-家居用品
DAILYSUPPLIES	物品-生活用品
CONSTELLATION	物品-星座占卜
KITCHENWARE	物品-厨房用品
KEEPSAKE	物品-纪念品
LOTTERY	物品-彩票-刮刮乐
DEFORMITY	人体-畸形躯干
MAMMAL	动物-哺乳动物
BIRDS	动物-鸟类
REPTILE	动物-爬行动物
FISH	动物-鱼
ARTHROPOD	动物-节肢动物
COELENTERATE	动物腔肠动物
MOLLUSKS	动物软体动物
CRUSTACEAN	动物甲壳动物
PLANT	植物
SETTING	场所	如识别卫生间、酒店、厨房等
EXTREMEWEATHER	极端天气识别	如水灾、暴雨、沙尘暴、冰等
LICENCEPLATE	车牌识别
DANCE	跳舞识别