#
数美智能网页识别产品API接口文档目录
#
同步接口#
请求参数#
请求URL:集群 | URL |
---|---|
北京 | http://api-article-bj.fengkongcloud.com/v1/saas/anti_fraud/article |
#
字符编码格式:UTF-8
字符集编码
#
请求方法:POST
#
建议超时时长:15s
#
请求参数:放在HTTP Body中,采用Json格式,具体参数如下:
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
accessKey | string | 接口认证密钥 | Y | 由数美提供 |
type | string | 平台业务类型 | N | 可选值:ZHIBO :直播ECOM :电商GAME :游戏NEWS :新闻资讯FORUM :论坛SOCIAL :社交NOVEL :小说 |
imgType | string | 网页中的图片识别类型 | N | 可选值:POLITICS :涉政识别PORN :色情识别AD :广告识别LOGO :水印logo识别BEHAVIOR :不良场景识别,支持吸烟、喝酒、赌博、吸毒、避孕套和无意义画面OCR :图片中的OCR文字识别VIOLENCE :暴恐识别NONE :不需要识别图片如需做组合识别,通过下划线连接即可,例 如 POLITICS_PORN_AD 用于广告、色情和涉政识别不传时按涉政、色情、广告进行识别。 注意:这里 POLITICS 实际上等价于以下两个类型:PERSON :涉政人脸识别VIOLENCE :暴恐识别 |
txtType | string | 网页中的文字识别类型 | N | 可选值:DEFAULT :识别涉政、暴恐、违禁、色情、辱骂、广告NONE :不需要识别文本不传时按传入default处理。 |
videoImgType | string | 网页中视频截帧图片的识别类型 | N | 可选值:POLITICS :涉政识别, 这里POLITICS实际识别内容为涉政人物和暴恐PERSON :涉政人物识别VIOLENCE :暴恐识别PORN :色情&性感违规识别AD :广告识别QR :二维码识别OCR :图片文字违规识别BEHAVIOR :不良场景识别,支持吸烟、喝酒、赌博、吸毒、避孕套和无意义画面如果需要识别多个功能,通过下划线连接,如POLITY_QRCODE_ADVERT用于涉政、二维码和广告组合识别 如果审核视频,该字段必传 |
videoAudioType | string | 网页中视频内音频的识别类型 | N | 可选值:POLITICS :涉政识别PORN :色情识别AD :广告识别MOAN :娇喘识别ABUSE :辱骂识别ANTHEN :国歌识别AUDIOPOLITICAL :声音涉政NONE :不检测音频如需做组合识别,通过下划线连接即可,例如POLITICAL_PORN_MOAN用于广告、色情和涉政识别 不支持只审核视频中音频的情况 |
appId | string | 应用标识 | N | 用于区分相同公司的不同应用,该参数传递值可与数美服务协商 |
callback | string | 回调http接口 | N | 当该字段非空时,服务将根据该字段回调通知用户审核结果;当传入fileFormat时必传 |
callbackParam | json_object | 透传字段 | N | 当 callback 存在时可选,发送回调请求时服务将该字段内容同审核结果一起返回 |
data | json_object | 请求的数据内容 | Y | 最长1MB, 详见data参数 |
其中,data的内容如下:
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
contents | string | 要检测的网页内容 | Y | 可填入url链接或文本内容 其中url支持网址链接或文档下载链接 文件大小500m以内,文本长度限制50w字。图片张数限制500张。 |
fileFormat | string | 要检测的文档格式 | N | 可选值:DOCX PDF DOC XLS XLSX PPT PPTX PPS PPSX XLTX XLTM XLSB TXT 若不传或传空值,则默认按网页链接或文本内容检测 若fileFormat与文档实际格式不一致,则返回报错参数错误 |
tokenId | string | 客户端用户账号唯一标识,用于用户行为分析,建议传入用户UID | Y | 如果是网页识别场景,传入网页url即可 |
channel | string | 业务场景 | N | 渠道表配置 |
returnHtml | bool | 是否需要返回数美审核后高亮框处风险内容的html,用与展示给审核人员看 | N | 可选值:true false 默认为false |
nickname | string | 用户昵称,强烈建议传递此参数,几乎所有平台的恶意用户都会通过昵称散播垃圾信息,存在涉政违禁和导流信息等风险 | N | |
ip | string | 客户端ip地址,该参数用于IP维度的用户行为分析,同时可用于比对数美IP黑库 | N | |
detectFrequency | float | 视频中的截帧频率间隔,取值范围为0.5~60s;如不传递默认5s截帧一次 | N | 单位为秒s |
passThrough | json_object | 透传参数,原样返回 | N |
#
返回结果同步模式#
放在HTTP Body中,采用Json格式,具体参数如下:
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
code | int | 返回码 | Y | 1100 :成功1901 :QPS超限1902 :参数不合法1903 :服务失败9100 :余额不足9101 :无权限操作 |
message | string | 返回码描述 | Y | 和code对应: 成功 QPS超限 参数不合法 服务失败 余额不足 无权限操作 |
requestId | string | 请求标识 | Y | 本次请求数据的唯一标识,用于问题排查和效果优化,强烈建议保存 |
score | int | 风险分数 | N | code为1100时存在,取值范围[0,1000],分数越高风险越大 |
riskLevel | string | 处置建议 | N | 可能返回值:PASS :正常,建议直接放行REVIEW :可疑,建议人工审核REJECT :违规,建议直接拦截 |
detail | json_object | 风险详情 | N | 详见detail参数 |
status | int | 提示服务是否超时 | Y | 可能返回值:0 :正常501 :超时 |
auxInfo | json_object | 辅助信息 | Y | 详见auxInfo参数 |
callbackParam | json_object | 透传字段 | N | 透传参数,原样返回 |
参数名称 | 类型 | 是否必选 | 说明 |
---|---|---|---|
model | string | Y | 规则标识 |
description | string | Y | 策略规则风险原因描述 |
riskSummary | json object | N | 风险摘要,目前包括各种风险类型的次数,如果type为NOVEL才返回 格式请见riskSummary结果详情 |
riskDetail | json array | N | 每一段内容的风险详情,如果type为NOVEL才返回。如果returnHtml参数为true只返回REJECT和REVIEW的风险内容片段,如果returnHtml参数为false会返回全部内容片段(包括REJECT和REVIEW和PASS)。 格式请见riskDetail结果详情 |
riskHtml | string | N | 风险内容标记的html,可嵌入需要展示的html页面,如果type为NOVEL且returnHtml参数为true才返回。 |
hits | json_array | N | 网页命中信息,一般为空。命中详情在riskDetail中。 |
passThrough | json_object | N | 透传参数,原样返回 |
其中,riskSummary内容是风险类型,具体如下:
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
riskType | int | 对应riskType风险出现的次数 | N | 风险类型:0 :正常100 :涉政200 :色情210 :辱骂250 :娇喘300 :广告400 :灌水500 :无意义600 :违禁700 :黑名单710 :白名单800 :高危账号900 :自定义 |
其中,riskDetail是json array,其中每一项是一个内容片段的风险详情,具体如下:
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
type | string | 当前内容片段的类型 | Y | 可选值:text :文本img :图片video :视频 |
videoImgDetail | json_array | 当前视频片段中截帧图片详情,当type为video且审核视频截帧时返回 | N | 详见videoImgDetail参数 |
videoAudioDetail | json_array | 当前视频片段中音频详情,当type为video且审核音频时返回 | N | 详见videoAudioDetail参数 |
content | string | 当前内容片段的内容 | Y | text是文本内容,img是图片url |
beginPosition | int | 当前内容片段在输入中的起始位置,当type为img 时该字段不返回 | N | 检测出的文本内容,从0开始计算位置;文本切分后,每个片段的文本内容的首字在全局检测出文本中的位置 |
endPosition | int | 当前内容片段在输入中的结束位置,当type为img 时该字段不返回 | N | 检测出的文本内容,从0开始计算位置;文本切分后,每个片段的文本内容的末尾字在全局检测出文本中的位置 |
description | string | 当前内容片段的风险描述 | Y | 命中的对应名单中的所有敏感词 |
riskLevel | string | 当前内容片段的处置建议 | Y | 可选值:PASS :通过REVIEW :审核REJECT : 拒绝 |
riskType | int | 当前内容片段的标识风险类型 | Y 说明:当type为文本和图片时必返,当type为视频时为非必返 | 当type为文本时:0 :正常100 :涉政200 :色情210 :辱骂300 :广告400 :灌水500 :无意义600 :违禁700 :黑名单710 :白名单800 :高危账号900 :自定义当type为图片时: 0 :正常100 :涉政200 :色情210 :性感300 :广告310 :二维码320 :水印400 :暴恐500 :违规510 :不良场景520 :未成年人700 :黑名单710 :白名单800 :高危账号900 :自定义 |
riskTypeDec | string | riskType对应的描述 | N | |
model | string | 规则标识,用来标识文本命中的策略规则 | N | |
matchedList | string | 命中敏感词所在的名单名称(该参数仅在命中敏感词时存在) | N | |
matchedItem | string | 命中的具体敏感词(该参数仅在命中敏感词时存在) | N | |
matchedField | string | 标识昵称或文本内容命中了敏感词(该参数仅在命中敏感词时存在) | N | 可选值:text :文本命中敏感词nickname :昵称命中敏感词 |
matchedDetail | json_array | 命中的名单详情 | N | 详见详细结构 |
index | int | 当前处理的片段索引 | Y | 索引不区分文本和图片 |
keywordsPosition | string | 命中的敏感词位置 | N | 在该段中的位置 |
text | string | 图片中的ocr内容 | N | 图片片段识别出ocr内容时会返回该字段 |
其中,videoImgDetail结构如下:
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
time | float | 该图片在视频中的位置 | Y | 截帧图片相对视频文件的时间 |
riskLevel | string | 当前截帧的处置建议 | Y | 可选值:PASS :通过REVIEW :审核REJECT : 拒绝 |
imgText | string | 截帧图片OCR文本内容 | N | 截帧图片OCR文字识别,识别类型包含OCR时会返回 |
riskType | int | 截帧图片风险类型 | Y | 返回值:0 : 正常100 :涉政200 :色情210 :性感300 :广告310 :二维码320 :水印400 :暴恐500 :违规510 :不良场景700 :黑名单710 :白名单800 :高危账号900 :自定义 |
matchedList | string | 命中敏感词所在的名单名称(该参数仅在命中敏感词时存在) | N | |
matchedltem | string | 命中的具体敏感词(该参数仅在命中敏感词时存在) | N | |
riskSource | int | 风险来源 | Y | 可返值:1000 :无风险 1001 :文字风险 1002 :视觉图片风险 |
其中,videoAudioDetail结构如下:
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
audio_starttime | float | 音频片段发生时间 | N | |
audio_endtime | float | 音频片段结束时间 | N | |
riskLevel | string | 当前截帧的处置建议 | Y | 可选值:PASS :通过REVIEW :审核REJECT : 拒绝 |
audioText | string | 返回音转文文字 | N | 截帧图片OCR文字识别,识别类型包含OCR时会有 |
riskType | int | 风险类型 | Y | 返回值:0 :正常100 :涉政/国歌110 : 暴恐200 :色情210 :辱骂250 :娇喘260 :一号领导人声纹300 :广告400 :灌水500 :无意义600 : 违禁700 :其他720 :黑账号730 :黑IP800 :高危账号900 :自定义 |
audio_matchedItem | string | 违规音频敏感词内容 (该参数仅在命中敏感词时存在) | N | |
riskSource | int | 风险来源 | Y | 可返值:1000 :无风险 1001 :文字风险 1003 :语音风险 |
其中,matchedDetail结构如下:
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
listId | string | Y | 返回码 | |
matchedFiled | string_array | N | 标识昵称或文本内容命中了敏感词(该参数仅在命中敏感词时存在),可选值: text:文本命中敏感词 nickname:昵称命中敏感词 | |
name | string | Y | 命中敏感词所在的名单名称 | |
organization | string | N | 命中名单所属的公司标识,其中“GLOBAL”为全局名单 | |
words | string_array | N | 命中的对应名单中的所有敏感词 | |
wordPositions | json_array | N | 命中的对应名单中的所有敏感词及位置。详见wordPositions |
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
word | string | 辅助信息 | N | 命中的敏感词 |
position | string | 辅助信息 | N | 敏感词所在位置 |
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
textNum | int | 当前请求中的字符数,与计费数目一致 | Y | 当前请求中的字符数,其中字符数包括汉字,英文,标点符号,空格等 |
imgNum | int | 当前请求中的图片数,与计费数目一致 | Y | 当前请求中的图片数,如遇动图会截取3帧;如遇长图会进行切分 |
videoNum | int | 当前请求中的视频数 | Y | 遗留历史兼容字段,不建议使用 |
billingImgNum | int | 当前请求中的视频里的截帧图片数,与计费数目一致 | Y | 审核视频时,视频文件中截帧图片数 |
billingAudioDuration | int | 当前请求中的视频里的音频时长,单位是秒,与计费数目一致 | Y | 审核视频时,如果视频文件中音轨数据和视频时长不一致,计费时长以实际的音轨时长为准;例如可能会存在没有音轨的情况,计费时长就为0 |
#
回调模式如果在请求参数中指定了 callback,系统会自动推送机审结果至指定URL
#
请求返回参数:参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
code | int | 返回码 | Y | 1100 :成功1901 :QPS超限1902 :参数不合法1903 :服务失败9100 :余额不足9101 :无权限操作 |
message | string | 返回码描述 | Y | 和code对应: 成功 QPS超限 参数不合法 服务失败 余额不足 无权限操作 |
requestId | string | 请求标识 | Y | 本次请求数据的唯一标识,用于问题排查和效果优化,强烈建议保存 |
score | int | 风险分数 | N | code为1100时存在,取值范围[0,1000],分数越高风险越大 |
riskLevel | string | 处置建议 | N | 可能返回值:PASS :正常,建议直接放行REVIEW :可疑,建议人工审核REJECT :违规,建议直接拦截 |
detail | json_object | 风险详情 | N | 详见detail参数 |
#
回调返回参数:回调返回结构同同步请求响应;返回HTTP状态码为200时,表示推送成功;否则系统将进行最多8次推送。
#
示例#
同步模式#
请求示例#
响应示例#
回调模式#
请求示例#
响应示例#
异步接口#
请求参数#
请求URL:集群 | URL | 支持产品列表 |
---|---|---|
北京 | http://api-article-bj.fengkongcloud.com/v1/saas/anti_fraud/article_async | 网页产品 |
#
字符编码格式:UTF-8
字符集编码
#
请求方法:POST
#
建议超时时长:5s
#
请求参数:放在HTTP Body中,采用Json格式,具体参数如下:
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
accessKey | string | 接口认证密钥 | Y | 由数美提供 |
type | string | 平台业务类型 | N | 可选值:ZHIBO :直播ECOM :电商GAME :游戏NEWS :新闻资讯FORUM :论坛SOCIAL :社交NOVEL :小说 |
imgType | string | 网页中的图片识别类型 | N | 可选值:POLITICS :涉政识别PORN :色情识别AD :广告识别LOGO :水印logo识别BEHAVIOR :不良场景识别,支持吸烟、喝酒、赌博、吸毒、避孕套和无意义画面OCR :图片中的OCR文字识别VIOLENCE :暴恐识别NONE :不需要识别图片如需做组合识别,通过下划线连接即可,例 如 POLITICS_PORN_AD 用于广告、色情和涉政识别 |
txtType | string | 网页中的文字识别类型 | N | 可选值:DEFAULT :识别涉政、暴恐、违禁、色情、辱骂、广告NONE :不需要识别文本不传时按传入default处理。 |
appId | string | 应用标识 | N | 用于区分相同公司的不同应用,该参数传递值可与数美服务协商 |
data | json_object | 请求的数据内容 | Y | 最长1MB, 详见data参数 |
其中,data的内容同同步接口:
#
返回结果#
请求返回参数放在HTTP Body中,采用Json格式,具体参数如下:
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
code | int | 返回码 | Y | 1100 :成功1901 :QPS超限1902 :参数不合法1903 :服务失败9100 :余额不足9101 :无权限操作 |
message | string | 返回码描述 | Y | 和code对应: 成功 QPS超限 参数不合法 服务失败 余额不足 无权限操作 |
requestId | string | 请求标识 | Y | 本次请求数据的唯一标识,用于问题排查和效果优化,强烈建议保存 |
#
示例#
请求示例#
响应示例#
结果查询接口该接口用于查询机审和人审识别结果
#
请求参数#
请求URL:集群 | URL | 支持产品列表 |
---|---|---|
北京 | http://api-article-bj.fengkongcloud.com/v1/saas/anti_fraud/article/query | 网页产品 |
#
字符编码格式:UTF-8
字符集编码
#
请求方法:POST
#
建议超时时长:1s
#
请求参数:放在HTTP Body中,采用Json格式,具体参数如下:
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
accessKey | string | 接口认证密钥 | Y | 由数美提供 |
requestIds | array | 机器审核流水号 | Y | 最多支持10条 字符串数组 item 为数美返回的流水号 |
#
返回结果#
请求返回参数请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
code | int | 返回码 | Y | |
message | string | 返回码描述 | Y | |
contents | json array | 内容 | Y | 详见contents内容 |
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
requestId | string | 请求唯一标识 | Y | |
humanResult | json object | 人审结果,人审完成后才会存在 | N | |
machineResult | json object | 机审结果,机审完成后才会存在 | N | 参考同步接口返回字段 |
mergeResult | json_object | 统一人审和机审结果 | N | 优先返回人审结果,如果人审结果没有,返回机审结果,如果都没有不存在 |
其中,humanResult/mergeResult的内容如下:
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
riskLevel | string | 处置指令 | Y | 建议取值:REJECT :删除PASS :发布 |