#
数美智能文档识别产品API接口文档版权所有 翻版必究
目录
智能文档过滤服务接入说明#
请求参数#
请求URL:#
集群 | URL | 支持产品列表 |
---|---|---|
北京 | http://api-article-bj.fengkongcloud.com/v1/saas/anti_fraud/article | 文档产品 |
字符编码格式:#
UTF-8
字符集编码
请求方法:#
POST
建议超时时长:#
15s
请求参数:#
放在HTTP Body中,采用Json格式,具体参数如下:
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
accessKey | string | 接口认证密钥 | Y | 由数美提供 |
type | string | 平台业务类型 | N | 可选值:ZHIBO :直播ECOM :电商GAME :游戏NEWS :新闻资讯FORUM :论坛SOCIAL :社交NOVEL :小说 |
imgType | string | 文档中的图片识别类型 | N | 可选值:POLITICS :涉政识别PORN :色情识别AD :广告识别LOGO :水印logo识别BEHAVIOR :不良场景识别,支持吸烟、喝酒、赌博、吸毒、避孕套和无意义画面OCR :图片中的OCR文字识别VIOLENCE :暴恐识别NONE :不需要识别图片如需做组合识别,通过下划线连接即可,例 如 POLITICS_PORN_AD 用于广告、色情和涉政识别 不传时按涉政、色情、广告进行识别。 |
txtType | string | 文档中的文字识别类型 | N | 可选值:DEFAULT :识别涉政、暴恐、违禁、色情、辱骂、广告NONE :不需要识别文本不传时按传入default处理。 |
appId | string | 应用标识 | N | 用于区分相同公司的不同应用,该参数传递值可与数美服务协商 |
callback | string | 回调http接口 | N | 当该字段非空时,服务将根据该字段回调通知用户审核结果;当传入fileFormat时必传 |
callbackParam | json_object | 透传字段 | N | 当 callback 存在时可选,发送回调请求时服务将该字段内容同审核结果一起返回 |
data | json_object | 请求的数据内容 | Y | 最长1MB, 详见data参数 |
其中,data的内容如下:
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
contents | string | 要检测的内容 | Y | 可填入url链接 其中url支持网址链接或文档下载链接 文件大小500m以内,文本长度限制50w字。图片张数限制500张。 |
fileFormat | string | 要检测的文档格式 | Y | 可选值:DOCX PDF DOC XLS XLSX PPT PPTX PPS PPSX XLTX XLTM XLSB XLSM TXT CSV EPUB SRT VTT 若fileFormat与文档实际格式不一致,则返回报错参数错误 |
tokenId | string | 客户端用户账号唯一标识,用于用户行为分析,建议传入用户UID | Y | |
channel | string | 业务场景 | N | 渠道表配置 |
returnHtml | bool | 是否需要返回数美审核后高亮框处风险内容的html,用与展示给审核人员看 | N | 可选值:true false 默认为false |
nickname | string | 用户昵称,强烈建议传递此参数,几乎所有平台的恶意用户都会通过昵称散播垃圾信息,存在涉政违禁和导流信息等风险 | N | |
ip | string | 客户端ip地址,该参数用于IP维度的用户行为分析,同时可用于比对数美IP黑库 | N | |
passThrough | json_object | 透传参数,原样返回 | N |
返回结果#
回调模式#
系统会自动推送机审结果至callback字段指定的URL上
#
请求返回参数:参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
code | int | 返回码 | Y | 1100 :成功1901 :QPS超限1902 :参数不合法1903 :服务失败9100 :余额不足9101 :无权限操作 |
message | string | 返回码描述 | Y | 和code对应: 成功 QPS超限 参数不合法 服务失败 余额不足 无权限操作 |
requestId | string | 请求标识 | Y | 本次请求数据的唯一标识,用于问题排查和效果优化,强烈建议保存 |
score | int | 风险分数 | N | code为1100时存在,取值范围[0,1000],分数越高风险越大 |
riskLevel | string | 处置建议 | N | 可能返回值:PASS :正常,建议直接放行REVIEW :可疑,建议人工审核REJECT :违规,建议直接拦截 |
detail | json_object | 风险详情 | N | 详见detail参数 |
#
回调返回参数:参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
code | int | 返回码 | Y | 1100 :成功1901 :QPS超限1902 :参数不合法1903 :服务失败9100 :余额不足9101 :无权限操作 |
message | string | 返回码描述 | Y | 和code对应: 成功 QPS超限 参数不合法 服务失败 余额不足 无权限操作 |
requestId | string | 请求标识 | Y | 本次请求数据的唯一标识,用于问题排查和效果优化,强烈建议保存 |
score | int | 风险分数 | N | code为1100时存在,取值范围[0,1000],分数越高风险越大 |
riskLevel | string | 处置建议 | N | 可能返回值:PASS :正常,建议直接放行REVIEW :可疑,建议人工审核REJECT :违规,建议直接拦截 |
detail | json_object | 风险详情 | N | 详见detail参数 |
status | int | 提示服务是否超时 | Y | 可能返回值:0 :正常501 :超时 |
auxInfo | json_object | 辅助信息 | Y | 详见auxInfo参数 |
callbackParam | json_object | 透传字段 | N | 透传参数,原样返回 |
参数名称 | 类型 | 是否必选 | 说明 |
---|---|---|---|
model | string | Y | 规则标识 |
description | string | Y | 策略规则风险原因描述 |
riskSummary | json object | N | 风险摘要,目前包括各种风险类型的次数,如果type为NOVEL才返回 格式请见riskSummary结果详情 |
riskDetail | json array | N | 每一段内容的风险详情,如果type为NOVEL才返回。如果returnHtml参数为true只返回REJECT和REVIEW的风险内容片段,如果returnHtml参数为false会返回全部内容片段(包括REJECT和REVIEW和PASS)。 格式请见riskDetail结果详情 |
riskHtml | string | N | 风险内容标记的html,可嵌入需要展示的html页面,如果type为NOVEL且returnHtml参数为true才返回。 |
hits | json_array | N | 命中信息,一般为空。命中详情在riskDetail中。 |
passThrough | json_object | N | 透传参数,原样返回 |
其中,riskSummary内容是风险类型,具体如下:
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
riskType | int | 对应riskType风险出现的次数 | N | 风险类型:0 :正常100 :涉政200 :色情210 :辱骂300 :广告400 :灌水500 :无意义600 :违禁700 :黑名单710 :白名单800 :高危账号900 :自定义 |
其中,riskDetail是json array,其中每一项是一个内容片段的风险详情,具体如下:
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
type | string | 当前内容片段的类型 | Y | 可选值:text :文本image :图片 |
content | string | 当前内容片段的内容 | Y | text是文本内容,image是图片url |
beginPosition | int | 当前内容片段在输入中的起始位置,当type为image 时该字段不返回 | N | 检测出的文本内容,从0开始计算位置;文本切分后,每个片段的文本内容的首字在全局检测出文本中的位置 |
endPosition | int | 当前内容片段在输入中的结束位置,当type为image 时该字段不返回 | N | 检测出的文本内容,从0开始计算位置;文本切分后,每个片段的文本内容的末尾字在全局检测出文本中的位置 |
description | string | 当前内容片段的风险描述 | Y | 命中的对应名单中的所有敏感词 |
riskLevel | string | 当前内容片段的处置建议 | Y | 可选值:PASS :通过REVIEW :审核REJECT : 拒绝 |
riskType | int | 当前内容片段的标识风险类型 | Y | 当type为文本时:0 :正常100 :涉政200 :色情210 :辱骂300 :广告400 :灌水500 :无意义600 :违禁700 :黑名单710 :白名单800 :高危账号900 :自定义当type为图片时: 0 :正常100 :涉政200 :色情210 :性感300 :广告310 :二维码320 :水印400 :暴恐500 :违规510 :不良场景520 :未成年人700 :黑名单710 :白名单800 :高危账号900 :自定义 |
riskTypeDec | string | riskType对应的描述 | N | |
model | string | 规则标识,用来标识文本命中的策略规则 | N | |
matchedList | string | 命中敏感词所在的名单名称(该参数仅在命中敏感词时存在) | N | |
matchedItem | string | 命中的具体敏感词(该参数仅在命中敏感词时存在) | N | |
matchedField | string | 标识昵称或文本内容命中了敏感词(该参数仅在命中敏感词时存在) | N | 可选值:text :文本命中敏感词nickname :昵称命中敏感词 |
matchedDetail | json_array | 命中的名单详情 | N | 详见详细结构 |
index | int | 当前处理的片段索引 | N | 索引不区分文本和图片 |
keywordsPosition | string | 命中的敏感词位置 | N | 在该段中的位置 |
text | string | 图片中的ocr内容 | N | 图片片段识别出ocr内容时会返回该字段 |
其中,matchedDetail结构如下:
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
listId | string | Y | 返回码 | |
matchedFiled | string_array | N | 标识昵称或文本内容命中了敏感词(该参数仅在命中敏感词时存在),可选值: text:文本命中敏感词 nickname:昵称命中敏感词 | |
name | string | Y | 命中敏感词所在的名单名称 | |
organization | string | N | 命中名单所属的公司标识,其中“GLOBAL”为全局名单 | |
words | string_array | N | 命中的对应名单中的所有敏感词 | |
wordPositions | json_array | N | 命中的对应名单中的所有敏感词及位置。详见wordPositions |
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
word | string | 辅助信息 | N | 命中的敏感词 |
position | string | 辅助信息 | N | 敏感词所在位置 |
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
textNum | int | 当前请求中的字符数,与计费数目一致 | Y | 当前请求中的字符数,其中字符数包括汉字,英文,标点符号,空格等 |
imgNum | int | 当前请求中的图片数,与计费数目一致 | Y | 当前请求中的图片数,如遇动图会截取3帧;如遇长图会进行切分 |
示例#
回调模式#
请求示例#
响应示例#
智能文档过滤上传接口#
请求参数#
请求URL:#
集群 | URL | 支持产品列表 |
---|---|---|
北京 | http://api-article-bj.fengkongcloud.com/v1/saas/anti_fraud/article_async | 文档产品 |
字符编码格式:#
UTF-8
字符集编码
请求方法:#
POST
建议超时时长:#
5s
请求参数:#
放在HTTP Body中,采用Json格式,具体参数如下:
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
accessKey | string | 接口认证密钥 | Y | 由数美提供 |
type | string | 平台业务类型 | N | 可选值:ZHIBO :直播ECOM :电商GAME :游戏NEWS :新闻资讯FORUM :论坛SOCIAL :社交NOVEL :小说 |
imgType | string | 文档中的图片识别类型 | N | 可选值:POLITICS :涉政识别PORN :色情识别AD :广告识别LOGO :水印logo识别BEHAVIOR :不良场景识别,支持吸烟、喝酒、赌博、吸毒、避孕套和无意义画面OCR :图片中的OCR文字识别VIOLENCE :暴恐识别NONE :不需要识别图片如需做组合识别,通过下划线连接即可,例 如 POLITICS_PORN_AD 用于广告、色情和涉政识别 |
txtType | string | 文档中的文字识别类型 | N | 可选值:DEFAULT :识别涉政、暴恐、违禁、色情、辱骂、广告NONE :不需要识别文本不传时按传入default处理。 |
appId | string | 应用标识 | N | 用于区分相同公司的不同应用,该参数传递值可与数美服务协商 |
data | json_object | 请求的数据内容 | Y | 最长1MB, 详见data参数 |
其中,data的内容同同步接口:
返回结果#
请求返回参数#
放在HTTP Body中,采用Json格式,具体参数如下:
参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
---|---|---|---|---|
code | int | 返回码 | Y | 1100 :成功1901 :QPS超限1902 :参数不合法1903 :服务失败9100 :余额不足9101 :无权限操作 |
message | string | 返回码描述 | Y | 和code对应: 成功 QPS超限 参数不合法 服务失败 余额不足 无权限操作 |
requestId | string | 请求标识 | Y | 本次请求数据的唯一标识,用于问题排查和效果优化,强烈建议保存 |
示例#
请求示例#
响应示例#
结果查询接口#
该接口用于查询机审和人审识别结果
请求参数#
请求URL:#
集群 | URL | 支持产品列表 |
---|---|---|
北京 | http://api-article-bj.fengkongcloud.com/v1/saas/anti_fraud/article/query | 文档产品 |
字符编码格式:#
UTF-8
字符集编码
请求方法:#
POST
建议超时时长:#
1s
请求参数:#
放在HTTP Body中,采用Json格式,具体参数如下:
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
accessKey | string | 接口认证密钥 | Y | 由数美提供 |
requestIds | array | 机器审核流水号 | Y | 最多支持10条 字符串数组 item 为数美返回的流水号 |
返回结果#
请求返回参数#
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
code | int | 返回码 | Y | |
message | string | 返回码描述 | Y | |
contents | json array | 内容 | Y | 详见contents内容 |
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
requestId | string | 请求唯一标识 | Y | |
humanResult | json object | 人审结果,人审完成后才会存在 | N | |
machineResult | json object | 机审结果,机审完成后才会存在 | N | 参考回调接口返回字段 |
mergeResult | json_object | 统一人审和机审结果 | N | 优先返回人审结果,如果人审结果没有,返回机审结果,如果都没有不存在 |
其中,humanResult/mergeResult的内容如下:
请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
---|---|---|---|---|
riskLevel | string | 处置指令 | Y | 建议取值:REJECT :删除PASS :发布 |