数美智能文档识别产品API接口文档#
版权所有 翻版必究
目录
智能文档过滤服务接入说明#
请求参数#
请求URL:#
| 集群 | URL | 支持产品列表 |
|---|---|---|
| 北京 | http://api-article-bj.fengkongcloud.com/v1/saas/anti_fraud/article | 文档产品 |
| 弗吉尼亚 | http://api-article-fjny.fengkongcloud.com/v1/saas/anti_fraud/article | 文档产品 |
| 新加坡 | http://api-article-xjp.fengkongcloud.com/v1/saas/anti_fraud/article | 文档产品 |
字符编码格式:#
UTF-8字符集编码
请求方法:#
POST
建议超时时长:#
15s
请求参数:#
放在HTTP Body中,采用Json格式,Body大小不可超过3.5M,具体参数如下:
| 请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
|---|---|---|---|---|
| accessKey | string | 接口认证密钥 | Y | 由数美提供 |
| type | string | 平台业务类型 | N | 可选值:ZHIBO:直播ECOM:电商GAME:游戏NEWS:新闻资讯FORUM:论坛SOCIAL:社交NOVEL:小说 |
| imgType | string | 文档中的图片识别类型 | N | 可选值:POLITICS:涉政识别PORN:色情识别AD:广告识别LOGO:水印logo识别BEHAVIOR:不良场景识别,支持吸烟、喝酒、赌博、吸毒、避孕套和无意义画面OCR:图片中的OCR文字识别VIOLENCE:暴恐识别NONE:不需要识别图片如需做组合识别,通过下划线连接即可,例 如 POLITICS_PORN_AD 用于广告、色情和涉政识别 不传时按涉政、色情、广告进行识别。 |
| txtType | string | 文档中的文字识别类型 | N | 可选值: POLITY:涉政检测 VIOLENT:暴恐检测 BAN:违禁检测 EROTIC:色情检测 DIRTY:辱>骂检测 ADVERT:广告检测 PRIVACY:隐私检测 ADLAW:广告法检测 MEANINGLESS:无意义检测 FRUAD:网络诈骗检测 UNPOACH:高价值用户防挖检测 TEXTMINOR: 未成年人内容检测 TEXTRISK:常规风险检测(包含:涉政、暴恐、违禁、色情、辱骂、广告、隐私、广告法、无意义) 以上type可以下划线组>合,如:TEXTRISK_FRUAD;type间组合取并集,如:TEXTRISK_POLITY按照常规风险检测处理;不传时按传入常规风险处理。 |
| appId | string | 应用标识 | N | 用于区分相同公司的不同应用,该参数传递值可与数美服务协商 |
| callback | string | 回调http接口 | N | 当该字段非空时,服务将根据该字段回调通知用户审核结果;当传入fileFormat时必传 |
| callbackParam | json_object | 透传字段 | N | 当 callback 存在时可选,发送回调请求时服务将该字段内容同审核结果一起返回 |
| data | json_object | 请求的数据内容 | Y | 最长1MB, 详见data参数 |
其中,data的内容如下:
| 请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
|---|---|---|---|---|
| contents | string | 要检测的内容 | Y | 可填入url链接 其中url支持网址链接或文档下载链接 文件大小500m以内,文本长度限制50w字,图片张数限制500张,视频文件数限制50段。 |
| fileFormat | string | 要检测的文档格式 | Y | 可选值:PDFEPUBDOCXDOCXLSXXLSPPTXPPTPPSPPSXXLTXXLTMXLSBXLSMTXTCSVSRTVTT |
| tokenId | string | 客户端用户账号唯一标识,用于用户行为分析,建议传入用户UID | Y | |
| channel | string | 业务场景 | N | 渠道表配置 |
| returnHtml | bool | 是否需要返回数美审核后高亮框处风险内容的html,用与展示给审核人员看 | N | 可选值:truefalse默认为false |
| nickname | string | 用户昵称,强烈建议传递此参数,几乎所有平台的恶意用户都会通过昵称散播垃圾信息,存在涉政违禁和导流信息等风险 | N | |
| ip | string | 客户端ip地址,该参数用于IP维度的用户行为分析,同时可用于比对数美IP黑库 | N | |
| passThrough | json_object | 透传参数,原样返回 | N |
返回结果#
回调模式#
系统会自动推送机审结果至callback字段指定的URL上
请求返回参数:#
| 参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
|---|---|---|---|---|
| code | int | 返回码 | Y | 1100:成功1901:QPS超限1902:参数不合法1903:服务失败9101:无权限操作 |
| message | string | 返回码描述 | Y | 和code对应: 成功 QPS超限 参数不合法 服务失败 无权限操作 |
| requestId | string | 请求标识 | Y | 本次请求数据的唯一标识,用于问题排查和效果优化,强烈建议保存 |
| score | int | 风险分数 | N | code为1100时存在,取值范围[0,1000],分数越高风险越大 |
| riskLevel | string | 处置建议 | N | 可能返回值:PASS:正常,建议直接放行REVIEW:可疑,建议人工审核REJECT:违规,建议直接拦截 |
| detail | json_object | 风险详情 | N | 详见detail参数 |
回调返回参数:#
| 参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
|---|---|---|---|---|
| code | int | 返回码 | Y | 1100:成功1901:QPS超限1902:参数不合法1903:服务失败9100:余额不足9101:无权限操作 |
| message | string | 返回码描述 | Y | 和code对应: 成功 QPS超限 参数不合法 服务失败 余额不足 无权限操作 |
| requestId | string | 请求标识 | Y | 本次请求数据的唯一标识,用于问题排查和效果优化,强烈建议保存 |
| score | int | 风险分数 | N | code为1100时存在,取值范围[0,1000],分数越高风险越大 |
| riskLevel | string | 处置建议 | N | 可能返回值:PASS:正常,建议直接放行REVIEW:可疑,建议人工审核REJECT:违规,建议直接拦截 |
| detail | json_object | 风险详情 | N | 详见detail参数 |
| status | int | 提示服务是否超时 | Y | 可能返回值:0:正常501:超时 |
| auxInfo | json_object | 辅助信息 | Y | 详见auxInfo参数 |
| callbackParam | json_object | 透传字段 | N | 透传参数,原样返回 |
| 参数名称 | 类型 | 是否必选 | 说明 |
|---|---|---|---|
| model | string | Y | 规则标识 |
| description | string | Y | 策略规则风险原因描述 |
| descriptionV2 | string | N | 新版策略规则风险原因描述 注:该参数为新版API返回参数,过渡阶段只有新策略才会返回 |
| riskSummary | json object | N | 风险摘要,目前包括各种风险类型的次数,如果type为NOVEL才返回 格式请见riskSummary结果详情 |
| riskDetail | json array | N | 每一段内容的风险详情,如果type为NOVEL才返回。如果returnHtml参数为true只返回REJECT和REVIEW的风险内容片段,如果returnHtml参数为false会返回全部内容片段(包括REJECT和REVIEW和PASS)。 格式请见riskDetail结果详情 |
| riskHtml | string | N | 风险内容标记的html,可嵌入需要展示的html页面,如果type为NOVEL且returnHtml参数为true才返回。 |
| hits | json_array | N | 命中信息,一般为空。命中详情在riskDetail中。 |
| passThrough | json_object | N | 透传参数,原样返回 |
其中,riskSummary内容是风险类型,具体如下:
| 参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
|---|---|---|---|---|
| riskType | int | 对应riskType风险出现的次数 | N | 风险类型:0:正常100:涉政200:色情210:辱骂300:广告400:灌水500:无意义600:违禁700:黑名单710:白名单800:高危账号900:自定义 |
其中,riskDetail是json array,其中每一项是一个内容片段的风险详情,具体如下:
| 参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
|---|---|---|---|---|
| type | string | 当前内容片段的类型 | Y | 可选值:text:文本image:图片 |
| content | string | 当前内容片段的内容 | Y | text是文本内容,image是图片url |
| beginPosition | int | 当前内容片段在输入中的起始位置,当type为image时该字段不返回 | N | 检测出的文本内容,从0开始计算位置;文本切分后,每个片段的文本内容的首字在全局检测出文本中的位置 |
| endPosition | int | 当前内容片段在输入中的结束位置,当type为image时该字段不返回 | N | 检测出的文本内容,从0开始计算位置;文本切分后,每个片段的文本内容的末尾字在全局检测出文本中的位置 |
| description | string | 当前内容片段的风险描述 | Y | 命中的对应名单中的所有敏感词 |
| riskLevel | string | 当前内容片段的处置建议 | Y | 可选值:PASS:通过REVIEW:审核REJECT: 拒绝 |
| riskType | int | 当前内容片段的标识风险类型 | Y | 当type为文本时:0:正常100:涉政200:色情210:辱骂300:广告400:灌水500:无意义600:违禁700:黑名单710:白名单800:高危账号900:自定义当type为图片时: 0:正常100:涉政200:色情210:性感300:广告310:二维码320:水印400:暴恐500:违规510:不良场景520:未成年人700:黑名单710:白名单800:高危账号900:自定义 |
| riskTypeDec | string | riskType对应的描述 | N | |
| model | string | 规则标识,用来标识文本命中的策略规则 | N | |
| matchedList | string | 命中敏感词所在的名单名称(该参数仅在命中敏感词时存在) | N | |
| matchedItem | string | 命中的具体敏感词(该参数仅在命中敏感词时存在) | N | |
| matchedField | string | 标识昵称或文本内容命中了敏感词(该参数仅在命中敏感词时存在) | N | 可选值:text:文本命中敏感词nickname:昵称命中敏感词 |
| matchedDetail | json_array | 命中的名单详情 | N | 详见详细结构 |
| index | int | 当前处理的片段索引 | N | 索引不区分文本和图片 |
| keywordsPosition | string | 命中的敏感词位置 | N | 在该段中的位置 |
| text | string | 图片中的ocr内容 | N | 图片片段识别出ocr内容时会返回该字段 |
其中,matchedDetail结构如下:
| 参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
|---|---|---|---|---|
| listId | string | Y | 返回码 | |
| matchedFiled | string_array | N | 标识昵称或文本内容命中了敏感词(该参数仅在命中敏感词时存在),可选值: text:文本命中敏感词 nickname:昵称命中敏感词 | |
| name | string | Y | 命中敏感词所在的名单名称 | |
| organization | string | N | 命中名单所属的公司标识,其中“GLOBAL”为全局名单 | |
| words | string_array | N | 命中的对应名单中的所有敏感词 | |
| wordPositions | json_array | N | 命中的对应名单中的所有敏感词及位置。详见wordPositions |
| 参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
|---|---|---|---|---|
| word | string | 辅助信息 | N | 命中的敏感词 |
| position | string | 辅助信息 | N | 敏感词所在位置 |
| 参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
|---|---|---|---|---|
| textNum | int | 当前请求中的字符数,与计费数目一致 | Y | 当前请求中的字符数,其中字符数包括汉字,英文,标点符号,空格等 |
| imgNum | int | 当前请求中的图片数,与计费数目一致 | Y | 当前请求中的图片数,如遇动图会截取3帧;如遇长图会进行切分 |
示例#
回调模式#
请求示例#
响应示例#
智能文档过滤上传接口#
请求参数#
请求URL:#
| 集群 | URL | 支持产品列表 |
|---|---|---|
| 北京 | http://api-article-bj.fengkongcloud.com/v1/saas/anti_fraud/article_async | 文档产品 |
字符编码格式:#
UTF-8字符集编码
请求方法:#
POST
建议超时时长:#
5s
请求参数:#
放在HTTP Body中,采用Json格式,Body大小不可超过3.5M,具体参数如下:
| 请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
|---|---|---|---|---|
| accessKey | string | 接口认证密钥 | Y | 由数美提供 |
| type | string | 平台业务类型 | N | 可选值:ZHIBO:直播ECOM:电商GAME:游戏NEWS:新闻资讯FORUM:论坛SOCIAL:社交NOVEL:小说 |
| imgType | string | 文档中的图片识别类型 | N | 可选值:POLITICS:涉政识别PORN:色情识别AD:广告识别LOGO:水印logo识别BEHAVIOR:不良场景识别,支持吸烟、喝酒、赌博、吸毒、避孕套和无意义画面OCR:图片中的OCR文字识别VIOLENCE:暴恐识别NONE:不需要识别图片如需做组合识别,通过下划线连接即可,例 如 POLITICS_PORN_AD 用于广告、色情和涉政识别 |
| txtType | string | 文档中的文字识别类型 | N | 可选值: POLITY:涉政检测 VIOLENT:暴恐检测 BAN:违禁检测 EROTIC:色情检测 DIRTY:辱>骂检测 ADVERT:广告检测 PRIVACY:隐私检测 ADLAW:广告法检测 MEANINGLESS:无意义检测 FRUAD:网络诈骗检测 UNPOACH:高价值用户防挖检测 TEXTMINOR: 未成年人内容检测 TEXTRISK:常规风险检测(包含:涉政、暴恐、违禁、色情、辱骂、广告、隐私、广告法、无意义) 以上type可以下划线组>合,如:TEXTRISK_FRUAD;type间组合取并集,如:TEXTRISK_POLITY按照常规风险检测处理;不传时按传入常规风险处理。 |
| appId | string | 应用标识 | N | 用于区分相同公司的不同应用,该参数传递值可与数美服务协商 |
| data | json_object | 请求的数据内容 | Y | 最长1MB, 详见data参数 |
其中,data的内容同同步接口:
返回结果#
请求返回参数#
放在HTTP Body中,采用Json格式,具体参数如下:
| 参数名称 | 类型 | 参数说明 | 是否必返 | 规范 |
|---|---|---|---|---|
| code | int | 返回码 | Y | 1100:成功1901:QPS超限1902:参数不合法1903:服务失败9100:余额不足9101:无权限操作 |
| message | string | 返回码描述 | Y | 和code对应: 成功 QPS超限 参数不合法 服务失败 余额不足 无权限操作 |
| requestId | string | 请求标识 | Y | 本次请求数据的唯一标识,用于问题排查和效果优化,强烈建议保存 |
示例#
请求示例#
响应示例#
结果查询接口#
该接口用于查询机审和人审识别结果
请求参数#
请求URL:#
| 集群 | URL | 支持产品列表 |
|---|---|---|
| 北京 | http://api-article-bj.fengkongcloud.com/v1/saas/anti_fraud/article/query | 文档产品 |
字符编码格式:#
UTF-8字符集编码
请求方法:#
POST
建议超时时长:#
1s
请求参数:#
放在HTTP Body中,采用Json格式,具体参数如下:
| 请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
|---|---|---|---|---|
| accessKey | string | 接口认证密钥 | Y | 由数美提供 |
| requestIds | array | 机器审核流水号 | Y | 最多支持10条 字符串数组 item 为数美返回的流水号 |
返回结果#
请求返回参数#
| 请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
|---|---|---|---|---|
| code | int | 返回码 | Y | |
| message | string | 返回码描述 | Y | |
| contents | json array | 内容 | Y | 详见contents内容 |
| 请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
|---|---|---|---|---|
| requestId | string | 请求唯一标识 | Y | |
| humanResult | json object | 人审结果,人审完成后才会存在 | N | |
| machineResult | json object | 机审结果,机审完成后才会存在 | N | 参考回调接口返回字段 |
| mergeResult | json_object | 统一人审和机审结果 | N | 优先返回人审结果,如果人审结果没有,返回机审结果,如果都没有不存在 |
其中,humanResult/mergeResult的内容如下:
| 请求参数名 | 类型 | 参数说明 | 是否必传 | 规范 |
|---|---|---|---|---|
| riskLevel | string | 处置指令 | Y | 建议取值:REJECT:删除PASS:发布 |
