Step1:账号登录及资源领取

调用百度智能云的内容审核能力,首先需注册百度智能云账号:

点击此处,即可进行账号创建及登录。

登录百度智能云账号后,找到产品服务-人工智能下的产品。

根据操作指引,分别领取免费资源、创建应用、配置策略和调用服务

Step2:在线验证

创建应用与配置策略完成后,即可在进行在线验证

选择对应的内容类型,输入或上传相关内容,即可进行在线验证

Step3: 编写示例程序

根据第一步创建应用时生成的API KEY 以及 KEY,我们就可以写一个示例代码调用百度AI开放平台的内容审核能力

准备开发环境

我们选择用来快速搭建一个原型,关于如何安装。可以参考下表列出的不同操作系统的安装方法进行安装。

的官方下载地址:下载

快速测试包

平台的用户如果对上述的安装感到困难,可以下载我们的一键测试包,下载地址:测试包。

解压zip文件后,双击run.bat即可测试。

编写代码

新建一个 main.py

粘贴以下内容,不要忘记替换你的 以及 :

# coding=utf-8
import sys
import json
import base64
# 保证兼容python2以及python3
IS_PY3 = sys.version_info.major == 3
if IS_PY3:
    from urllib.request import urlopen
    from urllib.request import Request
    from urllib.error import URLError
    from urllib.parse import urlencode
    from urllib.parse import quote_plus
else:
    import urllib2
    from urllib import quote_plus
    from urllib2 import urlopen
    from urllib2 import Request
    from urllib2 import URLError
    from urllib import urlencode
# 防止https证书校验不正确
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
API_KEY = 'eQnGqPdFTTctqkjHvdUEzmrC'
SECRET_KEY = 'HDBuwWT4pfSBGyLkTEAYhwoQkoDGrWU2'
IMAGE_CENSOR = "https://aip.baidubce.com/rest/2.0/solution/v1/img_censor/v2/user_defined"
TEXT_CENSOR = "https://aip.baidubce.com/rest/2.0/solution/v1/text_censor/v2/user_defined";
"""  TOKEN start """
TOKEN_URL = 'https://aip.baidubce.com/oauth/2.0/token'
"""
    获取token
"""
def fetch_token():
    params = {'grant_type': 'client_credentials',
              'client_id': API_KEY,
              'client_secret': SECRET_KEY}
    post_data = urlencode(params)
    if (IS_PY3):
        post_data = post_data.encode('utf-8')
    req = Request(TOKEN_URL, post_data)
    try:
        f = urlopen(req, timeout=5)
        result_str = f.read()
    except URLError as err:
        print(err)
    if (IS_PY3):
        result_str = result_str.decode()
    result = json.loads(result_str)
    if ('access_token' in result.keys() and 'scope' in result.keys()):
        if not 'brain_all_scope' in result['scope'].split(' '):
            print ('please ensure has check the  ability')
            exit()
        return result['access_token']
    else:
        print ('please overwrite the correct API_KEY and SECRET_KEY')
        exit()
"""
    读取文件
"""
def read_file(image_path):
    f = None
    try:
        f = open(image_path, 'rb')
        return f.read()
    except:
        print('read image file fail')
        return None
    finally:
        if f:
            f.close()
"""
    调用远程服务
"""
def request(url, data):
    req = Request(url, data.encode('utf-8'))
    has_error = False
    try:
        f = urlopen(req)
        result_str = f.read()
        if (IS_PY3):
            result_str = result_str.decode()
        return result_str
    except  URLError as err:
        print(err)
if __name__ == '__main__':
    # 获取access token
    token = fetch_token()
    # 拼接图像审核url
    image_url = IMAGE_CENSOR + "?access_token=" + token
    # 拼接文本审核url
    text_url = TEXT_CENSOR + "?access_token=" + token
    file_content = read_file('./image_normal.jpg')
    result = request(image_url, urlencode({'image': base64.b64encode(file_content)}))
    print("----- 正常图调用结果 -----")
    print(result)
    file_content = read_file('./image_advertise.jpeg')
    result = request(image_url, urlencode({'image': base64.b64encode(file_content)}))
    print("----- 广告图调用结果 -----")
    print(result)
    text = "我们要热爱祖国热爱党"
    result = request(text_url, urlencode({'text': text}))
    print("----- 正常文本调用结果 -----")
    print(result)
    text = "我要爆粗口啦:百度AI真他妈好用"
    result = request(text_url, urlencode({'text': text}))
    print("----- 粗俗文本调用结果 -----")
    print(result)
    

运行代码

在命令行中运行 main.py

结果

若代码正确运行,命令行界面上会显示出运行结果:

 ----- 正常图调用结果 -----
{"conclusion":"合规","log_id":15589290206915234,"conclusionType":1}
----- 广告图调用结果 -----
{"conclusion":"不合规","log_id":15589290221307686,"data":[{"msg":"存在水印码内容","probability":0.86516607,"type":5}],"conclusionType":2}
----- 正常文本调用结果 -----
{"conclusion":"合规","log_id":15589290234750607,"conclusionType":1}
----- 粗俗文本调用结果 -----
{"conclusion":"疑似","log_id":15589290237990632,"data":[{"msg":"疑似存在文本色情不合规","conclusion":"疑似","hits":[{"probability":0.802,"datasetName":"百度默认文本反作弊库","words":[]}],"subType":2,"conclusionType":3,"type":12}],"conclusionType":3}

可以看到结果中返回了内容审核服务对于图片以及文本的审核结果,包括了概率以及不合规的类型,具体字段的含义都在内容审核技术文档中有这详细的释义。