欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

写代码爬取了某 Hub 资源,只为撸这个鉴黄平台!

程序员文章站 2022-03-06 11:05:39
...

点击上方 "程序员小乐"关注, 星标或置顶一起成长

每天凌晨00点00分, 第一时间与你相约

每日英文

Someday, you will find the one, who will watch every sunrise with you until the sunset of your life.

总有一天,你会遇上那个人,陪你看每一次日出,直到你的人生落幕。

每日掏心

有时候不是不明白,而是明白了也不知道该怎么做,于是就保持了沉默。

来自:码匠笔记 | 责编:乐乐

写代码爬取了某 Hub 资源,只为撸这个鉴黄平台!

程序员小乐(ID:study_tech)第 954 次推文  图源:百度

往日回顾:老板说“把系统升级到https”,我用一个脚本实现了,而且永久免费!

     

   正文   

黄色已经是我们所不容然而却防不胜防的,尤其是对于做内容的工具和平台,所以花了30分钟搭建了一个鉴黄平台,分享给大家。

数据准备

找了 N 多资源都不能解决问题,于是怒爬某 Bub资料,备用准备验证鉴黄效果。

账号准备

本文使用的是 UCloud 提供的 UAI-Censor,目前他支持图片,暴恐、涉政会陆续上线。他提供了每日2000张免费调用额度,所以无论对于测试还是小众的工具足够了。

1. 使用如下链接注册账号

https://urlify.cn/UNjURr

2. 创建 UAI-Censor 应用

获得应用 ID 进行鉴黄 API 调用的时候使用,注册成功以后进入控制台,搜索 UAI,然后点击 AI 内容审核

写代码爬取了某 Hub 资源,只为撸这个鉴黄平台!

点击创建应用,输入自定义的应用名称,点击确定

写代码爬取了某 Hub 资源,只为撸这个鉴黄平台!

点击确定以后会显示成功的弹框,高亮部分就是你的应用ID,留着备用

写代码爬取了某 Hub 资源,只为撸这个鉴黄平台!

3. 获取公钥、私钥,应用ID

获取了,但是不能所有人都操作吧?所有需要去注册一个公钥和私钥,这样只有你自己可以使用。点击进入如下链接
https://console.ucloud.cn/uapi/apikey
点击显示即可查看公钥私钥了

写代码爬取了某 Hub 资源,只为撸这个鉴黄平台!

到这里就是万事具备只欠东风

4. 编码

在编码之前我们可以手工调用一下 API 看下返回结果


写代码爬取了某 Hub 资源,只为撸这个鉴黄平台!

如图所示,我们输入公钥、私钥和应用ID以后,点击验证会返回一堆的 JSON 其实我们关心的就是 Result 里面的 Porn 的 Suggestion,pass-放行, forbid-封禁, check-人工审核,那么上面这个测试就是 pass 放行了,等下,你居然不相信是吗?这时候某 Hub 的资源就派上用场了,来一张。

关注公众号程序员小乐回复关键字“offer”获取算法面试题和答案。

实在不忍直视啊,我就打码了,不过看到  forbid了吗

写代码爬取了某 Hub 资源,只为撸这个鉴黄平台!

那我们直接编码吧,代码也是非常的简单,其中uaicensorPublicKey 和 uaicensorPrivateKey 是你自己的,这里就不显示了,因为使用的是 SpringBoot 项目,RestTemplate 用起来也是非常简单。

 /**
     * @param imageUrl
     * @return pass-放行, forbid-封禁, check-人工审核
     * @throws Exception
     */
    public String check(String imageUrl) {
        String ucloudUrl = "http://api.uai.ucloud.cn/v1/image/scan";
        String appId = "uaicensor-rjmvogpx";
        String uaicensorPublicKey = null;
        String uaicensorPrivateKey = null;
        
        //图片绝对路径
        RestTemplate rest = new RestTemplate();
        HttpHeaders headers = new HttpHeaders();
        /**
         * 生成signature,首字母排序
         */
        String timestamp = System.currentTimeMillis() + "";
        SortedMap<Object, Object> packageParams = new TreeMap<>();
        packageParams.put("PublicKey", uaicensorPublicKey);
        packageParams.put("ResourceId", appId);
        packageParams.put("Timestamp", timestamp);
        packageParams.put("Url", imageUrl);
        String signature = null;
        try {
            signature = UCloudUtil.createSign(packageParams, uaicensorPrivateKey);
        } catch (Exception e) {
            return null;
        }
        /**
         * 参数
         */
        MultiValueMap<String, Object> param = new LinkedMultiValueMap<>();
        param.add("Scenes", "porn");
        param.add("Method", "url");
        param.add("Url", imageUrl);
        /**
         * headers 参数
         */
        headers.setContentType(MediaType.parseMediaType("multipart/form-data; charset=UTF-8"));
        headers.set("PublicKey", uaicensorPublicKey);
        headers.set("Signature", signature);
        headers.set("ResourceId", appId);
        headers.set("Timestamp", timestamp);
        HttpEntity<MultiValueMap<String, Object>> httpEntity = new HttpEntity<>(param, headers);
        ResponseEntity<String> responseEntity = rest.exchange(ucloudUrl, HttpMethod.POST, httpEntity, String.class);
        String body = responseEntity.getBody();
        JSONObject jsonObject = JSON.parseObject(body);
        if (jsonObject.getInteger("RetCode") == 0) {
            String res = jsonObject.getJSONObject("Result").getJSONObject("Porn").getString("Suggestion");
            return res;
        }
        return null;
    }

是不是非常简单?那么开始你的探索之旅吧?

写代码爬取了某 Hub 资源,只为撸这个鉴黄平台!

欢迎在留言区留下你的观点,一起讨论提高。如果今天的文章让你有新的启发,欢迎转发分享给更多人。欢迎加入程序员小乐技术交流群,在后台回复“加群”或者“学习”即可。

猜你还想看

阿里、腾讯、百度、华为、京东最新面试题汇集

不想CRUD干到老,就来看看这篇OOM排查的实战案例!

面试鹅厂,我被虐的体无完肤!糗大了!

Nginx + Spring Boot 实现负载均衡

写代码爬取了某 Hub 资源,只为撸这个鉴黄平台!

关注订阅号「程序员小乐」,收看更多精彩内容

嘿,你在看吗写代码爬取了某 Hub 资源,只为撸这个鉴黄平台!