文件编码解码小工具

程序员文章站 2024-02-05 20:31:40

...

Base64编码解码原理
Base64编码是用64个可见字符表示任意二进制数据的方法。

以3个8bit的字符为一组，针对每组获取每个字符的ASCII编码，将ASCII编码转换成8bit的二进制，得到一组24bit的字节；
将24bit划分为4个6bit的字节，每个6bit的字节高两位补0，得到4个8bit的字节
将4个8bit的字节转换成十进制，对照Base64编码表得到编码后的字符

说明：如果文本结尾不足3个字符，对转化为6为字符后，后面剩余的二进制位可能是2位或者4位（因为是N%6），余数为0时代表整除了，在剩余二进制位后面补0至6个二进制位，再在结尾加=号，使编码后的字符满足（N*8+等号个数）/6=base64的字符个数

Base64编码表：
文件编码解码小工具
项目设计
编码模块

//Base64 编码(编码时字符是8bit表示)
    void Base64_encode(const char* filename)
    {
        //创建一个编码文件并往里写入
        string encode = filename;
        size_t pos = encode.rfind('.');//找到第一个'.'出现的位置
        assert(pos != string::npos);//npos是string定义为保证大于所有有效下标的值
        //substr函数返回一个新建的初始化为string对象的子串的拷贝对象
        encode = encode.substr(0, pos);
        encode += ".encode";

        FILE* fin = fopen(encode.c_str(), "wb");
        assert(fin);
        FILE* fout = fopen(filename, "rb");
        assert(fout);

        int data_len = Size(filename);
        char* data = ReadFromFile(fout, data_len);

        int prepare = 0;
        int ret_len;//空间的大小
        int temp = 0;
        char *ret = NULL;//ret指向开辟的空间
        char *f = NULL;//将ret的值赋给f，f进行向后遍历
        int tmp = 0;//记录数据的长度
        char changed[4];

        //开辟空间的大小(开辟多少个3字节的空间)
        ret_len = data_len / 3;
        temp = data_len % 3;
        if (temp > 0)
        {
            //如果除3之后，有剩余说明还需开辟一个字节
            ret_len += 1;
        }
        ret_len = ret_len * 4 + 1;
        ret = (char *)malloc(ret_len);
        if (ret == NULL)
        {
            printf("No enough memory.\n");
            exit(0);
        }
        memset(ret, 0, ret_len);

        f = ret;
        //每次都是三个字符进行编码，直到所有的字符都进行编码
        while (tmp < data_len)
        {
            temp = 0;//表示每次编码的字符数
            prepare = 0;
            memset(changed, '\0', 4);
            while (temp < 3)
            {

                if (tmp >= data_len)
                {
                    break;
                }

                //prepare<<8：每个字符占8个bit，源文本中每个是3个字符，每次或之前都向左移8位；保证3个字符得到一个二进制编码
                //data[tmp]&0xFF：保证生成的字符串是8bit位
                prepare = ((prepare << 8) | (data[tmp] & 0xFF));
                tmp++;
                temp++;
            }
            //防止上述while退出时，最后字符数不足3个，prepare还是要凑够3个字符的位置
            prepare = (prepare << ((3 - temp) * 8));

            //4次for循环，当3个字符存在的时候，就可以将其拆成4个字符
            for (int i = 0; i < 4; i++)
            {
                if (temp < i)
                {
                    changed[i] = 0x40;
                }
                else
                {
                    //0x3F：6bit表示一个字符
                    changed[i] = (prepare >> ((3 - i) * 6)) & 0x3F;
                }
                *f = base[changed[i]];
                f++;
            }
        }
        *f = '\0';

        /*printf("%s\n", ret);*/

        WriteToFile(ret, fin);

        fclose(fin);
        fclose(fout);
    }

解码模块

//Base64 解码
    void Base64_decode(const char *filename)
    {
        string unencode = filename;
        //找到第一个'.'出现的位置
        size_t pos = unencode.rfind('.');
        assert(pos != string::npos);//npos是string定义为保证大于所有有效下标的值
        //substr函数返回一个新建的初始化为string对象的子串的拷贝对象
        unencode = unencode.substr(0, pos);
        unencode += ".unencode";

        //以读的方式打开编码文件，以写的方式打开解码文件
        FILE* fin = fopen(unencode.c_str(), "wb");
        assert(fin);
        FILE* fout = fopen(filename, "rb");
        assert(fout);

        int data_len = Size(filename);
        char* data = ReadFromFile(fout, data_len);

        //有多少的四个字符解码后为三个字符
        int ret_len = (data_len / 4) * 3;//解码开辟空间的大小
        int equal_count = 0;//等号的个数
        char *ret = NULL;
        char *f = NULL;
        int tmp = 0;
        int temp = 0;
        int prepare = 0;

        if (*(data + data_len - 1) == '=')
        {
            equal_count += 1;
        }
        if (*(data + data_len - 2) == '=')
        {
            equal_count += 1;
        }

        //为了4个字符转3个字符的时候字节进行对齐
        switch (equal_count)
        {
        case 0:
            ret_len += 4;//3 + 1 [1 for NULL]
            break;
        case 1:
            ret_len += 4;//Ceil((6*3)/8)+1
            break;
        case 2:
            ret_len += 3;//Ceil((6*2)/8)+1
            break;
        }
        ret = (char *)malloc(ret_len);
        if (ret == NULL)
        {
            printf("No enough memory.\n");
            exit(0);
        }
        memset(ret, 0, ret_len);

        f = ret;
        while (tmp < (data_len - equal_count))
        {
            temp = 0;
            prepare = 0;
            while (temp < 4)
            {
                if (tmp >= (data_len - equal_count))
                {
                    break;
                }
                prepare = (prepare << 6) | (find_pos(data[tmp]));
                temp++;
                tmp++;
            }
            prepare = prepare << ((4 - temp) * 6);
            for (int i = 0; i < 3; i++)
            {
                if (i == temp)
                {
                    break;
                }
                *f = (char)((prepare >> ((2 - i) * 8)) & 0xFF);
                f++;
            }
        }
        *f = '\0';
        /*printf("%s\n", ret);*/

        WriteToFile(ret, fin);

        fclose(fin);
        fclose(fout);
    }

文件编码解码小工具

文件编码解码小工具

简述小数据池,编码和解码

Js文件源编码与页面编码冲突博客分类：工作 IE

源文件与操作系统文件编码冲突导致中文乱码问题博客分类：工作 LinuxXMLXPAjaxWindows

源文件与操作系统文件编码冲突导致中文乱码问题博客分类：工作 LinuxXMLXPAjaxWindows

Js文件源编码与页面编码冲突博客分类：工作 IE

php 正确解码javascript中通过escape编码后的字符

PHP解码unicode编码中文字符代码示例，

编码和解码函数

javascript - 请问下这个什么url结构的跳转。我实在分不出来，求解？编码解码加密还是不行

文件编码解码小工具

文件编码解码小工具

简述小数据池,编码和解码

Js文件源编码与页面编码冲突 博客分类： 工作 IE

源文件与操作系统文件编码冲突导致中文乱码问题 博客分类： 工作 LinuxXMLXPAjaxWindows

源文件与操作系统文件编码冲突导致中文乱码问题 博客分类： 工作 LinuxXMLXPAjaxWindows

Js文件源编码与页面编码冲突 博客分类： 工作 IE

php 正确解码javascript中通过escape编码后的字符

PHP解码unicode编码中文字符代码示例，

编码和解码函数

javascript - 请问下这个什么url结构的跳转。我实在分不出来，求解？编码解码 加密 还是不行

Js文件源编码与页面编码冲突博客分类：工作 IE

源文件与操作系统文件编码冲突导致中文乱码问题博客分类：工作 LinuxXMLXPAjaxWindows

源文件与操作系统文件编码冲突导致中文乱码问题博客分类：工作 LinuxXMLXPAjaxWindows

Js文件源编码与页面编码冲突博客分类：工作 IE

javascript - 请问下这个什么url结构的跳转。我实在分不出来，求解？编码解码加密还是不行