文件编码解码小工具
程序员文章站
2024-02-05 20:31:40
...
Base64编码解码原理
Base64编码是用64个可见字符表示任意二进制数据的方法。
以3个8bit的字符为一组,针对每组获取每个字符的ASCII编码,将ASCII编码转换成8bit的二进制,得到一组24bit的字节;
将24bit划分为4个6bit的字节,每个6bit的字节高两位补0,得到4个8bit的字节
将4个8bit的字节转换成十进制,对照Base64编码表得到编码后的字符
说明:如果文本结尾不足3个字符,对转化为6为字符后,后面剩余的二进制位可能是2位或者4位(因为是N%6),余数为0时代表整除了,在剩余二进制位后面补0至6个二进制位,再在结尾加=号,使编码后的字符满足(N*8+等号个数)/6=base64的字符个数
Base64编码表:
项目设计
编码模块
//Base64 编码(编码时字符是8bit表示)
void Base64_encode(const char* filename)
{
//创建一个编码文件并往里写入
string encode = filename;
size_t pos = encode.rfind('.');//找到第一个'.'出现的位置
assert(pos != string::npos);//npos是string定义为保证大于所有有效下标的值
//substr函数返回一个新建的初始化为string对象的子串的拷贝对象
encode = encode.substr(0, pos);
encode += ".encode";
FILE* fin = fopen(encode.c_str(), "wb");
assert(fin);
FILE* fout = fopen(filename, "rb");
assert(fout);
int data_len = Size(filename);
char* data = ReadFromFile(fout, data_len);
int prepare = 0;
int ret_len;//空间的大小
int temp = 0;
char *ret = NULL;//ret指向开辟的空间
char *f = NULL;//将ret的值赋给f,f进行向后遍历
int tmp = 0;//记录数据的长度
char changed[4];
//开辟空间的大小(开辟多少个3字节的空间)
ret_len = data_len / 3;
temp = data_len % 3;
if (temp > 0)
{
//如果除3之后,有剩余说明还需开辟一个字节
ret_len += 1;
}
ret_len = ret_len * 4 + 1;
ret = (char *)malloc(ret_len);
if (ret == NULL)
{
printf("No enough memory.\n");
exit(0);
}
memset(ret, 0, ret_len);
f = ret;
//每次都是三个字符进行编码,直到所有的字符都进行编码
while (tmp < data_len)
{
temp = 0;//表示每次编码的字符数
prepare = 0;
memset(changed, '\0', 4);
while (temp < 3)
{
if (tmp >= data_len)
{
break;
}
//prepare<<8:每个字符占8个bit,源文本中每个是3个字符,每次或之前都向左移8位;保证3个字符得到一个二进制编码
//data[tmp]&0xFF:保证生成的字符串是8bit位
prepare = ((prepare << 8) | (data[tmp] & 0xFF));
tmp++;
temp++;
}
//防止上述while退出时,最后字符数不足3个,prepare还是要凑够3个字符的位置
prepare = (prepare << ((3 - temp) * 8));
//4次for循环,当3个字符存在的时候,就可以将其拆成4个字符
for (int i = 0; i < 4; i++)
{
if (temp < i)
{
changed[i] = 0x40;
}
else
{
//0x3F:6bit表示一个字符
changed[i] = (prepare >> ((3 - i) * 6)) & 0x3F;
}
*f = base[changed[i]];
f++;
}
}
*f = '\0';
/*printf("%s\n", ret);*/
WriteToFile(ret, fin);
fclose(fin);
fclose(fout);
}
解码模块
//Base64 解码
void Base64_decode(const char *filename)
{
string unencode = filename;
//找到第一个'.'出现的位置
size_t pos = unencode.rfind('.');
assert(pos != string::npos);//npos是string定义为保证大于所有有效下标的值
//substr函数返回一个新建的初始化为string对象的子串的拷贝对象
unencode = unencode.substr(0, pos);
unencode += ".unencode";
//以读的方式打开编码文件,以写的方式打开解码文件
FILE* fin = fopen(unencode.c_str(), "wb");
assert(fin);
FILE* fout = fopen(filename, "rb");
assert(fout);
int data_len = Size(filename);
char* data = ReadFromFile(fout, data_len);
//有多少的四个字符解码后为三个字符
int ret_len = (data_len / 4) * 3;//解码开辟空间的大小
int equal_count = 0;//等号的个数
char *ret = NULL;
char *f = NULL;
int tmp = 0;
int temp = 0;
int prepare = 0;
if (*(data + data_len - 1) == '=')
{
equal_count += 1;
}
if (*(data + data_len - 2) == '=')
{
equal_count += 1;
}
//为了4个字符转3个字符的时候字节进行对齐
switch (equal_count)
{
case 0:
ret_len += 4;//3 + 1 [1 for NULL]
break;
case 1:
ret_len += 4;//Ceil((6*3)/8)+1
break;
case 2:
ret_len += 3;//Ceil((6*2)/8)+1
break;
}
ret = (char *)malloc(ret_len);
if (ret == NULL)
{
printf("No enough memory.\n");
exit(0);
}
memset(ret, 0, ret_len);
f = ret;
while (tmp < (data_len - equal_count))
{
temp = 0;
prepare = 0;
while (temp < 4)
{
if (tmp >= (data_len - equal_count))
{
break;
}
prepare = (prepare << 6) | (find_pos(data[tmp]));
temp++;
tmp++;
}
prepare = prepare << ((4 - temp) * 6);
for (int i = 0; i < 3; i++)
{
if (i == temp)
{
break;
}
*f = (char)((prepare >> ((2 - i) * 8)) & 0xFF);
f++;
}
}
*f = '\0';
/*printf("%s\n", ret);*/
WriteToFile(ret, fin);
fclose(fin);
fclose(fout);
}
上一篇: FragmentPagerAdapter+ViewPager实现Tab
下一篇: PHP 代码加密
推荐阅读
-
文件编码解码小工具
-
简述小数据池,编码和解码
-
Js文件源编码与页面编码冲突 博客分类: 工作 IE
-
源文件与操作系统文件编码冲突导致中文乱码问题 博客分类: 工作 LinuxXMLXPAjaxWindows
-
源文件与操作系统文件编码冲突导致中文乱码问题 博客分类: 工作 LinuxXMLXPAjaxWindows
-
Js文件源编码与页面编码冲突 博客分类: 工作 IE
-
php 正确解码javascript中通过escape编码后的字符
-
PHP解码unicode编码中文字符代码示例,
-
编码和解码函数
-
javascript - 请问下这个什么url结构的跳转。我实在分不出来,求解?编码解码 加密 还是不行