欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Base64编码原理分析与PHP实现

程序员文章站 2022-03-13 14:21:59
base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于2的6次方等于64,所以每6个为一个单元,对应某个可打印字符。 三个bites有24个比特,对应于4个base64单元,即3个字...

base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于2的6次方等于64,所以每6个为一个单元,对应某个可打印字符。

三个bites有24个比特,对应于4个base64单元,即3个字节需要用4个可打印字符来表示。它可用来作为电子邮件的传输编码。

 

在base64中的可打印字符包括字母a-z、a-z、数字0-9,这样共有62个字符,此外两个可打印符号在不同的中而不同。

 

如在mime(多用途邮件扩展)中,base64的使用的64个可打印字符

 

a-za-z:大小写字母各26个

 

0-9:加上10个数字

 

+:加号

 

/:斜杠

 

一共64个字符,等号“=”用来作为后缀用途

 

对应的转换关系为

 

0-63:a-za-z0-9+/

 

 

 

转换的时候,将三个byte的数据,先后放入一个24bit的缓冲区中,先来的byte占高位。数据不足3byte的话,于缓冲器中剩下的bit用0补足。然后,每次取出6(因为26=64)个bit,按照其值选择abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz0123456789+/中的字符作为编码后的输出。不断进行,直到全部输入数据转换完成。

 

当原数据长度不是3的整数倍时, 如果最后剩下一个输入数据,在编码结果后加2个“=”;如果最后剩下两个输入数据,编码结果后加1个“=”;如果没有剩下任何数据,就什么都不要加,这样才可以保证数据还原的正确性。

 

实例分析:

 

编码:"lailaiji"

 

通过查ascii表找到对应关系

 

l:0x4c |  a:0x61  | i:0x69   |  l:0x6c    |  j:0x6a

 

因此转换成二进制为:0100 1100 , 0110 0001 , 0110 1001 , 0110 1100 ,  0110 0001 , 0110 1001 , 0110 1010 ,  0110 1001

 

第一步:先取三个字节的数据即:0100 1100 , 0110 0001 , 0110 1001,然后从这个三字节中取出6位即010011,在最高位补充两个位00使其成为1个byte,即0001 0011,剩余的18位也如此循环,最终这三个字节将扩展成为4个字节即:0001 0011, 0000 0110, 0000 0101, 0010 1001

 

第二步,从剩余的字节序列中再重复第一步,走到小于3个字节

 

第三步,这时剩余字节为:0110 1010,0110 1001不足3个字节,需要在从低位以0进行补充,即成0110 1010,0110 1001,0000 0000重复第一步,得到:0001 1010,0010 0110, 0010 0100, 0000 0000,

 

经过以后的运算后,我们将得到一组位序列:

 

0001 0011, 0000 0110, 0000 0101, 0010 1001

 

0001 1011,0000 0110, 0000 0101, 0010 1001

 

0001 1010,0010 0110, 0010 0100, 0000 0000 

 

转换成十进制为:19,6,5,41,27,6,5,41,26,38,36,0

 

对应的字符为:t,g,f,p,b,g,f,p,a,m,k,a

 

特别注重的是,最后一个字节0000 0000即0x00,通过查表为a,由于最后这8位是补充的,所以它应当被转换成=号,而不是a

 

因此:最终结果为:tgfpbgfpamk=

 

php实现:

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

<?php

$input = '赖来基';

$obj = new mybase64();

$output = $obj->encode($input);

echo "encode:",$output.php_eol;

$output = $obj->decode($output);

echo "decode:",$output.php_eol;

class mybase64{

    private $_table = array();

    private $_revtable = array();

    public function __construct(){

        $this->_inittable();

    }

    public function decode($string)

    {

        $orign_len = strlen($string);

        $j = 0;

        $ret = null;

        for($i=0; $i<$orign_len; $i+=4)

        {

            $chr1 = $this->getrevchr($string[$i]);

            $chr2 = $this->getrevchr($string[$i+1]);

            $chr3 = $this->getrevchr($string[$i+2]);

            $chr4 = $this->getrevchr($string[$i+3]);

            $_chr1 = $chr1<<2 | ($chr2&0x3f) >>4;

            $_chr2 = ($chr2&0x0f)<<4 | ($chr3&0xfc) >>2;

            $_chr3 = ($chr3&0x03)<<6 | $chr4;

            $ret .= chr($_chr1);

            $ret .= chr($_chr2);

            $ret .= chr($_chr3);

        }

        $ret = rtrim($ret);

        return $ret;

    }

    private function getrevchr($chr)

    {

        if(isset($this->_revtable[$chr]))

        {

            return $this->_revtable[$chr];

        }else{

            return 0;

        }

    }

    public function _decode($string)

    {

        $orign_len = strlen($string);

        $de = null;

        $kv = array_flip($this->_table);

        $b  = null;

        for($i = 0 ;$i < $orign_len;$i++)

        {

            $chr = $string[$i];

            if($chr != '='){

                $c = $kv[$chr];

            }else{

                $c = chr(0);

            }

            printf("%x",$c);

            $b[] = pack('c',$c);

            echo php_eol;

        }

        for($i = 0 ;$i < count($b);$i+=3){

            $ch1 = ($b[$i]<<2) | ($b[$i+1]>>4);

            $ch2 = ($b[$i+1]<<4) | ($b[$i+2]>>2);

            $ch3 = ($b[$i+2]<<6) | ($b[$i+3]);

            printf('%08b,%08b,%08b',$ch1,$ch2,$ch3);

            echo php_eol;

            printf('%08b,%08b',($b[$i]<<2) , ($b[$i+1]>>4));

 

            echo php_eol;

        }

    }

    public function encode($string)

    {

        $orign_len = strlen($string);

        $len       = intval(ceil($orign_len/3)*3);

        $bin       = pack('a'.$len,$string);

        $gen       = null;

        for($i=0; $i<$len; $i+=3)

        {

            $ch1 = ord($bin[$i]) >> 2;

            $ch2 = ((ord($bin[$i]) & 0x03) << 4) | (ord($bin[$i+1]) >> 4);

            $ch3 = ((ord($bin[$i+1]) & 0x0f) << 2) | ((ord($bin[$i+2]) & 0xc0) >> 6);

            $ch4 = ord($bin[$i+2]) & 0x3f;

            $gen.= $this->_table[$ch1];

            $gen.= $this->_table[$ch2];

            $gen.= $this->_table[$ch3];

            $gen.= $this->_table[$ch4];

        }

        if($orign_len-$len){

            $gen = substr($gen,0, -abs($orign_len-$len));

            for($i=0;$i<$len-$orign_len;$i++)

            {

                $gen .= '=';

            }          

        }

        return $gen;

    }

    private function  _inittable()

    {

        $tbl = array();

        for($i=ord('a');$i<=ord('z');$i++)

        {

            $tbl[] = chr($i);

        }

        for($i=ord('a');$i<=ord('z');$i++)

        {

            $tbl[] = chr($i);

        }

        for($i=ord('0');$i<=ord('9');$i++)

        {

            $tbl[] = chr($i);

        }

        $tbl[]           = '+';

        $tbl[]           = '/';

        $reverse         = array_flip($tbl);

        $this->_table    = $tbl;

        $this->_revtable = $reverse;

    }

}