欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

关于PHP二进制安全的解释

程序员文章站 2022-04-28 17:30:04
...
解释一:

  PHP里,有string的概念。

  string里,每个字符的大小为byte(与PHP相比,Java的每个字符为Character,是UTF8字符,C语言的每个字符可以在编译时选择)。
byte里,有ASCII代码的字符,例如ABC,123,abc,也有一些特殊字符,例如回车,退格之类的。
特殊字符很多是不能显示的。或者说,他们的显示方式没有标准,例如编码65到哪儿都是字母A,编码97到哪儿都是字符a,退格在有的地方显示成一个符号,在有的地方就会真的把前一个字符退掉。
  PHP以C为基础,所以很多描述都是以C为对比。C的字符串里,一种经典的定义就是,以编码0作为字符串的结尾。那么,假设这样一个string,里面3个字符的编码分别是97,0,97。那么,C里面如果有str_replace等效的函数, 利用它把97换成98,那么这个函数读取到0的时候,就认为已经结束了,就会得到98,0,97。跟它对应的,PHP里的str_replace是二进制安全的,那么这个0不会被视为特殊的结束符号,于是结果就是98,0,98。
  【二进制安全】在PHP文档里,基本就是这么一个意思:C语言里的功能类似的函数会对有的字符特别处理,而PHP这个函数对于所有字符一视同仁,不用担心会有特殊字符影响处理,特别不用担心编码0字符。

解释二:

  c中的strlen函数就不算是binary safe的,因为它依赖于特殊的字符'\0'来判断字符串是否结束,

所以对于字符串str = "1234\0123"来说,strlen(str)=4

  而在php中,strlen函数是binary safe的,因为它不会对任何字符(包括'\0')进行特殊解释,

所以在php中,strlen(str)=8

  所以,我理解的二进制安全的意思是:只关心二进制化的字符串,不关心具体格式,

只会严格的按照二进制的数据存取。不会妄图已某种特殊格式解析数据。