hash算法
程序员文章站
2022-07-15 15:39:49
...
Hash,一般翻译做"散列 ",也有直接音译为"哈希 "的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法 ,变换成固定长度的输出,该输出就是散列值 。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数 。
HASH主要用于信息安全领域中加密算法,它把一些不同长度的信息转化成杂乱的128位的编码里,叫做HASH值. 也可以说,hash就是找到一种数据内容和数据存放地址之间的映射关系
了解了hash基本定义,就不能不提到一些著名的hash算法,MD5 和 SHA1 可以说是目前应用最广泛的Hash算法 ,而它们都是以 MD4 为基础设计的
hash算法在实际中用处还是比较大的,
在分布式缓存中通过hash可以分布的比较平均,一般这样使用key:
def get_encode_key(key):
import haslib
m1 = hashlib.md5()
m1.update(key.encode("utf8"))
key = m1.hexdigest().lower()
return key
在数据库中还可以使用md5缩短长度:
alter table message_messagesource add COLUMN img_src_sum varchar(32) default null;
alter table `message_messagesource` add index idx_img_src_sum (img_src_sum);
update message_messagesource set img_src_sum=md5(image_src);