欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

hash算法

程序员文章站 2022-07-15 15:39:49
...

 

Hash,一般翻译做"散列 ",也有直接音译为"哈希 "的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法 ,变换成固定长度的输出,该输出就是散列值 。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数

 

 HASH主要用于信息安全领域中加密算法,它把一些不同长度的信息转化成杂乱的128位的编码里,叫做HASH值. 也可以说,hash就是找到一种数据内容和数据存放地址之间的映射关系

  了解了hash基本定义,就不能不提到一些著名的hash算法,MD5 和 SHA1 可以说是目前应用最广泛的Hash算法 ,而它们都是以 MD4 为基础设计的

 

hash算法在实际中用处还是比较大的,

在分布式缓存中通过hash可以分布的比较平均,一般这样使用key:

 

def get_encode_key(key):
    import haslib
    m1 = hashlib.md5()
    m1.update(key.encode("utf8"))
    key = m1.hexdigest().lower()
     
    return key
 

在数据库中还可以使用md5缩短长度:

alter table message_messagesource add COLUMN img_src_sum varchar(32) default null;
alter table `message_messagesource` add index idx_img_src_sum (img_src_sum);
update message_messagesource set img_src_sum=md5(image_src);