在很多算法中都有提到使用hash算法。请使用的hash算的同志来几个使用例子。比如:在memcache中分key存储。主机分布式选择主机的算法

2010-11-03 12:06:03

4 Answers

crc32
md5后的16进制字符进行截取

2010-11-03 14:00:00

hash算法一般是利用数组实现的,步骤如下:
存元素时:
1.把要存储的元素(value)计算一个hashcode(称为散列),这个就是key。
2.把元素存储到以hashcode为下标的数组中。
3.若此数组下标已经有元素,则使用链表的方式把元素连接起来。

获得元素时:
1.元素(value)计算hashcode。
2.hash表中按hashcode(key)取得元素。
3.若一个key中对应多个元素,则还需匹配是哪个元素。

就这么简单,hash算法由于直接映射数组下标,所以查找算法的时间复杂度来说是O(1)的。不过若计算hashcode的算法不是很好的话,可能造成一个桶(数组中的一个位置)内有多个元素,而有些桶内一个元素都没有。这样在存、取元素时都需要在桶内进行查找操作,而且造成空间的浪费。
所以一个好的hashcode的算法使得任意给定的元素能够均匀地存储在hash表中的每个桶内,显得尤为重要。
以下给出一个非常经典的通用散列算法,经过研究人员统计分析过散列程度的。

unsigned long hashcode(const unsigned char *name) { unsigned long h=0,g; while(*name) { h=(h<<4) + *name++; if(g=h & 0xF0000000) h^=g>>24; h &=~g; } return h; }

除非你对这个通用散列算法有特殊需求,导致无法满足需要,否则应该使用这个函数。

hash算法确实应用得非常广泛,因为其查找的速度是O(1)的。比如:如今数据的海量存取和高并发访问的需求,造成关系数据库逐渐退出舞台。DB中使用B+树索引提供范围查询,hash(key-value)索引实现点查询。
但一种数据结构只能满足某几种需求,程序设计中要灵活地应用。

2010-11-03 15:23:01

在实际使用中,我们用得hash用得比较多的地方是在数据分表存储上,比如存贮用户信息,当用户数量太多(如达到千万级别),数量量太大时,我们会根据用户名username使用hash算法得出0-N的一个数值,将用户信息分散存储到N个表中,如增加用户信息示例代码如下:

<?php function getHash(&$keyword,$n) { $hash = crc32($keyword) >> 16 & 0xffff; return sprintf("%02s",$hash % $n); } $table = 'userinfo_'.getHash($username,100); $sql = "insert into {$table} values(....)"; $db = new models($table);//封装的数据库操作类 $db->MyInsert($sql); ?>
2010-11-03 17:13:29

以下是PHP CRC32散列,偷师某位高人:

<?php //范围:00-63 function crc_hash(&$keyword,$n=64) { $hash = crc32($keyword) >> 16 & 0xffff; return sprintf("%02s",$hash % $n); } ?>
2010-11-03 19:00:47
您不能回答该问题或者回答已经关闭!

相关文章推荐

  • C#中using指令的几种用法

    using + 命名空间名字,这样可以在程序中直接用命令空间中的类型,而不必指定类型的详细命名空间,类似于Java的import,这个功能也是最常用的,几乎每个cs的程序都会用到

  • C#实例解析适配器设计模式

    将一个类的接口变成客户端所期待的另一种接口,从而使原本因接口不匹配而无法在一起工作的两个类能够一起工作

  • C#开发高性能Log Help类设计开发

    项目中要在操作数据库的异常处理中加入写Log日志,对于商业上有要求,写log时对其它操作尽可能影响小,不能因为加入log导致耗时太多

  • 使用托管C++粘合C#和C++代码(二)

    本文实现一下C++代码调用C#代码的过程。我构造一个简单并且直观的例子:通过C++ UI 触发C# UI.

  • Async和Await使异步编程更简单

    C#5.0中async和await两个关键字,这两个关键字简化了异步编程,之所以简化了,还是因为编译器给我们做了更多的工作

  • C#开发中的反射机制

    反射的定义:审查元数据并收集关于它的类型信息的能力。元数据(编译以后的最基本数据单元)就是一大堆的表,当编译程序集或者模块时,编译器会创建一个类定义表,一个字段定义表,和一个方法定义表等

  • C#运行时相互关系

    C#运行时相互关系,包括运行时类型、对象、线程栈和托管堆之间的相互关系,静态方法、实例方法和虚方法的区别等等

  • C#协变和逆变

    “协变”是指能够使用与原始指定的派生类型相比,派生程度更大的类型,“逆变”则是指能够使用派生程度更小的类型

  • C#基础概念之延迟加载

    延迟加载(lazy load)是Hibernate3关联关系对象默认的加载方式,延迟加载机制是为了避免一些无谓的性能开销而提出来的,所谓延迟加载就是当在真正需要数据的时候,才真正执行数据加载操作

  • C#中的索引器的简单理解和用法

    C#中的类成员可以是任意类型,包括数组和集合。当一个类包含了数组和集合成员时,索引器将大大简化对数组或集合成员的存取操作

  • 使用托管C++粘合C#和C++代码(一)

    C#在xml读写,数据库操纵,界面构造等很多方面性能卓越;C++的效率高,是底层开发的必备武器

  • 深入C# 序列化(Serialize)、反序列化(Deserialize)

    C#中的序列化和反序列化,序列化是.NET运行时环境用来支持用户定义类型的流化的机制