怎么样合理建立和使用mysql分区查询提高检索效率?

2010-11-08 18:47:58

1 Answers

MySQL从5.1.3开始支持Partition,MySQL支持RANGE,LIST,HASH,KEY分区类型,主要还是根据业务来选择分区类型。

水平分区的几种模式:

1、Range(范围) — 这种模式允许DBA将数据划分不同范围。例如DBA可以将一个表通过年份划分成三个分区,80年代(1980′s)的数据,90年代(1990′s)的数据以及任何在2000年(包括2000年)后的数据。
2、Hash(哈希) — 这中模式允许DBA通过对表的一个或多个列的Hash Key进行计算,最后通过这个Hash码不同数值对应的数据区域进行分区。例如DBA可以建立一个对表主键进行分区的表。
3、Key(键值) — 上面Hash模式的一种延伸,这里的Hash Key是MySQL系统产生的。
4、List(预定义列表) — 这种模式允许系统通过DBA定义的列表的值所对应的行数据进行分割。例如:DBA建立了一个横跨三个分区的表,分别根据2004年2005年和2006年值所对应的数据。
5、Composite(复合模式) — 是以上模式的组合使用。举例:在初始化已经进行了Range范围分区的表上,我们可以对其中一个分区再进行hash哈希分区。
垂直分区(按列分)

举个简单例子:一个包含了大text和BLOB列的表,这些text和BLOB列又不经常被访问,这时候就要把这些不经常使用的text和BLOB了划分到另一个分区,在保证它们数据相关性的同时还能提高访问速度。
其中以RANGE最为常用,下面主要介绍下RANGE分区类型的用法:

mysql> SHOW VARIABLES LIKE '%partition%';
+-------------------+-------+
| Variable_name     | Value |
+-------------------+-------+
| have_partitioning | YES   |
+-------------------+-------+
1. RANGE类型 mysql> CREATE TABLE foo ( id INT NOT NULL AUTO_INCREMENT, created DATETIME, PRIMARY KEY(id, created) ) ENGINE=INNODB PARTITION BY RANGE (TO_DAYS(created)) ( PARTITION foo_1 VALUES LESS THAN (TO_DAYS('2009-01-01')), PARTITION foo_2 VALUES LESS THAN (TO_DAYS('2010-01-01')), PARTITION foo_3 VALUES LESS THAN (TO_DAYS('2011-01-01')), PARTITION foo_4 VALUES LESS THAN (TO_DAYS('2012-01-01')) ) mysql> INSERT INTO `foo` (`id`, `created`) VALUES (1, '2008-01-02 00:00:00'), (2, '2009-01-02 00:00:00'), (3, '2010-01-02 00:00:00'), (4, '2010-01-02 00:00:00'), (5, '2011-01-02 00:00:00'); mysql> SELECT * FROM foo; +----+---------------------+ | id | created | +----+---------------------+ | 1 | 2008-01-02 00:00:00 | | 2 | 2009-01-02 00:00:00 | | 3 | 2010-01-02 00:00:00 | | 4 | 2010-01-02 00:00:00 | | 5 | 2011-01-02 00:00:00 | +----+---------------------+ mysql> EXPLAIN PARTITIONS select * from foo where created>'2009-01-01 00:00:00' and created<'2011-01-01 00:00:00'; +----+-------------+-------+-------------------+-------+---------------+---------+---------+------+------+--------------------------+ | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------+-------------------+-------+---------------+---------+---------+------+------+--------------------------+ | 1 | SIMPLE | foo | foo_1,foo_2,foo_3 | index | NULL | PRIMARY | 12 | NULL | 4 | Using where; Using index | +----+-------------+-------+-------------------+-------+---------------+---------+---------+------+------+--------------------------+
可以看到这条查询只用了foo_1,foo_2,foo_3这三个分区,而不用去全表扫描,数据量越大查询速度能得到明显提高
2010-11-08 20:43:08
您不能回答该问题或者回答已经关闭!

相关文章推荐

  • C#中using指令的几种用法

    using + 命名空间名字,这样可以在程序中直接用命令空间中的类型,而不必指定类型的详细命名空间,类似于Java的import,这个功能也是最常用的,几乎每个cs的程序都会用到

  • C#实例解析适配器设计模式

    将一个类的接口变成客户端所期待的另一种接口,从而使原本因接口不匹配而无法在一起工作的两个类能够一起工作

  • 使用托管C++粘合C#和C++代码(二)

    本文实现一下C++代码调用C#代码的过程。我构造一个简单并且直观的例子:通过C++ UI 触发C# UI.

  • C#开发高性能Log Help类设计开发

    项目中要在操作数据库的异常处理中加入写Log日志,对于商业上有要求,写log时对其它操作尽可能影响小,不能因为加入log导致耗时太多

  • Async和Await使异步编程更简单

    C#5.0中async和await两个关键字,这两个关键字简化了异步编程,之所以简化了,还是因为编译器给我们做了更多的工作

  • C#开发中的反射机制

    反射的定义:审查元数据并收集关于它的类型信息的能力。元数据(编译以后的最基本数据单元)就是一大堆的表,当编译程序集或者模块时,编译器会创建一个类定义表,一个字段定义表,和一个方法定义表等

  • C#运行时相互关系

    C#运行时相互关系,包括运行时类型、对象、线程栈和托管堆之间的相互关系,静态方法、实例方法和虚方法的区别等等

  • C#协变和逆变

    “协变”是指能够使用与原始指定的派生类型相比,派生程度更大的类型,“逆变”则是指能够使用派生程度更小的类型

  • C#中的索引器的简单理解和用法

    C#中的类成员可以是任意类型,包括数组和集合。当一个类包含了数组和集合成员时,索引器将大大简化对数组或集合成员的存取操作

  • C#基础概念之延迟加载

    延迟加载(lazy load)是Hibernate3关联关系对象默认的加载方式,延迟加载机制是为了避免一些无谓的性能开销而提出来的,所谓延迟加载就是当在真正需要数据的时候,才真正执行数据加载操作

  • 使用托管C++粘合C#和C++代码(一)

    C#在xml读写,数据库操纵,界面构造等很多方面性能卓越;C++的效率高,是底层开发的必备武器

  • 深入C# 序列化(Serialize)、反序列化(Deserialize)

    C#中的序列化和反序列化,序列化是.NET运行时环境用来支持用户定义类型的流化的机制