mysql

分区表

2019-02-28  本文已影响4人  骁兵

水平分区和局部分区索引

  InnoDB支持分区表的水平分区,不支持垂直分区

  同时,MySQL数据库支持的分区是局部分区索引,一个分区中既存放了数据又存放了索引。而全局分区是指,数据存放在各个分区中,但是所有数据的索引放在同一个对象中。

查看数据库是否启用了分区功能
show variables like '%partition%'

  启动了分区后,一个表的数据会存放到多个ibd文件中(而不是只有一个)。
  可以通过information_schema架构下的PATITIONS表来查看每个分区的具体信息,table_rows表示每个区包含多少行数据。

select * from information_schema.PARTITIONS
where table_schema=database() and table_name='t'

分区类型

当前Mysql数据库支持以下几种类型的分区:

  range/list/hash/key这四种分区方式,分区数据都必须是整型,如果不是整型,应该通过函数将其转化为整型,如YEAR()、TO_DAYS()、MONTH()等。

Range分区
create table t(
  id int
)engine=innodb
partition by range(id)(
partition p0 values less than(10),
partition p1 values less than(20));

  如上图分区定义,如果现在插入一个id=30的数据,会抛出异常,因为30不能被分配到任何分区中。
  使用Range分区,用来管理日期数据可以方便很多,比如

create table sales(
  money int unsigned not null,
  date datetime
)engine=innodb
partition by range (year(date)) (
  partition p2008 value less than (2009),
  partition p2009 value less than (2010),
  partition p2010 value less than (2011)
);

  当要删除2008年的数据,不用使用delete语句,只需要删除p2008这个分区即可。

alter table sales drop partition p2008;

  并且,如果只需要搜索2008年的数据时(在where语句中写明条件),通过explain可以看到,只会去搜索p2008这个分区,而不会看其他分区,提高了查询速度。这种优化只对YEAR()、TO_DAYS()、TO_SECONDS()、UNIX_TIMESTAMP()有效。

List分区
create table t(
  a int,
  b int
) engine=innodb
partition by list(b)(
  partition p0 values in (1,3,5,7,9),
  partition p1 values in (0,2,4,6,8)
);
Hash分区
create table t(
  a int,
  b datetime
) engine=innodb
partition by hash(year(b))
partitions 4;

MOD(year('2010-04-01'),4)
=MOD(2010,4)
=2

KEY分区
create table t_key(
  a int,
  b datetime
) engine=innodb
partition by key(b)
partitions 4;

子分区

  在分区的基础上再进行分区。

create table ts(a int,b date) engine=innodb
partition by range(year(b))
subpartition by hash (to_days(b))
subpartition 2(
  partition p0 values less than (1990),
  partition p1 values less than (2000),
  partition p2 values less than maxvalue,
);

  表ts先根据b列进行了Range分区,然后又进行了一次Hash分区,所以分区的数量是3*2=6。
  子分区可以用于特别大的表,在多个磁盘间分别分配数据和索引,在创建分区时,可以指定存放磁盘目录。

处理NULL值

  对于Range分区,MySQL数据库会将该值放到最左边的分区。
  在List分区下,要使用NULL值,则必须显式指出在哪个分区放入NULL值。
  HASH和KEY分区,任何分区函数都会将NULL值的记录返回为0。

性能

  对于一张大表,一般的b+树需要2~3次的磁盘IO,因此B+树可以很好地完成操作,不需要分区的帮助,并且设计不好的分区会带来严重的性能问题。

上一篇下一篇

猜你喜欢

热点阅读