mysql表分区的方式和实现代码示例_Mysql

1. mysql 表的分区方式

mysql 提供了多种分区方式，以下是常见的几种分区方式：

范围分区（range）：按照某个连续的范围将数据分区，例如按照订单日期进行分区。在创建表时，可以使用 partition by range 子句来设置分区方式。

列表分区（list）：按照某个离散的列表将数据分区，例如按照订单状态进行分区。在创建表时，可以使用 partition by list 子句来设置分区方式。

哈希分区（hash）：根据数据的哈希值将数据均匀地分散到多个分区中，可以提高查询和负载均衡的效率。在创建表时，可以使用 partition by hash 子句来设置分区方式。

组合分区：将多个分区方式结合起来，例如先按照日期范围进行分区，再按照订单状态进行分区。在创建表时，可以使用 partition by range/list/hash 子句和 partition by subpartition 子句来设置组合分区方式。

自定义分区：mysql 还支持自定义分区方式，可以通过 partition by subexpression 子句来设置自定义分区键。在分区函数中，可以使用 mysql 内置的函数、用户自定义函数或存储过程等。

请注意，在使用分区时，需要考虑到分区键的选择、分区数量的控制、分区表的查询优化等问题，以提高数据库的性能和稳定性。

2.mysql 表分区的实现

mysql 的分区是一种将表数据按照某个规则拆分成多个独立物理存储空间的技术，可以提高数据查询和维护的效率。mysql 提供了多种分区方式，包括范围分区、哈希分区、列表分区等。

以下是一个简单的范围分区示例，假设需要按照订单日期对订单表进行分区：

create table orders (
  id int(10) unsigned not null auto_increment,
  order_no varchar(20) not null,
  order_date date not null,
  amount decimal(10,2) not null,
  primary key (id, order_date)
) engine=innodb
partition by range(year(order_date))
(
    partition p_2018 values less than (2019),
    partition p_2019 values less than (2020),
    partition p_2020 values less than (2021),
    partition p_other values less than maxvalue
);

在上述代码中，我们首先创建了一个名为 orders 的表，并指定了分区方式为范围分区（partition by range）。然后，我们按照订单日期来分区，并设置了 4 个分区：p_2018、p_2019、p_2020 和 p_other。其中，p_2018 分区用于存储 2018 年的订单数据，p_2019 分区用于存储 2019 年的订单数据，以此类推。最后一个分区 p_other 是一个特殊的分区，用于存储未被其他分区包含的数据。

3.mysql 表分区的样例

mysql 提供了多种分区方式和对应的实现 sql，以下是常见的几种分区方式和示例：

范围分区（range）：按照某个连续的范围将数据分区，例如按照订单日期进行分区。在创建表时，可以使用 partition by range 子句来设置分区方式，并通过 values less than 子句来指定每个分区的取值范围。

create table orders (
  id int(10) unsigned not null auto_increment,
  order_no varchar(20) not null,
  order_date date not null,
  amount decimal(10,2) not null,
  primary key (id, order_date)
) engine=innodb
partition by range(year(order_date))
(
    partition p_2018 values less than (2019),
    partition p_2019 values less than (2020),
    partition p_2020 values less than (2021),
    partition p_other values less than maxvalue
);

列表分区（list）：按照某个离散的列表将数据分区，例如按照订单状态进行分区。在创建表时，可以使用 partition by list 子句来设置分区方式，并通过 values in 子句来指定每个分区的取值列表。

create table orders (
  id int(10) unsigned not null auto_increment,
  order_no varchar(20) not null,
  status int(1) not null,
  amount decimal(10,2) not null,
  primary key (id, status)
) engine=innodb
partition by list(status)
(
    partition p_0 values in (0),
    partition p_1 values in (1),
    partition p_2 values in (2),
    partition p_other values in (3,4,5)
);

哈希分区（hash）：根据数据的哈希值将数据均匀地分散到多个分区中，可以提高查询和负载均衡的效率。在创建表时，可以使用 partition by hash 子句来设置分区方式，并通过 partitions 子句来指定分区数量。

create table orders (
  id int(10) unsigned not null auto_increment,
  order_no varchar(20) not null,
  order_date date not null,
  amount decimal(10,2) not null,
  primary key (id, order_date)
) engine=innodb
partition by hash(id)
partitions 8;

组合分区：将多个分区方式结合起来，例如先按照日期范围进行分区，再按照订单状态进行分区。在创建表时，可以使用 partition by range/list/hash 子句和 partition by subpartition 子句来设置组合分区方式。以下是一个例子：

create table orders (
  id int(10) unsigned not null auto_increment,
  order_no varchar(20) not null,
  order_date date not null,
  status int(1) not null,
  amount decimal(10,2) not null,
  primary key (id, order_date, status)
) engine=innodb
partition by range(year(order_date))
subpartition by list(status) (
    partition p_2018 values less than (2019)
    ( subpartition s_0 values in (0),
      subpartition s_1 values in (1),
      subpartition s_2 values in (2),
      subpartition s_other values in (3,4,5)
    ),
    partition p_2019 values less than (2020)
    ( subpartition s_0 values in (0),
      subpartition s_1 values in (1),
      subpartition s_2 values in (2),
      subpartition s_other values in (3,4,5)
    ),
    partition p_2020 values less than (2021)
    ( subpartition s_0 values in (0),
      subpartition s_1 values in (1),
      subpartition s_2 values in (2),
      subpartition s_other values in (3,4,5)
    ),
    partition p_othervalues less than maxvalue
    ( subpartition s_0 values in (0),
      subpartition s_1 values in (1),
      subpartition s_2 values in (2),
      subpartition s_other values in (3,4,5)
    )
);

在上述示例中，我们首先按照订单日期进行范围分区，然后按照订单状态进行列表子分区。对于每个分区，我们使用 subpartition by list 子句来设置子分区方式，并通过 values in 子句来指定每个子分区的取值列表。

4 不同的分区方式具有不同的优缺点和适用场景。

以下是常见的几种分区方式的优劣对比

请注意，在实际应用中，分区的具体方式和规则可以根据业务需求进行调整。同时，在使用分区时，也需要考虑到分区键的选择、分区数量的控制、分区表的查询优化等问题，以提高数据库的性能和稳定性。

范围分区（range）：按照某个连续的范围将数据分区，例如按照订单日期进行分区。优点是易于维护和查询，可以通过分区键快速定位数据；缺点是当数据分布比较不均匀时，可能会导致某些分区的数据量过大或过小，影响查询效率。

列表分区（list）：按照某个离散的列表将数据分区，例如按照订单状态进行分区。优点是适用于离散的分区键，易于处理特定的查询需求；缺点是列表项过多时可能会影响性能，需要注意分区数量的控制。

哈希分区（hash）：根据数据的哈希值将数据均匀地分散到多个分区中，可以提高查询和负载均衡的效率。优点是适用于数据分布比较均匀的情况，可以实现负载均衡；缺点是无法针对特定条件进行查询，且增加或删除分区比较困难。

组合分区：将多个分区方式结合起来，例如先按照日期范围进行分区，再按照订单状态进行分区。优点是可以根据实际业务需求进行灵活的分区组合；缺点是分区数量较多时可能会影响性能，需要注意查询优化。

自定义分区：mysql 还支持自定义分区方式，可以根据具体场景和需求选择适当的分区方式。自定义分区的优缺点取决于具体的实现方法和业务场景。

附：对已有的表进行分区

1. 可以使用alter table来进行更改表为分区表

这个操作会创建一个分区表，然后自动进行数据copy然后删除原表。

alter table tbl_rtdata partition by range (month(fld_date))
(   
partition p_apr values less than (to_days('2012-05-01')),
partition p_may values less than (to_days('2012-06-01')), 
partition p_dec values less than maxvalue );

2. 新建一个和原来表一样的分区表，然后把数据从原表导出，接着倒入新表。

先创建分区表，然后导出原表数据，新表名称改为原表名，然后插入。

create table `news` (
  `new_id` int(5) not null auto_increment,
  `new_title` varchar(130) not null,
  `new_type` int(2) not null,
  `new_img` varchar(100) not null,
  `new_desc` text not null,
  `new_user` varchar(100) not null,
  `add_time` varchar(13) not null,
  primary key (`new_id`)
) engine=myisam auto_increment=6 default charset=utf8
partition by range (new_id)
(partition p1 values less than (200) engine = myisam,
 partition p2 values less than (400) engine = myisam,
 partition p3 values less than (600) engine = myisam,
 partition p4 values less than maxvalue engine = myisam);

表建完之后，只需要吧原表的数据拷贝进新建的表中就好了。