学习shardIng-精确分片

2021-10-22  本文已影响0人  Spring_java

Sharding-JDBC认为对于分片策略存有两种维度:

数据源分片策略(DatabaseShardingStrategy):数据被分配的目标数据源
表分片策略(TableShardingStrategy):数据被分配的目标表

两种分片策略API完全相同,但是表分片策略是依赖于数据源分片策略的(即:先分库然后才有分表)

分片算法

通过分片算法将数据分片,支持通过=、>=、<=、>、<、BETWEEN和IN分片。分片算法需要应用方开发者自行实现,可实现的灵活度非常高。

目前提供4种分片算法。由于分片算法和业务实现紧密相关,因此并未提供内置分片算法,而是通过分片策略将各种场景提炼出来,提供更高层级的抽象,并提供接口让应用开发者自行实现分片算法。

分片策略

包含分片键和分片算法,由于分片算法的独立性,将其独立抽离。真正可用于分片操作的是分片键 + 分片算法,也就是分片策略。目前提供5种分片策略。

建表语句

CREATE TABLE `t_order_0` (
  `order_id` bigint DEFAULT NULL COMMENT '订单号',
  `cust_id` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '客户id',
  `order_time` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '下单时间'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

CREATE TABLE `t_order_1` (
  `order_id` bigint DEFAULT NULL COMMENT '订单号',
  `cust_id` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '客户id',
  `order_time` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '下单时间'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

CREATE TABLE `sku_1` (
  `sku_id` varchar(60) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku号',
  `sku_name` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku名称',
  `order_id` bigint DEFAULT NULL COMMENT '订单ID'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

CREATE TABLE `sku_0` (
  `sku_id` varchar(60) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku号',
  `sku_name` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku名称',
  `order_id` bigint DEFAULT NULL COMMENT '订单ID'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

1: 重点

order_id 是bigint 类型的 我采用了行表达式分片策略,直接配置的,由于找不到怎么配置varchar 所以我才不得不开始学习怎么重写实现方法。

代码1 使用标准分片:

@Slf4j
public class MyPreciseShardingAlgorithm implements PreciseShardingAlgorithm<String> {

    /**
     * Sharding.
     * 实现标准分片策略,通过计算分到不同的表来实现分表策略。
     * @param collection available data sources or tables's names
     * @param preciseShardingValue        sharding value
     * @return sharding result for data source or table's name
     */
    @Override
    public String doSharding(Collection<String> collection, PreciseShardingValue<String> preciseShardingValue) {
        Comparable value = preciseShardingValue.getValue();
        String columnName = preciseShardingValue.getColumnName();
        String logicTableName = preciseShardingValue.getLogicTableName();
        log.info("collection:" + JSON.toJSONString(collection) + ",preciseShardingValue:" + JSON.toJSONString(preciseShardingValue));
        String data = value.toString();
        int size = collection.size();
        for(String tableName: collection){
            int index = Math.abs(data.hashCode() % size);
            if(tableName.endsWith(index+"")){
                return tableName;
            }
        }
        return null;
    }
}

配置:

spring:
  main:
    allow-bean-definition-overriding: true
  # 相关的配置
  shardingsphere:
    props:
      sql:
        show: true
    datasource:
      names: ds1
      ds1:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbcUrl: jdbc:mysql://localhost:3306/springcloud?serverTimezone=CTT&useUnicode=true&characterEncoding=utf-8&allowMultiQueries=true&useSSL=false
        username: root
        password: root
    sharding:
      tables:
        # 这个地方注意: sharding-jdbc会根据名称去找本节点,所以写sql的时候,要写此节点的名称
        t_order:
          # 表达式, 健康节点: 根据上一个节点找到此值, {0..1}为groovy语言,$会替换成{0..1}的一个值,数据库表是: book_0 , book_1
          # 这个配置是告诉sharding有多少个表
          actual-data-nodes: ds1.t_order_$->{0..1}
          # 配置其分片策略和分片算法
          table-strategy:
            # 行表达式
            inline:
              # 配置sharding的计算列
              sharding-column: order_id
              # 配置sharding的表达式,对应的n_id必须和sharding-column的值对应,否则报错
              algorithm-expression: t_order_$->{order_id % 2}
        # 这个地方注意: sharding-jdbc会根据名称去找本节点,所以写sql的时候,要写此节点的名称
        sku:
          # 表达式, 健康节点: 根据上一个节点找到此值, {0..1}为groovy语言,$会替换成{0..1}的一个值,数据库表是: book_0 , book_1
          # 这个配置是告诉sharding有多少个表
          actual-data-nodes: ds1.sku_$->{0..1}
          # 配置其分片策略和分片算法
          table-strategy:
            standard:
              sharding-column: sku_id
              precise-algorithm-class-name: com.xulei.spring.shardConfig.MyPreciseShardingAlgorithm

具体配置在starter下面的json文件。

实际案例:

    select  sku.order_id,t_order.order_time,sku.sku_id,sku.sku_name
        from t_order,sku
        where t_order.order_id=sku.order_id
        and t_order.order_id =3
因为t_order表里面是采用了order_id 进行分片,所以具体执行sql 只查询了1个库 t_order_1。
image.png

sql 修改:
select sku.order_id,t_order.order_time,sku.sku_id,sku.sku_name
from t_order,sku
where t_order.order_id=sku.order_id
and sku.order_id =3
结果就是全表扫描了。因为sku 表是根据sku_id 来进行分表的


image.png
上一篇下一篇

猜你喜欢

热点阅读