欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

分库分表的排序

程序员文章站 2022-04-20 20:53:32
...

分库分表的排序 分库分表的排序 1. 对于单库,冗余一个汇总所有数据表,用于全部数据的排序,但是当数据量大,汇总表将会成为瓶颈。这不是一个很好的方案 2. 无论单库还是多个分库,都由程序读取需要数据并作排序。 排序的几种方式: 大都是按时间排序的,如

分库分表的排序

分库分表的排序

1. 对于单库,冗余一个汇总所有数据表,用于全部数据的排序,但是当数据量大,汇总表将会成为瓶颈。这不是一个很好的方案

2. 无论单库还是多个分库,都由程序读取需要数据并作排序。

排序的几种方式:

大都是按时间排序的,如果在客户端可以直接判断在哪个分表最好,可以直接读取指定分表并作排序

例如:

汇总表td_test_all;而分表是按companyid分表的

原始sql:

SELECT * FROM td_test_all

WHERE companyid = 15997

order by productid desc limit 0,20

程序端完全可以通过companyid判断在哪个分表读取数据,改为

SELECT * FROM td_test7

WHERE companyid = 15997

order by productid desc limit 0,20

这样数据的排序还是通过数据实现的。

如果where条件里没有分区字段的话,如何定位到具体分区呢?可以在设计阶段,在常用字段上埋下分区规则的种子, 比如在td_test7.groupid字段设计由int+7(7表示在分表td_test7里)

如果数据必须从多个分表取数据的话:

对于取top N条记录的话场景

程序分表读取每个分表的前N条记录(理想的认为数据都来源一个分表,从而减小结果集),如分区td_test0所示:

SELECT *

FROM td_test0

WHERE createtime> STR_TO_DATE('2013-04-28 15:34:02','%Y-%m-%d %H:%i:%s')

ORDER BY createtime DESC

LIMIT 0,5

然后程序读取这些结果集,在应用端汇总排序取top N记录

对于需要分页的话场景

这个就只能把每个分表、满足条件的的所有记录都load到应用端,然后在程序端很容易做汇总,排序分页操作

------end----