欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

mysql获取随机数据的方法

程序员文章站 2024-02-25 10:23:34
1.order by rand()数据多了极慢,随机性非常好,适合非常小数据量的情况。复制代码 代码如下:select * from table_name as r1 jo...

1.order by rand()
数据多了极慢,随机性非常好,适合非常小数据量的情况。

复制代码 代码如下:

select * from table_name as r1 join (select (round(rand() * (select abs(max(id)-min(id)-$limit) from table_name))+(select min(id) from table_name)) as id) as r2 where r1.id >= r2.id order by r1.id asc limit $limit;

速度非常快,但是得到的数据是id连续的,没办法解决。
子查询产生一个随机数。
rand()是0到1的随机数,可以等于0到1。
max(id)-min(id)还要要减去$limit以免结果数量不够$limit条
因为主表id可能不连续,所以r1.id要>=r2.id
还要注意的是有时候最小id不是从1开始的,可能从一个很大的数开始,所以必须加上m(id)的值
手册相关内容:若要在i ≤ r ≤ j 这个范围得到一个随机整数r ,需要用到表达式 floor(i + rand() * (j – i + 1))。
例如, 若要在7 到 12 的范围(包括7和12)内得到一个随机整数, 可使用以下语句:
复制代码 代码如下:

select floor(7 + (rand() * 6));
select * from test where rand()>0.0005 limit 10;
 

0.0005是一个计算出的比例直接关系到随机的质量,比如数据表10000条数据,需要随机取300条,那么0.0005就需要改成(300/10000=0.03)。
这种方法不能保证每次能取到多少,需要取多次。
2和3速度一样的快,主要区别是2总能返回limit条数据,3就没准了(符合正太分布)。2是连续数据,3是随机行。