欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

10万个数字无序排列,要求不重复!高手进!!!

程序员文章站 2022-04-14 16:18:45
...
(PS:可能是我描述的不太清楚,其实意思就是这样的。依次生成10W个随机数填充到数组,随机数1-10W之间不能重复。嗯,对,本意就是这样。)

今天面试,技术总监给我出了个思考题,求随机10W个数字无序排列,如何才能高效的执行,内存没有要求,最好的硬件配置,伪代码如下:

static $arr = array();
for($i = 0; $i 

这样做的坏处就是 刚开始取得第一个数的时候进入while循环的概率是1/100000,那么当取到了第99999个数的时候,进入while循环的几率就是99.9999%,那么这时候就会出现无限循环状态,那么如何规避这个问题呢?

回复内容:

(PS:可能是我描述的不太清楚,其实意思就是这样的。依次生成10W个随机数填充到数组,随机数1-10W之间不能重复。嗯,对,本意就是这样。)

今天面试,技术总监给我出了个思考题,求随机10W个数字无序排列,如何才能高效的执行,内存没有要求,最好的硬件配置,伪代码如下:

static $arr = array();
for($i = 0; $i 

这样做的坏处就是 刚开始取得第一个数的时候进入while循环的概率是1/100000,那么当取到了第99999个数的时候,进入while循环的几率就是99.9999%,那么这时候就会出现无限循环状态,那么如何规避这个问题呢?

UPDATE:既然题主明确了题意,我这里也更新下:

生成10W个数,值域[1..10w]且无重复,那么只需要先在长度为10W的数组内填上1..10W,然后用下面的算法shuffle就行。

这个实际上可以通过Fisher-Yates shuffle算法来实现,渐进复杂度可以达到O(n)。描述如下:

void randomize(vector& data) {
    for (int i = data.size() - 1; i > 0; --i) {
        int random = rand() % (i + 1);  // 所以 0 

要证明这个算法的正确性也很简单。但是需要将条件转换成等价的形式,条件里说我们需要对数组随机排列,这意味着每个数出现在某个位子的几率均等,均为1/n(假设有n个数)

我们考虑算法执行第一次循环的时候:我们从[0,n-1]这n个数里随机挑选了一个数放到n-1这个位置,所以所有的数放到n-1的概率为1/n

当执行第二次的时候,我们从[0...n-2]这n-1个剩下的数里选出了一个放到n-2这个位置,那么出现在n-2位置的概率是多少呢?注意现在这件事并不是独立事件了,一个数要放到n-2这里意味着它没有在第一次迭代中被选中,并且第二次被选中了,所以概率为(1-1/n)(1/(n-1)) = ((n-1)/n)(1(n-1)) = 1/n,故而所有数放在n-2的概率为1/n

一般的,一个数放在位置i时,意味着前面n-i-1次循环他都未被选中,且在第n-i次被选中,我们有概率p(i) = (1-1/n)(1-1/(n-1))(1-1/(n-2))....(1-1/(i+2))(1/(i+1) = ((n-1)/n) ((n-2)/(n-1)) ((n-3) / (n-2))...((i+1)/(n+2))(1/(i+1)) = 1/n

生成10W个数字,随机递增,再对结果集乱序

shuffle(range(0,100000));

步骤
1生成0-99999连续数组a
2空数组b
3随机从a中取出一个放入b并从a中删除该元素,直到取完

可以考虑使用 Format-preserving encryption

大致的目的就是格式不变的加密,在这个例子里,可以把5位数加密成另一个5位数。

看到题目的第一个反应,真的只有我想到了C++的STL中的random_suffle函数么……
后来仔细看了一下题主用的是PHP(为啥贴的是C标签啊……)
好吧,我们来个简化版的。
结果一看,dahakawang已经给出实现了,好吧,就由我改成PHP语法吧~

$a=array();
for($i=0;$i=0;$i--)
{
    $j=rand(0,$i);
    $t=$a[$j];
    $a[$j]=$a[$i];
    $a[$i]=$t;
}

直接手写的,如有语法错误自行改正。

【随机10W个数字无序排列】这其实没说明问题...

如果解释为【给10万个随机数做无序排列】,我觉得代码只需要一行:return。

把10万个数放在数组里面,然后数组随机顺序就行了。好吧,我承认这么搞根本符合题意。
下面的伪码应该是期望的,不过貌似接近 @Dappur 的答案。

$arr=range(1, 100000, 1);
//shuffle($arr); 哈哈,这是玩笑
$results = [];
for($i=99999;$i>=0;$i--)
{
    $key=rand(0,$i);
    $results[]=$arr[$i];
    array_slice($arr, $i, 1);
}

shuffle: 打乱数组顺序。
range: 创建区间数组,参数分别是最小值、最大值、步长。
array_slice: 取出数组中的一段,并重置下标。

重新@Dappur
想明白你的代码了...相当于10万个人,每个人举着一个号,然后喊一声跑,自然就乱了。
而像楼主说的那种逐个产生(就是不事先预定好)除了他自己写的那种方式外则是无解的,就像10万人都是隔离的,*说一个数,还不能和别人重复,不可能。

高效是指快么?
如果是,我会顺序生成10W个数,开10W个线程随机插入,如果位置已经被占用就用就近原则找位置插入。
如果有10W个核的应该挺快的

相关标签: php c