PHP数组交集的优化代码分析

程序员文章站 2022-05-15 20:31:49

不过由于手机的参数多，且不同的手机其参数差异大，所以参数表结构通常是纵表（一个参数是一行），而不是横表（一个参数是一列），此时使用若干参数来取结果，通常就是把每个单独参数来...

不过由于手机的参数多，且不同的手机其参数差异大，所以参数表结构通常是纵表（一个参数是一行），而不是横表（一个参数是一列），此时使用若干参数来取结果，通常就是把每个单独参数来取结果，再一起取交集。
假定每个参数会包含一千个左右的唯一结果（id int），以此为前提来模拟生成一些数据：

复制代码代码如下:

 
<?php 
$rand = function() { 
$result = array(); 
for ($i = 0; $i < 1000; null) { 
$value = mt_rand(1, 10000); 
if (!isset($result[$value])) { 
$result[$value] = null; 
$i++; 
} 
} 
return array_keys($result); 
}; 
$param_a = $rand(); 
$param_b = $rand(); 
?> 

注意：如果测试数据集过小的话，结论可能会出现不一致，先来看看通过php内置方法array_intersect实现的性能：

复制代码代码如下:

 
<?php 
$time = microtime(true); 
$result = array_intersect($param_a, $param_b); 
$time = microtime(true) - $time; 
echo "array_intersect: {$time}\n"; 
?> 

再来看看通过自定义方法intersect实现的性能：

复制代码代码如下:

 
<?php 
function intersect() { 
if (func_num_args() < 2) { 
trigger_error('param error', e_user_error); 
} 
$args = func_get_args(); 
foreach ($args as $arg) { 
if (!is_array($arg)) { 
trigger_error('param error', e_user_error); 
} 
} 
$intersect = function($a, $b) { 
$result = array(); 
$length_a = count($a); 
$length_b = count($b); 
for ($i = 0, $j = 0; $i < $length_a && $j < $length_b; null) { 
if($a[$i] < $b[$j]) { 
$i++; 
} else if($a[$i] > $b[$j]) { 
$j++; 
} else { 
$result[] = $a[$i]; 
$i++; 
$j++; 
} 
} 
return $result; 
}; 
$result = array_shift($args); 
sort($result); 
foreach ($args as $arg) { 
sort($arg); 
$result = $intersect($result, $arg); 
} 
return $result; 
} 
$time = microtime(true); 
$result = intersect($param_a, $param_b); 
$time = microtime(true) - $time; 
echo "intersect: {$time}\n"; 
?> 

直觉上，我们肯定会认为内置函数快于自定义函数，但本例中结果恰恰相反：
array_intersect： 0.023918151855469
intersect： 0.0026049613952637
需要提醒大家的是，array_intersect和intersect在功能上并不完全等价，例子如下：

复制代码代码如下:

 
$param_a = array(1, 2, 2); 
$param_b = array(1, 2, 3); 
var_dump( 
array_intersect($param_a, $param_b), 
intersect($param_a, $param_b) 
); 

array_intersect： 1， 2， 2
intersect： 1， 2
也就是说，如果在第一个数组参数中有重复元素的话，则array_intersect会返回所有满足条件的重复元素，而不是仅仅返回一个，有兴趣的读者可以变换一下参数顺序再看结果。
再唠叨一下，最初我写intersect方法时，大概写成下面这个样子：

复制代码代码如下:

 
<?php 
function intersect() { 
if (func_num_args() < 2) { 
trigger_error('param error', e_user_error); 
} 
$args = func_get_args(); 
foreach ($args as $arg) { 
if (!is_array($arg)) { 
trigger_error('param error', e_user_error); 
} 
} 
$result = array(); 
$data = array_count_values( 
call_user_func_array('array_merge', $args) 
); 
foreach ($data as $value => $count) { 
if ($count > 1) { 
$result[] = $value; 
} 
} 
return $result; 
} 
?> 

代码更简洁，不过有一个弊端，因为使用了array_merge，所以当数组中元素非常多的时候，占用的内存会比较大，反之如果数组中元素不是非常多，那么此方法也是可行的。（来源：火丁笔记）

上一篇：嘴唇长泡好难受，那嘴唇上长泡吃什么好？

下一篇： Recursive sequence（HDU5950 矩阵快速幂）

PHP数组交集的优化代码分析

一个PHP数组应该有多大的分析

PHP代码优化的53个细节

php多层数组与对象的转换实例代码

5种PHP创建数组的实例代码分享

支持中文的PHP按字符串长度分割成数组代码

php数组的概述及分类与声明代码演示

PHP和JavaScrip分别获取关联数组的键值示例代码

PHP二维索引数组的遍历实例分析【2种方式】

PHP代码维护，重构变困难的4种原因分析

PHP中的array数组类型分析说明