去重复
程序员文章站
2022-06-06 22:49:28
...
有一文件里有十几万行数据。。。如何去重复。。。大小写一样的只能算一个。。
回复讨论(解决方案)
行的概念是?
如果100字符/行,20万行也就20~60M而已
file 读进来
array_unique
然后写回去
如果觉得空间不够
就逐行读取求MD5并保存(如果平均行长小于32,占的内存还多些)
同时写入文件
遇到某行的MD5已存在了,这行就不写了
文件结构怎么样?贴一段出来,估计斑竹可以帮你解决。
感觉这玩意不用php,用linux的shell工具会更快
例如
cat file | sort -u > file
如果你还要考虑大小写的问题的话,直接在上面的命令加 -f 既忽略大小写
cat file | sort -u -f > file
上一篇: 用微信登陆微商城直接获取登陆微信用户信息?怎么做到的?
下一篇: PHP 发送邮件。该怎么解决
推荐阅读
-
Mysql删除重复的数据 Mysql数据去重复
-
asp.net DataTable相关操作集锦(筛选,取前N条数据,去重复行,获取指定列数据等)
-
asp.net DataTable相关操作集锦(筛选,取前N条数据,去重复行,获取指定列数据等)
-
JS实现数组去重,显示重复元素及个数的方法示例
-
SQL分组排序去重复的小实例
-
asp.net DataTable相关操作集锦(筛选,取前N条数据,去重复行,获取指定列数据等)
-
oracle sql 去重复记录不用distinct如何实现
-
SQL高级应用之同服务器上复制表到另一数据库中并实现去重复
-
php数组去重复数据示例
-
linux中去掉文件重复数据行的方法(去重复ip)