[Linux] 大数据库导出大文件统计并去重

程序员文章站 2022-06-19 13:08:12

1. 把数据库表导出到文本文件中 mysql -h主机 -P端口 -u用户 -p密码 -A 数据库 -e "select email,domain,time from ent_login_01_000" > ent_login_01_000.txt 总共要统计最近3个月的登陆用户 , 按月份分表,并 ......

1. 把数据库表导出到文本文件中

mysql -h主机 -p端口 -u用户 -p密码 -a 数据库 -e "select email,domain,time from ent_login_01_000" > ent_login_01_000.txt

总共要统计最近3个月的登陆用户 , 按月份分表,并且每月有128张表 , 全部导出到文件中 , 总共有80g

[Linux] 大数据库导出大文件统计并去重

2. grep 查出所有的2018-12 2019-01 2019-02

3.使用awk sort 和 uniq 只取出前面的用户 , 并且先去一下重复行

cat 2019-02.txt|awk -f " " '{print $1"@"$2}'|sort -t /mnt/public/phpdev/187_test/tmp/|uniq > 2019-02-awk-sort-uniq.txt

cat 2019-01.txt|awk -f " " '{print $1"@"$2}'|sort -t /mnt/public/phpdev/187_test/tmp/|uniq > 2019-01-awk-sort-uniq.txt

cat 2018-12.txt|awk -f " " '{print $1"@"$2}'|sort -t /mnt/public/phpdev/187_test/tmp/|uniq > 2018-12-awk-sort-uniq.txt

uniq 只去除连续的重复行 , sort可以把行排成连续的 -t是因为默认占用/tmp的临时目录 , 根目录我的不够用了,因此改一下临时目录

这几个文件占用了100多g

上一篇： Intel处理器缺货最晚9月份解决 CPU份额降至81%

下一篇： axios API 可以通过向axios传递相关配置来创建请求以及并发处理多个请求和别名请求的方式

[Linux] 大数据库导出大文件统计并去重

[Linux] 大数据库导出大文件统计并去重

Linux下导出数据库文件进行统计+去重

[Linux] 大数据库导出大文件统计并去重

Linux下导出数据库文件进行统计+去重