批处理实现过滤重复行
程序员文章站
2022-06-17 13:38:13
a.txt内容如下:
123
456
789
123
123
789
获取重复的行,并且重复的行只保留一次,处理后得到b.txt内容如下:
123
789...
a.txt内容如下:
123
456
789
123
123
789
获取重复的行,并且重复的行只保留一次,处理后得到b.txt内容如下:
123
789
方法1:
@echo off rem 缺点1:无法处理特别大的文件 rem 缺点2:需要使用文件中没有出现的字符来标记变量(本例中使用的是下划线) setlocal for /f "delims=" %%i in (a.txt) do ( set /a _%%i+=1 ) (for /f "tokens=1-2 delims=_=" %%i in ('set _') do ( if %%j gtr 1 ( echo,%%i ) ))>b.txt endlocal
方法2:
@echo off setlocal enabledelayedexpansion set "priline=" set "dupnum=1" (for /f "delims=" %%i in ('sort a.txt') do ( if "!priline!" equ "%%i" ( set /a dupnum+=1 ) else ( if !dupnum! gtr 1 ( echo,!priline! ) set dupnum=1 ) set "priline=%%i" ))>b.txt if !dupnum! gtr 1 ( >>b.txt echo,!priline! )
方法3:
gawk "{a[$0]++}end{for(i in a)if(a[i]>1)print i}" a.txt > b.txt
方法4:(更加简洁)
gawk "a[$0]++" a.txt>b.txt
方法5:
@echo off for /f "tokens=*" %%i in (a.txt) do set #%%i=%%i (for /f "tokens=2 delims==" %%i in ('set #') do echo %%i)>b.txt