批处理实现过滤重复行

程序员文章站 2022-06-17 13:38:13

a.txt内容如下： 123 456 789 123 123 789 获取重复的行，并且重复的行只保留一次，处理后得到b.txt内容如下： 123 789...

a.txt内容如下：
123
456
789
123
123
789

获取重复的行，并且重复的行只保留一次，处理后得到b.txt内容如下：
123
789

方法1：

@echo off
rem 缺点1：无法处理特别大的文件
rem 缺点2：需要使用文件中没有出现的字符来标记变量（本例中使用的是下划线）
setlocal
for /f "delims=" %%i in (a.txt) do (
  set /a _%%i+=1
)
(for /f "tokens=1-2 delims=_=" %%i in ('set _') do (
  if %%j gtr 1 (
    echo,%%i
  )
))>b.txt
endlocal

方法2：

@echo off
setlocal enabledelayedexpansion
set "priline="
set "dupnum=1"
(for /f "delims=" %%i in ('sort a.txt') do (
  if "!priline!" equ "%%i" (
    set /a dupnum+=1
  ) else (
    if !dupnum! gtr 1 (
      echo,!priline!
    )
    set dupnum=1
  )
  set "priline=%%i"
))>b.txt
if !dupnum! gtr 1 (
  >>b.txt echo,!priline!
)

方法3：

gawk "{a[$0]++}end{for(i in a)if(a[i]>1)print i}" a.txt > b.txt

方法4：（更加简洁）

gawk "a[$0]++" a.txt>b.txt

方法5：

@echo off
for /f "tokens=*" %%i in (a.txt) do set #%%i=%%i
(for /f "tokens=2 delims==" %%i in ('set #') do echo %%i)>b.txt

上一篇： 851001: PFXFile encoding decoding failure(Maven编译后证书变小)

下一篇： javascript 原生Dom对象和jQuery对象的联系和区别

批处理实现过滤重复行

javascript过滤数组重复元素的实现方法

Python3 实现随机生成一组不重复数并按行写入文件

SQL Sever中使用SQL语句实现把重复行数据合并为一行并用逗号分隔

pandas去重复行并分类汇总的实现方法

pandas DataFrame 删除重复的行的实现方法

批处理实现一行内容分行输出

Python3 实现随机生成一组不重复数并按行写入文件

javascript过滤数组重复元素的实现方法

重复行过滤工具(.NET源码+工具)

过滤掉PHP数组中的重复值的实现代码