批处理实现过滤重复行

程序员文章站 2022-03-08 09:01:22

a.txt内容如下： 123 456 789 123 123 789 获取重复的行，并且重复的行只保留一次，处理后得到b.txt内容如下： 123 789...

a.txt内容如下：
123
456
789
123
123
789

获取重复的行，并且重复的行只保留一次，处理后得到b.txt内容如下：
123
789

方法1：

@echo off
rem 缺点1：无法处理特别大的文件
rem 缺点2：需要使用文件中没有出现的字符来标记变量（本例中使用的是下划线）
setlocal
for /f "delims=" %%i in (a.txt) do (
  set /a _%%i+=1
)
(for /f "tokens=1-2 delims=_=" %%i in ('set _') do (
  if %%j gtr 1 (
    echo,%%i
  )
))>b.txt
endlocal

方法2：

@echo off
setlocal enabledelayedexpansion
set "priline="
set "dupnum=1"
(for /f "delims=" %%i in ('sort a.txt') do (
  if "!priline!" equ "%%i" (
    set /a dupnum+=1
  ) else (
    if !dupnum! gtr 1 (
      echo,!priline!
    )
    set dupnum=1
  )
  set "priline=%%i"
))>b.txt
if !dupnum! gtr 1 (
  >>b.txt echo,!priline!
)

方法3：

gawk "{a[$0]++}end{for(i in a)if(a[i]>1)print i}" a.txt > b.txt

方法4：（更加简洁）

gawk "a[$0]++" a.txt>b.txt

方法5：

@echo off
for /f "tokens=*" %%i in (a.txt) do set #%%i=%%i
(for /f "tokens=2 delims==" %%i in ('set #') do echo %%i)>b.txt

上一篇：批处理for命令使用指南

下一篇： Takeown 获取文件or文件夹所有权

批处理实现过滤重复行

php数组过滤掉PHP数组中的重复值的实现代码

pandas DataFrame 删除重复的行的实现方法

javascript过滤数组重复元素的实现方法

Python3 实现随机生成一组不重复数并按行写入文件

SQL Sever中使用SQL语句实现把重复行数据合并为一行并用逗号分隔

pandas去重复行并分类汇总的实现方法

pandas DataFrame 删除重复的行的实现方法

批处理实现一行内容分行输出

Python3 实现随机生成一组不重复数并按行写入文件

javascript过滤数组重复元素的实现方法

批处理实现过滤重复行

php数组 过滤掉PHP数组中的重复值的实现代码

pandas DataFrame 删除重复的行的实现方法

javascript过滤数组重复元素的实现方法

Python3 实现随机生成一组不重复数并按行写入文件

SQL Sever中使用SQL语句实现把重复行数据合并为一行并用逗号分隔

pandas去重复行并分类汇总的实现方法

pandas DataFrame 删除重复的行的实现方法

批处理实现一行内容分行输出

Python3 实现随机生成一组不重复数并按行写入文件

javascript过滤数组重复元素的实现方法

php数组过滤掉PHP数组中的重复值的实现代码