Linux下如何处理文本文件内容中的^M
windows上写好的文件,在linux或者unix下打开,每一行都会出多出^m这样的字符,这是因为windows与*nix的换行符不同所致,我们看看文件格式有什么不同。
在linux下查看文件格式:
# file filename
# 20140304110001.csv: iso-8859 text //不带有^m
# 20140304110002.csv: iso-8859 text, with crlf line terminators //带有^m
windows下处理的文件就带有crlf行终止符。
以下有几种处理方式:
1. vi命令行模式下输入
:%s/^m$//g # 去掉行尾的^m。
:%s/^m//g # 去掉所有的^m。
:%s/^m/[ctrl-v]+[enter]/g # 将^m替换成回车。
:%s/^m/\r/g # 将^m替换成回车。
2. 使用sed命令。和vi的用法相似:
# sed -e 's/^m/\n/g'filename
3. 使用命令
使用dos2unix命令,一般的*nix发布版本都带有这个小工具,即windows - *nix文件转换。
格式: dos2unix filename
转换多个文件
格式:dos2unix file1 file2 file3 ….
上面转换文件的时候都会修改原来的文件,使用 -k参数,或者 -n参数可以不改变文件属性。
格式:dos2unix -n oldfile newfile //新建一个文件,保持源文件不变
格式:dos2unix -k filename //保持文件时间戳不变
同样工具提供了*nix - windows文件格式转换命令:unix2dos,参数同dos2unix。
*注:"^m",需要使用ctrl + v + ctrl + m键入,而不是数字6上面的^+字母m。
推荐阅读
-
Linux下如何处理文本文件内容中的^M
-
自己编写了个PHP扩展模块,在扩展模块中需要调用另外一个动态库,也是自己写的。Linux下如何
-
.NET中如何将文本文件的内容存储到DataSet
-
Linux下如何处理文本文件内容中的^M
-
Linux系统下如何检测并修复bash中的破壳漏洞
-
.NET中如何将文本文件的内容存储到DataSet
-
table表格中的内容溢出应该如何处理
-
Linux系统下如何检测并修复bash中的破壳漏洞
-
如何在Linux系统中利用node.js提取Word及PDF文本内容的案例介绍
-
关于php使用system()开启linux下的firefox,报错:Error:no display specified,该如何处理