Python打印不合法的文件名

程序员文章站 2024-01-26 09:12:52

问题你的程序获取了一个目录中的文件名列表，但是当它试着去打印文件名的时候程序崩溃，出现了 unicodeencodeerror 异常和一条奇怪的消息—— surrogates not allowed...

问题

你的程序获取了一个目录中的文件名列表，但是当它试着去打印文件名的时候程序崩溃，出现了 unicodeencodeerror 异常和一条奇怪的消息—— surrogates not allowed 。

解决方案

当打印未知的文件名时，使用下面的方法可以避免这样的错误：

def bad_filename(filename):
  return repr(filename)[1:-1]

try:
  print(filename)
except unicodeencodeerror:
  print(bad_filename(filename))

如果你有代码需要操作文件名或者将文件名传递给 open() 这样的函数，一切都能正常工作。只有当你想要输出文件名时才会碰到些麻烦(比如打印输出到屏幕或日志文件等)。特别的，当你想打印上面的文件名列表时，你的程序就会崩溃：

>>> for name in files:
...   print(name)
...
spam.py
traceback (most recent call last):
  file "<stdin>", line 2, in <module>
unicodeencodeerror: 'utf-8' codec can't encode character '\udce4' in
position 1: surrogates not allowed
>>>

>>> for name in files:
... try:
...   print(name)
... except unicodeencodeerror:
...   print(bad_filename(name))
...
spam.py
b\udce4d.txt
foo.txt
>>>

在 bad_filename() 函数中怎样处置取决于你自己。另外一个选择就是通过某种方式重新编码，示例如下：

def bad_filename(filename):
  temp = filename.encode(sys.getfilesystemencoding(), errors='surrogateescape')
  return temp.decode('latin-1')

译者注:

surrogateescape:
这种是python在绝大部分面向os的api中所使用的错误处理器，
它能以一种优雅的方式处理由操作系统提供的数据的编码问题。
在解码出错时会将出错字节存储到一个很少被使用到的unicode编码范围内。
在编码时将那些隐藏值又还原回原先解码失败的字节序列。
它不仅对于os api非常有用，也能很容易的处理其他情况下的编码错误。

使用这个版本产生的输出如下：

>>> for name in files:
...   try:
...     print(name)
...   except unicodeencodeerror:
...     print(bad_filename(name))
...
spam.py
bäd.txt
foo.txt
>>>

这一小节主题可能会被大部分读者所忽略。但是如果你在编写依赖文件名和文件系统的关键任务程序时，就必须得考虑到这个。否则你可能会在某个周末被叫到办公室去调试一些令人费解的错误。

以上就是python打印不合法的文件名的详细内容，更多关于python 打印文件名的资料请关注其它相关文章！

相关标签： Python 打印不合法文件名

上一篇：团队建设与管理该如何做？

下一篇： Jmeter参数化获取序列数据实现过程

Python打印不合法的文件名

Python打印不合法的文件名

Python根据文件名批量转移图片的方法

Python字符串对齐、删除字符串不需要的内容以及格式化打印字符

Python3标准库：os.path平*立的文件名管理

Python使用reportlab将目录下所有的文本文件打印成pdf的方法

python使用mailbox打印电子邮件的方法

python根据给定文件返回文件名和扩展名的方法

python使用mailbox打印电子邮件的方法

python批量删除文件名中的下划线-代码详解

Python遍历目录并批量更换文件名和目录名的方法