[Python模块学习] glob模块

glob模块

功能描述:glob模块可使用Unix shell风格的通配符匹配符合特定格式的文件和文件夹,跟windows的文件搜索功能差很少。glob模块并不是调用一个子shell实现搜索功能,而是在内部调用了os.listdir()和fnmatch.fnmatch()。html

glob模块共包含如下3个函数:python

  1. glob(pathname, recursive=False) 
    第一个参数pathname为须要匹配的字符串。(该参数应尽可能加上r前缀,以避免发生没必要要的错误) 
    第二个参数表明递归调用,与特殊通配符“**”一同使用,默认为False。 
    该函数返回一个符合条件的路径的字符串列表,若是使用的是Windows系统,路径上的“\”符号会自动加上转义符号变为“\\”(方便使用)。 
    在3.5版本以后,glob函数支持一个特殊的通配符“**”,该通配符能够匹配指定路径里全部文件和目录,包括子目录里的全部文件和目录。至关于递归地调用了这个函数。使用这个通配符必须加上recursive=True参数。 
    在有复杂目录结构的状况下使用该通配符可能会致使性能降低,拖累整个程序的运行,需谨慎使用!正则表达式

  2. iglob(pathname, recursive=False) 
    参数与glob()一致。 
    返回一个迭代器,该迭代器不会同时保存全部匹配到的路径,遍历该迭代器的结果与使用相同参数调用glob()的返回结果一致。shell

  3. escape(pathname) 
    这个函数是在3.4版本以后才有的,功能是忽略全部通配符。(能够用于测试某文件是否存在) 
    3.5.1版本该函数不能正常运行,升级到3.5.2以后恢复正常windows

须要注意的地方:函数

glob默认不匹配以点符号(.)开始的文件,若是有这类文件,则须要作特殊处理。性能

假如当前文件夹包含test.txt和.test.txt两个文件。测试

>>> import glob
>>> glob.glob('*.txt')
['test.txt']
>>> glob.glob('.*.txt')
['.test.txt']
  • 1
  • 2
  • 3
  • 4
  • 5

glob模块支持的通配符:spa

通配符 功能
* 匹配0或多个字符
** 匹配全部文件、目录、子目录和子目录里的文件(3.5版本新增)
? 匹配1个字符,与正则表达式里的?不一样
[exp] 匹配指定范围内的字符,如:[1-9]匹配1至9范围内的字符
[!exp] 匹配不在指定范围内的字符

总结:虽然glob模块能够很轻松地匹配特定文件和文件夹,可是仅仅支持少许的通配符,没办法像正则表达式同样匹配更复杂的字符串。使用的时候应当认真考虑使用场景,根据需求针对性地选择解决方案。code

官方文档地址: 
https://docs.python.org/3.5/library/glob.html#module-glob 
感谢内容提供者

以上内容遵循BY-NC-SA协议,欢迎转载,转载请注明做者。

相关文章
相关标签/搜索