Python遍历文件夹的两种方法比较

时间 2021-01-19

标签 ide 测试 spa xml 排序 utf-8 string class test 栏目 Python 繁體版

原文原文链接

遍历文件夹是一个很经常使用的功能吧。这里分别用两种方法实现： ide

第一种：使用os.walk:
测试

  
  
           
  
  
   
   
            
   
   # -*- coding: utf-8 -*- 
   
   
            
   
   import os 
   
   
            
   
   def Test1(rootDir): 
   
   
            
   
       list_dirs = os.walk(rootDir) 
   
   
            
   
       for root, dirs, files in list_dirs: 
   
   
            
   
           for d in dirs: 
   
   
            
   
               print os.path.join(root, d)      
   
   
            
   
           for f in files: 
   
   
            
   
               print os.path.join(root, f)

第二种：使用os.listdir:spa

  
  
           
  
  
   
   
            
   
   # -*- coding: utf-8 -*- 
   
   
            
   
   import os 
   
   
            
   
   def Test2(rootDir): 
   
   
            
   
       for lists in os.listdir(rootDir): 
   
   
            
   
           path = os.path.join(rootDir, lists) 
   
   
            
   
           print path 
   
   
            
   
           if os.path.isdir(path): 
   
   
            
   
               Test2(path)

这两种到底有什么区别呢？xml

这里先创建一个测试目录E:\test，目录结构以下：排序

  
  
           
  
  
   
   
            
   
   E:\TEST 
   
   
            
   
   │--A 
   
   
            
   
   │  │--A-A 
   
   
            
   
   │  │  │--A-A-A.txt 
   
   
            
   
   │  │--A-B.txt 
   
   
            
   
   │  │--A-C 
   
   
            
   
   │  │  │--A-B-A.txt 
   
   
            
   
   │  │--A-D.txt 
   
   
            
   
   │--B.txt 
   
   
            
   
   │--C 
   
   
            
   
   │  │--C-A.txt 
   
   
            
   
   │  │--C-B.txt 
   
   
            
   
   │--D.txt 
   
   
            
   
   │--E

下面经过运行以下代码：utf-8

  
  
           
  
  
   
   
            
   
   Test1('E:\TEST') 
   
   
            
   
   print '=======================================' 
   
   
            
   
   Test2('E:\TEST')

输出结果为：string

  
  
           
  
  
   
   
            
   
   >>>  
   
   
            
   
   E:\TEST\A 
   
   
            
   
   E:\TEST\C 
   
   
            
   
   E:\TEST\E 
   
   
            
   
   E:\TEST\B.txt 
   
   
            
   
   E:\TEST\D.txt 
   
   
            
   
   E:\TEST\A\A-A 
   
   
            
   
   E:\TEST\A\A-C 
   
   
            
   
   E:\TEST\A\A-B.txt 
   
   
            
   
   E:\TEST\A\A-D.txt 
   
   
            
   
   E:\TEST\A\A-A\A-A-A.txt 
   
   
            
   
   E:\TEST\A\A-C\A-B-A.txt 
   
   
            
   
   E:\TEST\C\C-A.txt 
   
   
            
   
   E:\TEST\C\C-B.txt 
   
   
            
   
   ======================================= 
   
   
            
   
   E:\TEST\A 
   
   
            
   
   E:\TEST\A\A-A 
   
   
            
   
   E:\TEST\A\A-A\A-A-A.txt 
   
   
            
   
   E:\TEST\A\A-B.txt 
   
   
            
   
   E:\TEST\A\A-C 
   
   
            
   
   E:\TEST\A\A-C\A-B-A.txt 
   
   
            
   
   E:\TEST\A\A-D.txt 
   
   
            
   
   E:\TEST\B.txt 
   
   
            
   
   E:\TEST\C 
   
   
            
   
   E:\TEST\C\C-A.txt 
   
   
            
   
   E:\TEST\C\C-B.txt 
   
   
            
   
   E:\TEST\D.txt 
   
   
            
   
   E:\TEST\E 
   
   
            
   
   >>>

能够看出，对于第一种方法，输出老是先文件夹后文件名的，对于第二种，则是按照目录树结构以及按照首字母排序进行输出的。it

另外以前打印出的目录树其实就是经过对第二种方法进行稍微修改实现的，以下：class

  
  
           
  
  
   
   
            
   
   def Test3(rootDir, level=1): 
   
   
            
   
       if level==1: print rootDir 
   
   
            
   
       for lists in os.listdir(rootDir): 
   
   
            
   
           path = os.path.join(rootDir, lists) 
   
   
            
   
           print '│  '*(level-1)+'│--'+lists 
   
   
            
   
           if os.path.isdir(path): 
   
   
            
   
               Test3(path, level+1)