目录node
使用Python操做文件系统时,少不了会对路径进行切换,对目录的遍历,以及获取文件的绝对路径的一系列的操做,Python内置了相关的模块完成对应的功能,其中:python
os.path是os模块中的一个比较重要的用来拼接、判断路径的主要方法,它主要有以下方法:mysql
os.path.abspath('dir/file') 获取dir/file的绝对路径 os.path.split('path') 把路径分割为目录和文件名组成的元组格式,无论path是否存在 os.dirname('path') 获取文件的父目录名称,无论path是否存在 os.basename('path') 获取文件的名称,无论path是否存在 os.path.exists('path') 判断path是否存在,return bool os.path.isabs('path') 判断path是不是从根开始,return bool os.path.isfile('path') 判断path是不是一个文件 os.path.isdir('path') 判断path是不是一个目录 os.path.join('path1','path2','path3'):把path1和path2及path3进行组合,但若是path2中包含了根路径,那么就会舍弃path1,从path2开始组合 os.path.getatime('path') 获取文件的atime时间,返回时间戳 os.path.getmtime('path') 获取文件的mtime时间,返回时间戳 os.path.getsize(filename) 获取文件的大小,单位是字节
Linux下:从/开始,Windows下从C,D,E盘开始nginx
In [1]: import os In [2]: os.path.join('/etc','sysconfig','network-scripts') Out[2]: '/etc/sysconfig/network-scripts' In [3]: os.path.join('/etc','/sysconfig','network-scripts') Out[3]: '/sysconfig/network-scripts' In [8]: p = os.path.join('/etc','sysconfig','network-scripts') In [9]: p Out[9]: '/etc/sysconfig/network-scripts' In [10]: type(p) Out[10]: str In [12]: os.path.exists(p) Out[12]: True In [13]: os.path.split(p) Out[13]: ('/etc/sysconfig', 'network-scripts') In [14]: os.path.abspath('.') Out[14]: '/home/python/py368' In [16]: os.path.dirname(p) Out[16]: '/etc/sysconfig' In [17]: os.path.basename(p) Out[17]: 'network-scripts' >>> os.path.splitdrive('c:/etc/sysconfig/network-script') # windows ('c:', '/etc/sysconfig/network-script')
__file__:变量比较特殊,存放的是当前的Python文件的名称,咱们可使用os.path.abspath(file)来获取当前python文件的绝对路径,而后进行打包或者进行相对调用。sql
3.4之后建议使用pathlib模块,它提供Path对象来对路径进行操做,还包括了目录和文件。windows
在使用时须要实现导入: from pathlib import Pathapp
下面来讲一下平常的目录相关操做less
经过构建一个Path对象来对路径进行初始化socket
In [19]: from pathlib import Path In [20]: p = Path() # 当前目录 In [21]: p1 = Path('a','b','c') # 当前目录下的a/b/c In [22]: p2 = Path('/etc','sysconfig','network-scripts') # /etc/sysconfig/network-scripts In [23]: p Out[23]: PosixPath('.') In [24]: p1 Out[24]: PosixPath('a/b/c') In [25]: p2 Out[25]: PosixPath('/etc/sysconfig/network-scripts')
/
: Path对象支持使用/
来进行路径的拼接,拼接规则应遵循:函数
In [30]: p2 / 'ifcfg-eth0' Out[30]: PosixPath('/etc/sysconfig/network-scripts/ifcfg-eth0') In [35]: p2 / p1 Out[35]: PosixPath('/etc/sysconfig/network-scripts/a/b/c') In [37]: '/root' / p2 Out[37]: PosixPath('/etc/sysconfig/network-scripts')
须要注意的是:
parts属性
: 将Path对象按照当前操做系统的分隔符进行分割返回一个元组
In [39]: p2.parts Out[39]: ('/', 'etc', 'sysconfig', 'network-scripts')
joinpath(*other)
: 在Path对象中使用当前操做系统的路径分隔符分割并追加多个字符串。
In [43]: p2.joinpath('/etc') Out[43]: PosixPath('/etc') In [44]: p2.joinpath('etc') Out[44]: PosixPath('/etc/sysconfig/network-scripts/etc') In [50]: p2.joinpath('/etc','/proc') Out[50]: PosixPath('/proc')
须要注意的是:
Path返回的是一个路径对象,那么如何才能够只打印路径的字符串格式呢,咱们能够经过str(Path对象)
进行转换,当须要bytes格式时,也可使用bytes(Path对象)
转换。
In [51]: bytes(p2) Out[51]: b'/etc/sysconfig/network-scripts' In [52]: str(p2) Out[52]: '/etc/sysconfig/network-scripts'
parent
: 当前目录的逻辑父目录
parents
: 因此父目录的序列,索引0时为当前目录的父目录,依次类推
In [53]: p2.parent Out[53]: PosixPath('/etc/sysconfig') In [54]: p2.parent.parent Out[54]: PosixPath('/etc') In [55]: p2.parent.parent.parent # 链式操做 Out[55]: PosixPath('/') In [57]: p2.parents Out[57]: <PosixPath.parents> # 可迭代对象 In [58]: list(p2.parents) Out[58]: [PosixPath('/etc/sysconfig'), PosixPath('/etc'), PosixPath('/')] In [59]:
parent属性,看似支持类js的链式操做,主要仍是由于每次使用parent属性时,返回的仍是一个Path对象,因此才能够一直parent下去。
在一个目录的绝对路径中咱们可能会单独使用目录的名称、目录的后缀名等等,Path对象提供了专门的属性及方法便于获取或者对它们进行修改。
name
: 目录的最后一个部分suffix
:目录中最后一个部分的扩展名stem
:目录中最后一个部分,不包含后缀名suffixes
: 多个后缀名造成的列表In [1]: from pathlib import Path In [2]: p = Path('/tmp/mysql.tar.gz') In [3]: p.name Out[3]: 'mysql.tar.gz' In [4]: p.suffix Out[4]: '.gz' In [5]: p.stem Out[5]: 'mysql.tar' In [6]: p.suffixes Out[6]: ['.tar', '.gz']
with_suffix(suffix)
: 有扩展名则替换,无则补充扩展名(注意后缀名要加点)with_name(name)
:替换目录最后一个部分并返回一个新的路径In [9]: p Out[9]: PosixPath('/tmp/mysql.tar.gz') In [10]: p.with_suffix('.abc') Out[10]: PosixPath('/tmp/mysql.tar.abc') In [11]: p1 = Path('/tmp/nginx') In [12]: p1.with_suffix('.abc') Out[12]: PosixPath('/tmp/nginx.abc') In [15]: p Out[15]: PosixPath('/tmp/mysql.tar.gz') In [16]: p.with_name('nginx.tar.gz') Out[16]: PosixPath('/tmp/nginx.tar.gz')
cwd()
: 返回当前工做目录home()
: 返回当前家目录is_dir()
: 是不是目录,是目录且存在,则返回Trueis_file()
: 是不是普通文件,是文件且存在,则返回Trueis_symlink()
: 是不是阮连接is_socket()
: 是不是socket文件is_block_device()
: 是不是块设备is_char_device()
: 是不是字符设备is_absolute()
: 是不是绝对路径In [34]: p = Path('/etc','sysconfig') In [35]: p2 = Path('/etc','hosts') In [36]: p3 = Path('/etc','rc.d','rc3.d','S10network') In [37]: p.is_dir() Out[37]: True In [38]: p1.is_file() Out[38]: False In [39]: p2.is_file() Out[39]: True In [44]: p3.is_symlink() Out[44]: True In [45]: p.is_absolute() Out[45]: True
resolve()
: 返回当前Path对象的绝对路径。若是是软链接,则直接被解析absolute()
: 获取Path对象的绝对路径In [28]: p3 = Path('hosts') In [29]: p3 Out[29]: PosixPath('hosts') In [30]: p3.resolve() # 软连接的真正路径 Out[30]: PosixPath('/etc/hosts') In [31]: p3.absolute() # 软连接的绝对路径 Out[31]: PosixPath('/home/python/py368/hosts')
exists()
: 文件或者目录是否存在rmdir()
: 删除空目录(没有提供目录为空的方法)touch(mode=0o666,exist_ok=False)
: 建立一个文件
mode
: 文件的属性,默认为666exist_ok
: 在3.5版本加入,False时,路径存在,抛出FileExistsError;True时,异常将被忽略In [47]: p = Path('/tmp','hello.py') In [49]: p.exists() Out[49]: False In [50]: p.touch(mode=0o666,exist_ok=False) In [51]: p.exists() Out[51]: True In [52]: p.touch(mode=0o666,exist_ok=False) --------------------------------------------------------------------------- FileExistsError Traceback (most recent call last) ... FileExistsError: [Errno 17] File exists: '/tmp/hello.py' In [53]:
In [56]: p2.as_uri() Out[56]: 'file:///etc/hosts'
mkdir(mode=0o777,parents=False,exist_ok=False)
: 建立一个目录
parents
:是否建立父目录,True等同于mkdir -p
, False时,父目录不存在曝出FileNotFoundErrorexist_ok
: 在3.5版本加入,False时,路径存在,抛出FileExistsError;True时,异常将被忽略iterdir()
: 迭代当前目录,不递归。In [74]: for x in p4.parents[0].iterdir(): ...: if x.is_dir(): ...: flag = False ...: for _ in x.iterdir(): ...: flag = True ...: break ...: print('dir: {} , is {}'.format(x,'not empty ' if flag else 'empt ...: y' )) ...: elif x.is_file(): ...: print('{} is a file'.format(x)) ...: else: ...: print('other file')
判断文件类型,当文件为目录时,判断其是否为空目录。
glob(partten)
: 在目录下
通配给定的格式rglob(partten)
: 在目录下
递归通配给定的格式(递归目录)match(partten)
: 模式匹配(对当前Path对象进行匹配),成功返回TrueIn [84]: p4 Out[84]: PosixPath('/etc/sysconfig/network-scripts') In [85]: list(p4.glob('ifu?-*')) Out[85]: [PosixPath('/etc/sysconfig/network-scripts/ifup-aliases'), PosixPath('/etc/sysconfig/network-scripts/ifup-bnep'), PosixPath('/etc/sysconfig/network-scripts/ifup-eth'), PosixPath('/etc/sysconfig/network-scripts/ifup-ippp'), PosixPath('/etc/sysconfig/network-scripts/ifup-ipv6'), PosixPath('/etc/sysconfig/network-scripts/ifup-isdn'), PosixPath('/etc/sysconfig/network-scripts/ifup-plip'), PosixPath('/etc/sysconfig/network-scripts/ifup-plusb'), PosixPath('/etc/sysconfig/network-scripts/ifup-post'), PosixPath('/etc/sysconfig/network-scripts/ifup-ppp'), PosixPath('/etc/sysconfig/network-scripts/ifup-routes'), PosixPath('/etc/sysconfig/network-scripts/ifup-sit'), PosixPath('/etc/sysconfig/network-scripts/ifup-tunnel'), PosixPath('/etc/sysconfig/network-scripts/ifup-wireless'), PosixPath('/etc/sysconfig/network-scripts/ifup-ib'), PosixPath('/etc/sysconfig/network-scripts/ifup-Team'), PosixPath('/etc/sysconfig/network-scripts/ifup-TeamPort')] In [87]: p4.match('/etc/*/network-script?') Out[87]: True
stat()
: 查看目录的详细信息,至关于stat命令lstat()
: 若是是符号连接,则显示符号连接自己的文件信息In [88]: p4.stat() Out[88]: os.stat_result(st_mode=16877, st_ino=67533402, st_dev=2050, st_nlink=2, st_uid=0, st_gid=0, st_size=4096, st_atime=1550229289, st_mtime=1545830238, st_ctime=1545830238)
Path对象一样提供了打开文件的函数,功能相似于内建函数open。返回一个文件对象。当咱们建立一个Path对象时,这个文件已经被打开,当咱们写入数据时,文件不存在会新建,重名或者是目录,会有相应的异常提示,它的语法是
Path.open(mode='r',buffering=-1,encoding=None,errors=None,newline=None)
例:
In [115]: p5 Out[115]: PosixPath('/tmp/123') In [116]: p = p5.open(mode='r') In [117]: p Out[117]: <_io.TextIOWrapper name='/tmp/123' mode='r' encoding='UTF-8'> In [118]: p.read() Out[118]: '123' In [119]: p5.read_text() # 不存在时报异常,存在则直接打开并读取 Out[119]: '123'
3.5之后新增长的函数方法:
Path.read_bytes()
: 以'rb'方式读取路径对应文件,并返回二进制流。Path.read_text()
: 以'rt'方式读取路径文件, 并返回文件。无视指针Path.write_bytes()
: 以'wb'方式写入数据到路径对应文件中。Path.write_text()
: 以'wt'方式写入数据到路径对应文件中。os模块的经常使用方法:
os.getcwd(): 获取当前路径 os.chdir(): 切换当前目录,当路径中存在\的时候,因为是转意的意思,那么就须要对\进行转意,那么路径就是c:\\User,或者在目录前面加r,表示后面的字符串不进行解释 os.curdir(): 获取当前目录名 os.pardir(): 获取上级目录名 os.mkdir('dir'): 建立目录,注意只能建立一级目录 os.makedirs('dir_path'):建立多级目录 os.rmdir('dir'): 删除一个目录 os.removedir('dir_path'):删除多级目录(目录为空的话) os.listdir('dir'): 显示目录下的全部文件,默认为当前目录,返回的结果为list os.remove('file'): 删除一个文件 os.rename('old_name','new_name'):修改文件名称 os.stat('file/dir'):获取文件/目录的stat信息(调用的是系统的stat) os.sep: 返回当前操做系统的路径分隔符(Windows下:\\ , Linux下:/) os.linesep: 返回当前操做系统的换行符(Windows下:\r\n ,Linux下:\n) os.pathsep: 返回当前操做系统环境变量分隔符(Windows下是; ,Linux下是:) os.name: 返回当前系统的类型(nt 表示Windows, posix表示Linux) os.system('Commmand'):执行命令 os.environ: 获取系统环境变量,使用字典存储 os.path.abspath('dir/file'):获取dir/file的绝对路径 os.path.split('path'):把路径分割为目录和文件名组成的元组格式,无论path是否存在 os.dirname('path'):获取文件的父目录名称,无论path是否存在 os.basename('path'):获取文件的名称,无论path是否存在
os.stat(follow_symlinks=True),返回源文件自己信息,False时,显示连接文件的信息,对于软链接自己,还可使用os.lstat方法
In [133]: os.lstat('hosts') Out[133]: os.stat_result(st_mode=41471, st_ino=2083428, st_dev=2050, st_nlink=1, st_uid=1001, st_gid=1001, st_size=10, st_atime=1550259162, st_mtime=1550259161, st_ctime=1550259161) In [134]: os.stat('hosts') Out[134]: os.stat_result(st_mode=33188, st_ino=67245317, st_dev=2050, st_nlink=1, st_uid=0, st_gid=0, st_size=158, st_atime=1550229294, st_mtime=1370615492, st_ctime=1545666279) In [136]: os.stat('hosts',follow_symlinks=False) # 等同于os.lstat() Out[136]: os.stat_result(st_mode=41471, st_ino=2083428, st_dev=2050, st_nlink=1, st_uid=1001, st_gid=1001, st_size=10, st_atime=1550259162, st_mtime=1550259161, st_ctime=1550259161) In [137]:
根据前面所学的知识,咱们若是想要进行文件拷贝,须要先打开两个文件对象对象,源文件读取内容,写入到目标文件中去。 这种方式虽然完成了文件的拷贝,可是却丢失了文件的属性信息,好比属组、权限等,由于咱们根本没有进行复制。因此,python提供了一个用于高级文件操做的库,它的名字就叫作shutil。
shutil.copyfileobj(fsrc,fdes,length)
: 将文件内容拷贝到另外一个文件中,能够只拷贝部份内容,须要咱们自行打开文件对象进行copy,length表示buffer的大小,须要注意的是fdes必须可写>>> import os,shutil >>> os.system('ls') 1.txt >>> shutil.copyfileobj(open('1.txt'),open('2.txt','w')) >>> os.system('ls') 1.txt 2.txt >>>
shutil.copyfile(fsrc,fdes)
: 复制文件,咱们只须要传入文件名称便可进行复制,不用自行预先打开,等于建立一个新的文件,把老文件写入到新文件中而后关闭,新建立的文件权限和属主等信息遵循操做系统规定(本质上仍是调用copyfileobj)>>> shutil.copyfile('1.txt','3.txt') >>> os.system('ls') 1.txt 2.txt 3.txt
shutil.copymode(src,des)
: 复制文件权限,既把src文件的权限复制给 des文件,只改变权限,不改变其余好比属组,内容等(des文件必须存在)>>> os.system('ls -l') total 12 -rwxrwxrwx 1 root root 6 Mar 9 18:35 1.txt -rw-r--r-- 1 root root 6 Mar 9 18:36 2.txt -rw-r--r-- 1 root root 6 Mar 9 18:38 3.txt >>> shutil.copymode('1.txt','2.txt') >>> os.system('ls -l') total 12 -rwxrwxrwx 1 root root 6 Mar 9 18:35 1.txt -rwxrwxrwx 1 root root 6 Mar 9 18:36 2.txt -rw-r--r-- 1 root root 6 Mar 9 18:38 3.txt >>>
shutil.copystat(src,des)
: 复制文件的权限,还包括,atime,mtime,flags等信息,不改变文件内容(des需存在)>>> os.system('stat 1.txt') File: `1.txt' Size: 6 Blocks: 8 IO Block: 4096 regular file Device: fd00h/64768d Inode: 926326 Links: 1 Access: (0777/-rwxrwxrwx) Uid: ( 0/ root) Gid: ( 0/ root) Access: 2017-03-09 18:36:59.223738919 +0800 Modify: 2017-03-09 18:35:23.148738381 +0800 Change: 2017-03-09 18:39:59.061738605 +0800 >>> os.system('stat 3.txt') File: `3.txt' Size: 6 Blocks: 8 IO Block: 4096 regular file Device: fd00h/64768d Inode: 940237 Links: 1 Access: (0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root) Access: 2017-03-09 18:39:42.214738376 +0800 Modify: 2017-03-09 18:38:13.862738316 +0800 Change: 2017-03-09 18:38:13.862738316 +0800 >>> shutil.copystat('1.txt','3.txt') >>> os.system('stat 3.txt') File: `3.txt' Size: 6 Blocks: 8 IO Block: 4096 regular file Device: fd00h/64768d Inode: 940237 Links: 1 Access: (0777/-rwxrwxrwx) Uid: ( 0/ root) Gid: ( 0/ root) Access: 2017-03-09 18:36:59.223738000 +0800 Modify: 2017-03-09 18:35:23.148738000 +0800 Change: 2017-03-09 18:44:33.286738354 +0800 >>>
shutil.copy(src,des)
: 复制文件的同时复制权限信息,等同于执行了以下命令:
shutil.copy2(src,des)
: 比copy对了所有原数据,但须要平台支持,等同于执行了以下命令:
shutil.copytree(src,dest,symlinks=False,ignore=None,copy_function=copy2,ignore_dangling_symlinks=False)
: 递归复制文件,相似于copy -r,默认使用copy2
ignore = func
, 提供一个callable(src,namnes) --> ignoted_names。提供一个函数,它会被调用。src是原目录,names是原目录下的文件列表(os.listdir(src)),返回值是要被过滤的文件名的set类型数据In [146]: def func(src,names): ...: ig = filter(lambda x: not x.endswith('conf'),names) ...: return set(ig) In [164]: os.listdir('old') Out[164]: ['123.txt', '456.txt', 'asound.conf', 'brltty.conf', 'chrony.conf', 'dleyna-server-service.conf', 'dnsmasq.conf', 'dracut.conf', 'e2fsck.conf', 'fprintd.conf', 'fuse.conf', 'GeoIP.conf', 'host.conf'] In [161]: shutil.copytree('old','new',ignore=func) Out[161]: 'new' In [163]: os.listdir('new') Out[163]: ['123.txt', '456.txt']
shutil模块本身也实现了一个过滤某些特征的方法,
shutil.ignore_patterns('*py')
,表示过滤*py的文件。
shutil.rmtree(path, ignore_errors=False, onerror=None)
: 递归的删除文件,相似于rm -rf,须要注意的是它不是原子操做,若是删除错误,就会中断,已经删除的就删除了。
>>> os.system('ls -l') total 8 drwxr-xr-x 2 root root 4096 Mar 9 18:46 test drwxr-xr-x 2 root root 4096 Mar 9 18:46 test1 >>> shutil.rmtree('test1') >>> os.system('ls -l') total 4 drwxr-xr-x 2 root root 4096 Mar 9 18:46 test >>>
shutil.move(src,des,copy_function=copy2)
: 递归移动文件、目录到目标、返回目标,相似于mv 命令,自己使用的是os.rename方法,若是不支持rename,若是是目录则copytree再删除原目录。In [3]: import shutil In [4]: ls new/ old/ In [5]: shutil.move('new','/tmp/new') Out[5]: '/tmp/new' In [6]: ls old/ In [7]: shutil.move('old','new_old') Out[7]: 'new_old'
shutil.make_archive(base_name, format, root_dir=None, base_dir=None, verbose=0, owner=None, group=None, )
: 打包压缩,支持"zip", "tar", "gztar","bztar", or "xztar"
In [14]: shutil.make_archive('abc','gztar',root_dir='new_old') Out[14]: '/home/python/py368/abc.tar.gz' In [15]: ls 123/ abc.tar.gz new_old/