OS模块

⌚️:2020年11月30日

📚参考

os 顾名思义，就是与操作系统相关的标准库。如：文件，目录，执行系统命令等。

1. 导入模块

os 是 python 标准库模块，随 python 一起安装，无需单独安装，可直接导入。

import os

2. path 子模块

涉及与磁盘文件操作，最常使用的当属 path 模块了。path 是 os 的子模块，可以通过 from os import path 使用，也可以直接通过 os.path 属性的方式使用。本文，为了保持一致性，统一采用后者的书写形式。

2.1 exists(path)

检测文件或目录是否存在。存在返回 True , 不存在返回 False 。

os.path.exists("dog.jpeg")
True

2.2 isfile(path)

判断是否为文件。是返回 True，不是返回 False。也可以用来判断文件是否存在。

os.path.isfile("dogs/")
False

2.3 isdir(path)

判断是否为目录。是返回 True，不是返回 False。也可以用来判断目录是否存在。

os.path.isdir("dogs/")
True

2.4 basename(path)

返回不包含所在目录的文件名（含扩展）。

os.path.basename("dir1/dir2/file.ext")
'file.ext'

2.5 dirname(path)

返回文件所在目录。

os.path.dirname("dir1/dir2/file.ext")
'dir1/dir2'

2.6 split(path)

返回一个元组。元组第一个元素为文件所在目录，第二个元素为文件名（含扩展）。等效于 (dirname(path), basename(path))。

os.path.split("dir1/dir2/file.ext")
('dir1/dir2', 'file.ext')

2.7 splitext(path)

返回一个元组。元组第一个元素为文件所在目录和文件名（不含扩展），第二个元素为扩展名（包含 .）。常用来读取或更改文件扩展名。

os.path.splitext("dir1/dir2/file.ext")
('dir1/dir2/file', '.ext')

2.8 join(path, *paths)

将路径不同部分拼接成一个完整的路径。等效于 os.sep.join([path, *paths]) 。

os.path.join("dir1", "dir2", "file.ext")
'dir1/dir2/file.ext'

2.9 getsize(path)

返回文件大小。单位字节。

os.path.getsize("dog.jpeg")
18335

3 目录操作

3.1 listdir(path='.')

返回一个列表。列表为给定目录下所有文件和子目录，但不包含特殊目录 . 和 ..。默认为当前目录。

os.listdir("dogs")[:5]
['122.Pointer', '069.French_bulldog', '124.Poodle', '112.Nova_scotia_duck_tolling_retriever', '043.Canaan_dog']

3.2 mkdir(path, mode=0o777)

创建名为 path 的目录。并以数字形式指定目录权限，默认权限为 777 。

os.mkdir("newdir")

3.3 makedirs(path, mode=0o777)

递归方式创建路径为 path 的目录。并以数字形式指定目录权限，默认权限为 777 。可以看作功能更强大的 mkdir，它会自动创建叶子节点目录的所有上级目录，而 mkdir 必须在上级目录已经存在情况下，才能创建叶子节点的目录。

os.makedirs("parent/child/newdir")

3.4 rmdir(path)

删除目录。目录必须存在，并且只能删除空目录。不存在或不为空，都会异常。要想递归删除整个目录树，请使用 shutil.rmtree()。

os.rmdir("newdir")

3.5 removedirs(path)

递归删除目录。目录必须存在，并且只能删除空目录。不存在或不为空，都会异常。与 rmdir不同的是，在删除了叶子节点目录后，会逐次删除上级目录，直到遇到不为空的目录。

os.removedirs("parent/child/newdir")

3.6 remove(path)

删除文件。不能删除目录，给定路径必须为文件，否则会异常。

Warm Suggestion: 以下复制文件的操作，推荐使用 shutil.copyfile。

# 复制文件
with open("dog.jpeg", "rb") as f:    
    content = f.read()    
    with open("dog.copy.jpeg", "wb") as f2:        
        f2.write(content)
        # 删除文件
        os.remove("dog.copy.jpeg")

4. 其他 os 接口

4.1 getenv(key, default=None)

获取环境变量。

os.getenv("PATH")
'/usr/local/bin:/usr/bin:/bin:/usr/sbin:/sbin'

4.2 get_exec_path(env=None)

返回用于搜索可执行文件的目录列表。看以看作是 PATH 环境变量的列表形式。

os.get_exec_path()
['/usr/local/bin', '/usr/bin', '/bin', '/usr/sbin', '/sbin']

4.3 system(command)

在当前进程中，启动子进程，执行命令 command（字符串），主进程会阻塞，直到子进程执行完成。这是通过调用标准C函数 system() 来实现的，并且具有相同的限制。

if os.name == "nt":    
    command = "dir"
else:    
    command = "ls -l"os.system(command)0

4.4 os.walk()

python中os.walk是一个简单易用的文件、目录遍历器，可以帮助我们高效的处理文件、目录方面的事情。

1.载入

要使用os.walk,首先要载入该函数

可以使用以下两种方法

import os
from os import walk

2.使用

os.walk的函数声明为:

walk(top, topdown=True, onerror=None, followlinks=False)

参数

top 是你所要遍历的目录的地址
topdown 为真，则优先遍历top目录，否则优先遍历top的子目录(默认为开启)
onerror 需要一个 callable 对象，当walk需要异常时，会调用
followlinks 如果为真，则会遍历目录下的快捷方式(linux 下是 symbolic link)实际所指的目录(默认关闭)

os.walk 的返回值是一个生成器(generator),也就是说我们需要不断的遍历它，来获得所有的内容。

每次遍历的对象都是返回的是一个三元组(root,dirs,files)

root 所指的是当前正在遍历的这个文件夹的本身的地址
dirs 是一个 list ，内容是该文件夹中所有的目录的名字(不包括子目录)
files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)

如果topdown 参数为真，walk 会遍历top文件夹，与top文件夹中每一个子目录。

举个例子

如果我们有如下的文件结构:

      a ->   b   ->   1.txt,  2.txt
             c   ->   3.txt
             d   ->   
           4.txt
           5.txt

for (root, dirs, files) in os.walk('a'):
    #第一次运行时，当前遍历目录为 a
    所以 root == 'a'
         dirs == [ 'b', 'c', 'd']
         files == [ '4.txt', '5.txt']
    
    。。。

    # 接着遍历 dirs 中的每一个目录
    b:  root  = 'a\\b'
        dirs  = []
        files = [ '1.txt', '2.txt']
    
    # dirs为空，返回
    # 遍历c
    c:  root  = 'a\\c'
        dirs  = []
        files = [ '3.txt' ]
    
    PS : 如果想获取文件的全路径，只需要 
    for f in files:
        path = os.path.join(root,f)
    
    # 遍历d
    d:  root  = 'a\\b'
        dirs  = []
        files = []

    遍历完毕，退出循环

3.简单的例子

保持目录 a 的目录结构，在 b 中创建对应的文件夹,并把a中所有的文件加上后缀 _bak

import os

Root = 'a'
Dest = 'b'

for (root, dirs, files) in os.walk(Root):
    new_root = root.replace(Root, Dest, 1)
    if not os.path.exists(new_root):
        os.mkdir(new_root)
    
    for d in dirs:
        d = os.path.join(new_root, d)
        if not os.path.exists(d):
            os.mkdir(d)
    
    for f in files:
        # 把文件名分解为 文件名.扩展名
        # 在这里可以添加一个 filter，过滤掉不想复制的文件类型，或者文件名
        (shotname, extension) = os.path.splitext(f)
        # 原文件的路径
        old_path = os.path.join(root, f)
        new_name = shotname + '_bak' + extension
        # 新文件的路径
        new_path = os.path.join(new_root, new_name)
        try:
            # 复制文件
            open(new_path, 'wb').write(open(old_path, 'rb').read())
        except IOError as e:
            print(e)

4.5 os.sep

python是跨平台的。在Windows上，文件的路径分隔符是''，在Linux上是'/'。

为了让代码在不同的平台上都能运行，那么路径应该写''还是'/'呢？

使用os.sep的话，就不用考虑这个了，os.sep根据你所处的平台，自动采用相应的分隔符号。

举例

Linux下一个路径，/usr/share/python,那么上面的os.sep就是‘/’

windows下一个路径，C：\Users\Public\Desktop,那么上面的os.sep就是‘\’.

data_dir = os.sep.join(['hello', 'world'])

4.5.1 join( )

join( )：连接字符串数组。将字符串、元组、列表中的元素以指定的字符（分隔符）连接生成一个新的字符串

语法：

'sep'.join(seq)

参数说明：

sep：分隔符。可以为空

seq：要连接的元素序列、字符串、元组、字典

上面的语法即：以sep作为分隔符，将seq所有的元素合并成一个新的字符串

返回值：返回一个以分隔符sep连接各个元素后生成的字符串

os.path.join()

语法：os.path.join(path1[,path2[,.........]])

返回值：将多个路径组合后返回

注：第一个绝对值路径之前的参数将被忽略

#对序列进行操作（分别使用' '与':'作为分隔符）
>>> seq1 = ['hello','good','boy','doiido']
>>> print ' '.join(seq1)
hello good boy doiido
>>> print ':'.join(seq1)
hello:good:boy:doiido

#对字符串进行操作
>>> seq2 = "hello good boy doiido"
>>> print ':'.join(seq2)
h:e:l:l:o: :g:o:o:d: :b:o:y: :d:o:i:i:d:o

#对元组进行操作
>>> seq3 = ('hello','good','boy','doiido')
>>> print ':'.join(seq3)
hello:good:boy:doiido

#对字典进行操作
>>> seq4 = {'hello':1,'good':2,'boy':3,'doiido':4}
>>> print ':'.join(seq4)
boy:good:doiido:hello

#合并目录
>>> import os
>>> os.path.join('/hello/','good/boy/','doiido')

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

os.md

os.md

OS模块

1. 导入模块

2. path 子模块

2.1 exists(path)

2.2 isfile(path)

2.3 isdir(path)

2.4 basename(path)

2.5 dirname(path)

2.6 split(path)

2.7 splitext(path)

2.8 join(path, *paths)

2.9 getsize(path)

3 目录操作

3.1 listdir(path='.')

3.2 mkdir(path, mode=0o777)

3.3 makedirs(path, mode=0o777)

3.4 rmdir(path)

3.5 removedirs(path)

3.6 remove(path)

4. 其他 os 接口

4.1 getenv(key, default=None)

4.2 get_exec_path(env=None)

4.3 system(command)

4.4 os.walk()

1.载入

2.使用

3.简单的例子

4.5 os.sep

4.5.1 join( )

Files

os.md

Latest commit

History

os.md

File metadata and controls

OS模块

1. 导入模块

2. path 子模块

2.1 exists(path)

2.2 isfile(path)

2.3 isdir(path)

2.4 basename(path)

2.5 dirname(path)

2.6 split(path)

2.7 splitext(path)

2.8 join(path, *paths)

2.9 getsize(path)

3 目录操作

3.1 listdir(path='.')

3.2 mkdir(path, mode=0o777)

3.3 makedirs(path, mode=0o777)

3.4 rmdir(path)

3.5 removedirs(path)

3.6 remove(path)

4. 其他 os 接口

4.1 getenv(key, default=None)

4.2 get_exec_path(env=None)

4.3 system(command)

4.4 os.walk()

1.载入

2.使用

3.简单的例子

4.5 os.sep

4.5.1 join( )