os 包提供了平台无关的操作系统功能接口。尽管错误处理是 go 风格的,但设计是 Unix 风格的;所以,失败的调用会返回 error 而非错误码。通常 error 里会包含更多信息。例如,如果使用一个文件名的调用(如 Open、Stat)失败了,打印错误时会包含该文件名,错误类型将为 *PathError,其内部可以解包获得更多信息。
os
error
*PathError
os 包规定为所有操作系统实现的接口都是一致的。有一些某个系统特定的功能,需要使用 syscall 获取。实际上,os 依赖于 syscall。在实际编程中,我们应该总是优先使用 os 中提供的功能,而不是 syscall。
syscall
下面是一个简单的例子,打开一个文件并从中读取一些数据:
file, err := os.Open("file.go") // For read access. if err != nil { log.Fatal(err) }
如果打开失败,错误字符串是自解释的,例如:
open file.go: no such file or directory
而不像 C 语言,需要额外的函数(或宏)来解释错误码。
在第一章,我们较全面的介绍了 Go 中的 I/O。本节,我们着重介绍文件相关的 I/O。因为 I/O 操作涉及到系统调用,在讲解时会涉及到 Unix 在这方面的系统调用。
在 Unix 系统调用中,所有 I/O 操作以文件描述符 ( 一个非负整数 , 通常是小整数 ) 来指代打开的文件。文件描述符用以表示所有类型的已打开文件,包括管道(pipe)、FIFO、socket、终端、设备和普通文件。这里,我们主要介绍普通文件的 I/O。
在 Go 中,文件描述符封装在 os.File 结构中,通过 File.Fd() 可以获得底层的文件描述符:fd。
os.File
File.Fd()
按照惯例,大多数程序都期望能够使用 3 种标准的文件描述符:0- 标准输入;1- 标准输出;2- 标准错误。os 包提供了 3 个 File 对象,分别代表这 3 种标准描述符:Stdin、Stdout 和 Stderr,它们对应的文件名分别是:/dev/stdin、/dev/stdout 和 /dev/stderr。注意,这里说的文件名,并不一定存在,比如 Windows 下就没有。
File
Stdin
Stdout
Stderr
OpenFile 既能打开一个已经存在的文件,也能创建并打开一个新文件。
OpenFile
func OpenFile(name string, flag int, perm FileMode) (*File, error)
OpenFile 是一个更一般性的文件打开函数,大多数调用者都应用 Open 或 Create 代替本函数。它会使用指定的选项(如 O_RDONLY 等)、指定的模式(如 0666 等)打开指定名称的文件。如果操作成功,返回的文件对象可用于 I/O。如果出错,错误底层类型是 *PathError。
Open
Create
要打开的文件由参数 name 指定,它可以是绝对路径或相对路径(相对于进程当前工作目录),也可以是一个符号链接(会对其进行解引用)。
name
位掩码参数 flag 用于指定文件的访问模式,可用的值在 os 中定义为常量(以下值并非所有操作系统都可用):
flag
const ( O_RDONLY int = syscall.O_RDONLY // 只读模式打开文件 O_WRONLY int = syscall.O_WRONLY // 只写模式打开文件 O_RDWR int = syscall.O_RDWR // 读写模式打开文件 O_APPEND int = syscall.O_APPEND // 写操作时将数据附加到文件尾部 O_CREATE int = syscall.O_CREAT // 如果不存在将创建一个新文件 O_EXCL int = syscall.O_EXCL // 和 O_CREATE 配合使用,文件必须不存在 O_SYNC int = syscall.O_SYNC // 打开文件用于同步 I/O O_TRUNC int = syscall.O_TRUNC // 如果可能,打开时清空文件 )
其中,O_RDONLY、O_WRONLY、O_RDWR 应该只指定一个,剩下的通过 | 操作符来指定。该函数内部会给 flags 加上 syscall.O_CLOEXEC,在 fork 子进程时会关闭通过 OpenFile 打开的文件,即子进程不会重用该文件描述符。
O_RDONLY
O_WRONLY
O_RDWR
|
flags
syscall.O_CLOEXEC
注意:由于历史原因,O_RDONLY | O_WRONLY 并非等于 O_RDWR,它们的值一般是 0、1、2。
O_RDONLY | O_WRONLY
位掩码参数 perm 指定了文件的模式和权限位,类型是 os.FileMode,文件模式位常量定义在 os 中:
perm
os.FileMode
const ( // 单字符是被 String 方法用于格式化的属性缩写。 ModeDir FileMode = 1 << (32 - 1 - iota) // d: 目录 ModeAppend // a: 只能写入,且只能写入到末尾 ModeExclusive // l: 用于执行 ModeTemporary // T: 临时文件(非备份文件) ModeSymlink // L: 符号链接(不是快捷方式文件) ModeDevice // D: 设备 ModeNamedPipe // p: 命名管道(FIFO) ModeSocket // S: Unix 域 socket ModeSetuid // u: 表示文件具有其创建者用户 id 权限 ModeSetgid // g: 表示文件具有其创建者组 id 的权限 ModeCharDevice // c: 字符设备,需已设置 ModeDevice ModeSticky // t: 只有 root/ 创建者能删除 / 移动文件 // 覆盖所有类型位(用于通过 & 获取类型位),对普通文件,所有这些位都不应被设置 ModeType = ModeDir | ModeSymlink | ModeNamedPipe | ModeSocket | ModeDevice ModePerm FileMode = 0777 // 覆盖所有 Unix 权限位(用于通过 & 获取类型位) )
以上常量在所有操作系统都有相同的含义(可用时),因此文件的信息可以在不同的操作系统之间安全的移植。不是所有的位都能用于所有的系统,唯一共有的是用于表示目录的 ModeDir 位。
ModeDir
以上这些被定义的位是 FileMode 最重要的位。另外 9 个位(权限位)为标准 Unix rwxrwxrwx 权限(所有人都可读、写、运行)。
FileMode
FileMode 还定义了几个方法,用于判断文件类型的 IsDir() 和 IsRegular(),用于获取权限的 Perm()。
IsDir()
IsRegular()
Perm()
返回的 error,具体实现是 *os.PathError,它会记录具体操作、文件路径和错误原因。
*os.PathError
另外,在 OpenFile 内部会调用 NewFile,来得到 File 对象。
NewFile
使用方法
打开一个文件,一般通过 Open 或 Create,我们看这两个函数的实现。
func Open(name string) (*File, error) { return OpenFile(name, O_RDONLY, 0) } func Create(name string) (*File, error) { return OpenFile(name, O_RDWR|O_CREATE|O_TRUNC, 0666) }
func (f *File) Read(b []byte) (n int, err error)
Read 方法从 f 中读取最多 len(b) 字节数据并写入 b。它返回读取的字节数和可能遇到的任何错误。文件终止标志是读取 0 个字节且返回值 err 为 io.EOF。
Read
f
len(b)
b
io.EOF
从方法声明可以知道,File 实现了 io.Reader 接口。
io.Reader
Read 对应的系统调用是 read。
read
对比下 ReadAt 方法:
ReadAt
func (f *File) ReadAt(b []byte, off int64) (n int, err error)
ReadAt 从指定的位置(相对于文件开始位置)读取长度为 len(b) 个字节数据并写入 b。它返回读取的字节数和可能遇到的任何错误。当 n<len(b) 时,本方法总是会返回错误;如果是因为到达文件结尾,返回值 err 会是 io.EOF。它对应的系统调用是 pread。
pread
Read 和 ReadAt 的区别:前者从文件当前偏移量处读,且会改变文件当前的偏移量;而后者从 off 指定的位置开始读,且不会改变文件当前偏移量。
off
func (f *File) Write(b []byte) (n int, err error)
Write 向文件中写入 len(b) 字节数据。它返回写入的字节数和可能遇到的任何错误。如果返回值 n!=len(b),本方法会返回一个非 nil 的错误。
Write
n!=len(b)
从方法声明可以知道,File 实现了 io.Writer 接口。
io.Writer
Write 对应的系统调用是 write。
write
Write 与 WriteAt 的区别同 Read 与 ReadAt 的区别一样。为了方便,还提供了 WriteString 方法,它实际是对 Write 的封装。
WriteAt
WriteString
注意:Write 调用成功并不能保证数据已经写入磁盘,因为内核会缓存磁盘的 I/O 操作。如果希望立刻将数据写入磁盘(一般场景不建议这么做,因为会影响性能),有两种办法:
1. 打开文件时指定 `os.O_SYNC`; 2. 调用 `File.Sync()` 方法。
说明:File.Sync() 底层调用的是 fsync 系统调用,这会将数据和元数据都刷到磁盘;如果只想刷数据到磁盘(比如,文件大小没变,只是变了文件数据),需要自己封装,调用 fdatasync 系统调用。(syscall.Fdatasync)
File.Sync()
fsync
fdatasync
syscall.Fdatasync
close() 系统调用关闭一个打开的文件描述符,并将其释放回调用进程,供该进程继续使用。当进程终止时,将自动关闭其已打开的所有文件描述符。
close()
func (f *File) Close() error
os.File.Close() 是对 close() 的封装。我们应该养成关闭不需要的文件的良好编程习惯。文件描述符是资源,Go 的 gc 是针对内存的,并不会自动回收资源,如果不关闭文件描述符,长期运行的服务可能会把文件描述符耗尽。
os.File.Close()
所以,通常的写法如下:
file, err := os.Open("/tmp/studygolang.txt") if err != nil { // 错误处理,一般会阻止程序往下执行 return } defer file.Close()
关于返回值 error
以下两种情况会导致 Close 返回错误:
Close
1. 关闭一个未打开的文件; 2. 两次关闭同一个文件;
通常,我们不会去检查 Close 的错误。
对于每个打开的文件,系统内核会记录其文件偏移量,有时也将文件偏移量称为读写偏移量或指针。文件偏移量是指执行下一个 Read 或 Write 操作的文件其实位置,会以相对于文件头部起始点的文件当前位置来表示。文件第一个字节的偏移量为 0。
文件打开时,会将文件偏移量设置为指向文件开始,以后每次 Read 或 Write 调用将自动对其进行调整,以指向已读或已写数据后的下一个字节。因此,连续的 Read 和 Write 调用将按顺序递进,对文件进行操作。
而 Seek 可以调整文件偏移量。方法定义如下:
Seek
func (f *File) Seek(offset int64, whence int) (ret int64, err error)
Seek 设置下一次读 / 写的位置。offset 为相对偏移量,而 whence 决定相对位置:0 为相对文件开头,1 为相对当前位置,2 为相对文件结尾。它返回新的偏移量(相对开头)和可能的错误。使用中,whence 应该使用 os 包中的常量:SEEK_SET、SEEK_CUR 和 SEEK_END。
SEEK_SET
SEEK_CUR
SEEK_END
注意:Seek 只是调整内核中与文件描述符相关的文件偏移量记录,并没有引起对任何物理设备的访问。
一些 Seek 的使用例子(file 为打开的文件对象),注释说明了将文件偏移量移动到的具体位置:
file.Seek(0, os.SEEK_SET) // 文件开始处 file.Seek(0, SEEK_END) // 文件结尾处的下一个字节 file.Seek(-1, SEEK_END) // 文件最后一个字节 file.Seek(-10, SEEK_CUR) // 当前位置前 10 个字节 file.Seek(1000, SEEK_END) // 文件结尾处的下 1001 个字节
最后一个例子在文件中会产生“空洞”。
Seek 对应系统调用 lseek。该系统调用并不适用于所有类型,不允许将 lseek 应用于管道、FIFO、socket 或 终端。
lseek
trucate 和 ftruncate 系统调用将文件大小设置为 size 参数指定的值;Go 语言中相应的包装函数是 os.Truncate 和 os.File.Truncate。
trucate
ftruncate
size
os.Truncate
os.File.Truncate
func Truncate(name string, size int64) error func (f *File) Truncate(size int64) error
如果文件当前长度大于参数 size,调用将丢弃超出部分,若小于参数 size,调用将在文件尾部添加一系列空字节或是一个文件空洞。
它们之间的区别在于如何指定操作文件:
1. `Truncate` 以路径名称字符串来指定文件,并要求可访问该文件(即对组成路径名的各目录拥有可执行 (x) 权限),且对文件拥有写权限。若文件名为符号链接,那么调用将对其进行解引用。 2. 很明显,调用 `File.Truncate` 前,需要先以可写方式打开操作文件,该方法不会修改文件偏移量。
文件属性,也即文件元数据。在 Go 中,文件属性具体信息通过 os.FileInfo 接口获取。函数 Stat、Lstat 和 File.Stat 可以得到该接口的实例。这三个函数对应三个系统调用:stat、lstat 和 fstat。
os.FileInfo
Stat
Lstat
File.Stat
stat
lstat
fstat
这三个函数的区别:
Stat 和 Lstat 无需对其所操作的文件本身拥有任何权限,但针对指定 name 的父目录要有执行(搜索)权限。而只要 File 对象 ok,File.Stat 总是成功。
FileInfo 接口如下:
FileInfo
type FileInfo interface { Name() string // 文件的名字(不含扩展名) Size() int64 // 普通文件返回值表示其大小;其他文件的返回值含义各系统不同 Mode() FileMode // 文件的模式位 ModTime() time.Time // 文件的修改时间 IsDir() bool // 等价于 Mode().IsDir() Sys() interface{} // 底层数据来源(可以返回 nil) }
Sys() 底层数据的 C 语言 结构 statbuf 格式如下:
Sys()
statbuf
struct stat { dev_t st_dev; // 设备 ID ino_t st_ino; // 文件 i 节点号 mode_t st_mode; // 位掩码,文件类型和文件权限 nlink_t st_nlink; // 硬链接数 uid_t st_uid; // 文件属主,用户 ID gid_t st_gid; // 文件属组,组 ID dev_t st_rdev; // 如果针对设备 i 节点,则此字段包含主、辅 ID off_t st_size; // 常规文件,则是文件字节数;符号链接,则是链接所指路径名的长度,字节为单位;对于共享内存对象,则是对象大小 blksize_t st_blsize; // 分配给文件的总块数,块大小为 512 字节 blkcnt_t st_blocks; // 实际分配给文件的磁盘块数量 time_t st_atime; // 对文件上次访问时间 time_t st_mtime; // 对文件上次修改时间 time_t st_ctime; // 文件状态发生改变的上次时间 }
Go 中 syscal.Stat_t 与该结构对应。
syscal.Stat_t
如果我们要获取 FileInfo 接口没法直接返回的信息,比如想获取文件的上次访问时间,示例如下:
fileInfo, err := os.Stat("test.log") if err != nil { log.Fatal(err) } sys := fileInfo.Sys() stat := sys.(*syscall.Stat_t) fmt.Println(time.Unix(stat.Atimespec.Unix()))
可以显式改变文件的访问时间和修改时间。
func Chtimes(name string, atime time.Time, mtime time.Time) error
Chtimes 修改 name 指定的文件对象的访问时间和修改时间,类似 Unix 的 utime() 或 utimes() 函数。底层的文件系统可能会截断 / 舍入时间单位到更低的精确度。如果出错,会返回 *PathError 类型的错误。在 Unix 中,底层实现会调用 utimenstat(),它提供纳秒级别的精度。
Chtimes
utimenstat()
每个文件都有一个与之关联的用户 ID(UID)和组 ID(GID),籍此可以判定文件的属主和属组。系统调用 chown、lchown 和 fchown 可用来改变文件的属主和属组,Go 中对应的函数或方法:
chown
lchown
fchown
func Chown(name string, uid, gid int) error func Lchown(name string, uid, gid int) error func (f *File) Chown(uid, gid int) error
它们的区别和上文提到的 Stat 相关函数类似。
这里介绍是应用于文件和目录的权限方案,尽管此处讨论的权限主要是针对普通文件和目录,但其规则可适用于所有文件类型,包括设备文件、FIFO 以及 Unix 域套接字等。
如前所述,os.FileMode 或 C 结构 stat 中的 st_mod 的低 12 位定义了文件权限。其中前 3 位为专用位,分别是 set-user-ID 位、set-group-ID 位和 sticky 位。其余 9 位则构成了定义权限的掩码,分别授予访问文件的各类用户。文件权限掩码分为 3 类:
st_mod
可为每一类用户授予的权限如下:
Unix 中表示:rwxrwxrwx。
目录与文件拥有相同的权限方案,只是对 3 种权限的含义另有所指。
访问文件时,需要拥有对路径名所列所有目录的执行权限。例如,想读取文件 /home/studygolang/abc,则需拥有对目录 /、/home 以及 /home/studygolang 的执行权限(还要有对文件 abc 自身的读权限)。
/home/studygolang/abc
/
/home
/home/studygolang
abc
在文件相关操作报错时,可以通过 os.IsPermission 检查是否是权限的问题。
os.IsPermission
func IsPermission(err error) bool
返回一个布尔值说明该错误是否表示因权限不足要求被拒绝。ErrPermission 和一些系统调用错误会使它返回真。
另外,syscall.Access 可以获取文件的权限。这对应系统调用 access。
syscall.Access
access
除了 9 位用来表明属主、属组和其他用户的权限外,文件权限掩码还另设有 3 个附加位,分别是 set-user-ID(bit 04000)、set-group-ID(bit 02000) 和 sticky(bit 01000) 位。set-user-ID 和 set-group-ID 权限位将在进程章节介绍。这里介绍 sticky 位。
Sticky 位一般用于目录,起限制删除位的作用,表明仅当非特权进程具有对目录的写权限,且为文件或目录的属主时,才能对目录下的文件进行删除和重命名操作。根据这个机制来创建为多个用户共享的一个目录,各个用户可在其下创建或删除属于自己的文件,但不能删除隶属于其他用户的文件。/tmp 目录就设置了 sticky 位,正是出于这个原因。
/tmp
chmod 命令或系统调用可以设置文件的 sticky 位。若对某文件设置了 sticky 位,则 ls -l 显示文件时,会在其他用户执行权限字段上看到字母 t(有执行权限时) 或 T(无执行权限时)。
chmod
ls -l
os.Chmod 和 os.File.Chmod 可以修改文件权限(包括 sticky 位),分别对应系统调用 chmod 和 fchmod。
os.Chmod
os.File.Chmod
fchmod
func main() { file, err := os.Create("studygolang.txt") if err != nil { log.Fatal("error:", err) } defer file.Close() fileMode := getFileMode(file) log.Println("file mode:", fileMode) file.Chmod(fileMode | os.ModeSticky) log.Println("change after, file mode:", getFileMode(file)) } func getFileMode(file *os.File) os.FileMode { fileInfo, err := file.Stat() if err != nil { log.Fatal("file stat error:", err) } return fileInfo.Mode() } // Output: // 2016/06/18 15:59:06 file mode: -rw-rw-r-- // 2016/06/18 15:59:06 change after, file mode: trw-rw-r-- // ls -l 看到的 studygolang.tx 是:-rw-rw-r-T // 当然这里是给文件设置了 sticky 位,对权限不起作用。系统会忽略它。
在 Unix 文件系统中,目录的存储方式类似于普通文件。目录和普通文件的区别有二:
硬链接是针对文件而言的,目录不允许创建硬链接。
link 和 unlink 系统调用用于创建和移除(硬)链接。Go 中 os.Link 对应 link 系统调用;但 os.Remove 的实现会先执行 unlink 系统调用,如果要移除的是目录,则 unlink 会失败,这时 Remove 会再调用 rmdir 系统调用。
link
unlink
os.Link
os.Remove
Remove
rmdir
func Link(oldname, newname string) error
Link 创建一个名为 newname 指向 oldname 的硬链接。如果出错,会返回 *LinkError 类型的错误。
Link
*LinkError
func Remove(name string) error
Remove 删除 name 指定的文件或目录。如果出错,会返回 *PathError 类型的错误。如果目录不为空,Remove 会返回失败。
系统调用 rename 既可以重命名文件,又可以将文件移至同一个文件系统中的另一个目录。该系统调用既可以用于文件,也可以用于目录。相关细节,请查阅相关资料。
rename
Go 中的 os.Rename 是对应的封装函数。
os.Rename
func Rename(oldpath, newpath string) error
Rename 修改一个文件的名字或移动一个文件。如果 newpath 已经存在,则替换它。注意,可能会有一些个操作系统特定的限制。
Rename
newpath
symlink 系统调用用于为指定路径名创建一个新的符号链接(想要移除符号链接,使用 unlink)。Go 中的 os.Symlink 是对应的封装函数。
symlink
os.Symlink
func Symlink(oldname, newname string) error
Symlink 创建一个名为 newname 指向 oldname 的符号链接。如果出错,会返回 *LinkError 类型的错误。
Symlink
newname
oldname
由 oldname 所命名的文件或目录在调用时无需存在。因为即便当时存在,也无法阻止后来将其删除。这时,newname 成为“悬空链接”,其他系统调用试图对其进行解引用操作都将错误(通常错误号是 ENOENT)。
有时候,我们希望通过符号链接,能获取其所指向的路径名。系统调用 readlink 能做到,Go 的封装函数是 os.Readlink:
readlink
os.Readlink
func Readlink(name string) (string, error)
Readlink 获取 name 指定的符号链接指向的文件的路径。如果出错,会返回 *PathError 类型的错误。我们看看 Readlink 的实现。
Readlink
func Readlink(name string) (string, error) { for len := 128; ; len *= 2 { b := make([]byte, len) n, e := fixCount(syscall.Readlink(name, b)) if e != nil { return "", &PathError{"readlink", name, e} } if n < len { return string(b[0:n]), nil } } }
这里之所以用循环,是因为我们没法知道文件的路径到底多长,如果 b 长度不够,文件名会被截断,而 readlink 系统调用无非分辨所返回的字符串到底是经过截断处理,还是恰巧将 b 填满。这里采用的验证方法是分配一个更大的(两倍)b 并再次调用 readlink。
mkdir 系统调用创建一个新目录,Go 中的 os.Mkdir 是对应的封装函数。
mkdir
os.Mkdir
func Mkdir(name string, perm FileMode) error
Mkdir 使用指定的权限和名称创建一个目录。如果出错,会返回 *PathError 类型的错误。
Mkdir
name 参数指定了新目录的路径名,可以是相对路径,也可以是绝对路径。如果已经存在,则调用失败并返回 os.ErrExist 错误。
os.ErrExist
perm 参数指定了新目录的权限。对该位掩码值的指定方式和 os.OpenFile 相同,也可以直接赋予八进制数值。注意,perm 值还将于进程掩码相与(&)。如果 perm 中设置了 sticky 位,那么将对新目录设置该权限。
os.OpenFile
因为 Mkdir 所创建的只是路径名中的最后一部分,如果父目录不存在,创建会失败。os.MkdirAll 用于递归创建所有不存在的目录。
os.MkdirAll
建议读者阅读下 os.MkdirAll 的源码,了解其实现方式、技巧。
rmdir 系统调用移除一个指定的目录,目录可以是绝对路径或相对路径。在讲解 unlink 时,已经介绍了 Go 中的 os.Remove。注意,这里要求目录必须为空。为了方便使用,Go 中封装了一个 os.RemoveAll 函数:
os.RemoveAll
func RemoveAll(path string) error
RemoveAll 删除 path 指定的文件,或目录及它包含的任何下级对象。它会尝试删除所有东西,除非遇到错误并返回。如果 path 指定的对象不存在,RemoveAll 会返回 nil 而不返回错误。
RemoveAll
path
RemoveAll 的内部实现逻辑如下:
阅读 RemoveAll 源码,可以掌握马上要介绍的读目录内容或遍历目录。
POSIX 与 SUS 定义了读取目录相关的 C 语言标准,各个操作系统提供的系统调用却不尽相同。Go 没有基于 C 语言,而是自己通过系统调用实现了读目录功能。
POSIX
SUS
func (f *File) Readdirnames(n int) (names []string, err error)
Readdirnames 读取目录 f 的内容,返回一个最多有 n 个成员的[]string,切片成员为目录中文件对象的名字,采用目录顺序。对本函数的下一次调用会返回上一次调用未读取的内容的信息。
Readdirnames
n
如果 n>0,Readdirnames 函数会返回一个最多 n 个成员的切片。这时,如果 Readdirnames 返回一个空切片,它会返回一个非 nil 的错误说明原因。如果到达了目录 f 的结尾,返回值 err 会是 io.EOF。
如果 n<=0,Readdirnames 函数返回目录中剩余所有文件对象的名字构成的切片。此时,如果 Readdirnames 调用成功(读取所有内容直到结尾),它会返回该切片和 nil 的错误值。如果在到达结尾前遇到错误,会返回之前成功读取的名字构成的切片和该错误。
func (f *File) Readdir(n int) (fi []FileInfo, err error)
Readdir 内部会调用 Readdirnames,将得到的 names 构造路径,通过 Lstat 构造出 []FileInfo。
Readdir
names
[]FileInfo
列出某个目录的文件列表示例程序见 dirtree。
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8