上一篇《python位运算(一)概述》我们简单的总结了下位运算的几个种方法和使用技巧。本篇就结合实际应用来看下。适于用什么场景?下面我用 Unix 系统的umask概念来实践下位运算。简单来讲,Unix 系统对于文件的权限用 9 个权限位来控制:
[-][rwx][r-x][r--] 1 234 567 890
- r: 可读 4
- w: 可写 2
- x: 可执行 1
- -: 表示此权限被去除
第一位是用来表示是文件还是目录,先不用管它,主要是后面 9 位。我们经常在授权是用的到644,755都是用r,w.x这三个值相加得出的。为什么值分别是4,2,1呢,我们把 go 语言sys包中的源码拿出来看看就明白了:
const ( S_IRUSR = 0x100 //用户可读 S_IWUSR = 0x80 //用户可写 S_IXUSR = 0x40 //用户可执行 S_IRGRP = 0x20 //组可读 S_IWGRP = 0x10 //组可写 S_IXGRP = 0x8 //组可执行 S_IROTH = 0x4 //其它可读 S_IWOTH = 0x2 //其它可写 S_IXOTH = 0x1 //其它可执行 )
这是 sys 包中定义的一些常量, 我们来打印下这些都是啥玩意
fmt.Printf("%9b %3d %s\n", S_IRUSR, S_IRUSR, "用户读") fmt.Printf("%9b %3d %s\n", S_IWUSR, S_IWUSR, "用户写") fmt.Printf("%9b %3d %s\n", S_IXUSR, S_IXUSR, "用户执行") fmt.Printf("%9b %3d %s\n", S_IRGRP, S_IRGRP, "组读 *") fmt.Printf("%9b %3d %s\n", S_IWGRP, S_IWGRP, "组写 *") fmt.Printf("%9b %3d %s\n", S_IXGRP, S_IXGRP, "组执行") fmt.Printf("%9b %3d %s\n", S_IROTH, S_IROTH, "其它读 *") fmt.Printf("%9b %3d %s\n", S_IWOTH, S_IWOTH, "其它写 *") fmt.Printf("%9b %3d %s\n", S_IXOTH, S_IXOTH, "其它执行") // 输出 100000000 256 用户可读 10000000 128 用户可写 1000000 64 用户可执行 100000 32 组可读 10000 16 组可写 1000 8 组可执行 100 4 其它可读 10 2 其它可写 1 1 其它可执行
看明白了吧,其实就是把九个权限位置分别标志为1,用二进制可以很清楚的表示权限位,4,2,1也就是这么来的。那么umask的就可以利用这个位运算,代码如下:
package main import ( "fmt" "golang.org/x/sys/unix" "os" ) func main() { unix.Umask(0) _, err := os.Create("foo") if err != nil { fmt.Println("Create Error") } unix.Umask(unix.S_IRGRP | unix.S_IWGRP | unix.S_IROTH | unix.S_IWOTH) _, err2 := os.Create("bar") if err2 != nil { fmt.Println("Create Error") } }
上面的代码可以看到,unix.S_IRGRP | unix.S_IWGRP | unix.S_IROTH | unix.S_IWOTH就利用了位运算,程序先后创建了两个文件foo,bar, 创建bar文件时,文件初始权限把组和其它中的可读和可写去除了,所以我们用ls -la foo bar命令可以看到输出如下:
$ ls -la foo bar -rw-------. 1 vagrant vagrant 0 Oct 02 02:54 bar -rw-rw-rw-. 1 vagrant vagrant 0 Oct 02 02:54 foo
再用 9 个权限位的二进制图说明下:
100000000 256 用户可读 10000000 128 用户可写 1000000 64 用户可执行 100000 32 组可读 * 10000 16 组可写 * 1000 8 组可执行 100 4 其它可读 * 10 2 其它可写 * 1 1 其它可执行 --------- 110110 unix.S_IRGRP | unix.S_IWGRP | unix.S_IROTH | unix.S_IWOTH
umask四个参数我用型号标出来了,那经过|位运算最终结果就是110110, 言外之意就是umask把标志为1的权限位去除了。umask使用二进制位来处理,一是节约了空间(9个字节,即两个比特位就表示了所有的权限组合)。如果给用户,组,其他各单独分权限用字符表示,至少要占用9个比特位(实际为了区分不同,可能要ur,uw,rx,gr,gw,gx,or,ow,ox这样两字节表示,实际要占用18个字节)。umask属于OS较底层的东西。在多个文件的情况,这个几位的在应用中对性能会有非常大的影响。