我对fsync
+ direct IO
感到困惑。
很容易理解这样的代码:
fd = open(filename, O_RDWR, 00644);
write(fd, data, size);
fsync(fd);
在这种情况下,write()
会将数据写入页缓存,而fsync
会将fd
引用的页缓存中的所有修改数据强制到磁盘设备。
但是,如果像这样用O_DIRECT
标志打开文件,
fd = open(filename, O_RDWR|O_DIRECT, 00644);
write(fd, data, size);
fsync(fd);
在这种情况下,write()
将绕过页面缓存,直接写入磁盘设备。因此,fsync
会做什么,在fd
所引用的页面缓存中没有脏页。
如果我们打开一个原始设备,fsync
会做什么,
fd = open('/dev/sda', O_RDWR|O_DIRECT, 00644);
write(fd, data, size);
fsync(fd);
在这种情况下,我们使用O_DIRECT
打开原始设备,该设备上没有文件系统。 sync
在这里做什么?
文件系统可能根本不实现O_DIRECT
,在这种情况下它将不起作用。
如果它确实实现了O_DIRECT
,那么这仍然并不意味着它会进入磁盘,而是only means it's minimally cached by the page cache。即使在硬件缓冲区中,它仍然可以缓存在其他位置。
[fsync(2)
是内核和应用程序之间的显式contract,用于持久保存数据,以免丢失数据,并确保可用于要访问它的下一个事物。
对于设备文件,设备驱动程序是实现标志的驱动程序,包括O_DIRECT
。
Linux确实使用页面缓存缓存来缓存对块设备的访问,并且确实支持O_DIRECT
,以便在直接写入块设备时最大程度地减少缓存交互。