Python的读/写/查找操作

2024-06-01 00:15:17 发布

您现在位置:Python中文网/ 问答频道 /正文

在Linux系统上创建字符设备时,我使用Python及其基本文件操作与它进行交互。在

在经历了几次崩溃之后,我开始打印调试消息并注意到一个奇怪的行为:Python似乎以一种奇怪的方式“优化”文件操作。在

让我们看一个例子;下面是一个交互的基本代码和输出:

内核模块

// Several includes and kernel module initialization

static ssize_t dev_read(struct file *filep, char *buffer, size_t len, long long *offset){
    printk(KERN_INFO "[DEBUGGER] - dev_read with len: %d, offset: 0x%llx.\n", len, offset[0]);
    return len;
}

static ssize_t dev_write(struct file *filep, const char *buffer, size_t len, long long *offset){
    printk(KERN_INFO "[DEBUGGER] - dev_write with len: %d, offset: 0x%llx.\n", len, offset[0]);
    return len;
}

static long long dev_llseek(struct file *filep, long long offset, int orig){
    printk(KERN_INFO "[DEBUGGER] - dev_llseek with offset: 0x%llx, orig: %d\n", offset, orig);
    return offset;
}

static int dev_release(struct inode *inodep, struct file *filep){
    return 0; // Success
}

static int dev_open(struct inode *inodep, struct file *filep){
    return 0; // Success
}

static struct file_operations fops =
{
   .open = dev_open,
   .read = dev_read,
   .write = dev_write,
   .release = dev_release,
   .llseek = dev_llseek,
};

int init_module(void){
   // Code to create character device
   return 0;
}

void cleanup_module(void){
   // Code to delete character device
}

Python

^{pr2}$

输出

# seek(1)
[DEBUGGER] - dev_llseek with offset: 0x0, orig: 0
[DEBUGGER] - dev_read with len: 1, offset: 0x0.
[DEBUGGER] - dev_llseek with offset: 0x1, orig: 0
# read(4)
[DEBUGGER] - dev_read with len: 4, offset: 0x0.
# seek(0x7f123456)
[DEBUGGER] - dev_llseek with offset: 0x7f123000, orig: 0
[DEBUGGER] - dev_read with len: 1110, offset: 0x0.
# read(20)
[DEBUGGER] - dev_read with len: 4096, offset: 0x0.
# write("\xff" * 4)
[DEBUGGER] - dev_write with len: 4, offset: 0x0.

很明显,基本的文件操作不会直接转换为文件上的相同操作,最明显的例子是,查找0x7f123000而不是0x7f123456,读取4096个字节,而只请求读取20个字节。在

这就提出了以下问题:

  • 为什么这是一个功能?在
  • 它实现了什么样的优化,因为大部分看起来不像是一个好的“下一步操作”预测?在
  • 它是否记录在任何地方,以了解在预先编程读/写功能时需要什么?在
  • 除了对这一领域的纯粹兴趣之外,我仍然希望使用Python以便于访问-那么有没有什么方法可以禁用这种优化,并强制Python像C代码一样执行这些操作呢?在

谢谢!在


Tags: devreadlenreturnwithstaticdebuggerstruct
2条回答

Python的文件对象实际上是FILE*对象的包装器(在C语言中),因此它们是缓冲流。由于缓冲,Python对file的操作不会将它们转换为具有相同参数的系统调用,而是尝试优化请求时间(对于当前和未来的操作)。在

方法open()accepts缓冲参数作为3d参数。传递0应该会禁用缓冲,因此python会将所有文件请求直接转换到底层系统:

open("/dev/chardevice", "r+b", 0)

我不确定这是怎么回事,但我认为这与读取一个字节的时间损失和读取整个扇区的时间损失有关,所以为什么不总是从磁盘读取整个扇区(或者你甚至不能要求从底层系统读取小于扇区大小的字节)

相关问题 更多 >