Linux内核中的seq操作

程序员文章站 2024-01-23 18:21:46
...
本文档的Copyleft归yfydz所有，使用GPL发布，可以*拷贝，转载，转载时请保持文档的完整性，严禁用于任何商业用途。
msn: [email protected]
来源：http://yfydz.cublog.cn
1. 前言

在fs/seq_file.c中定义了关于seq操作的一系列顺序读取的函数，这些函数最早是在2001年就引入了，但以前内核中一直用得不多，而到了2.6内核后，许多/proc的只读文件中大量使用了seq函数处理。
以下内核源码版本为2.6.17.11。

2. seq相关数据结构

2.1 seq文件结构
struct seq_file {
 char *buf;
 size_t size;
 size_t from;
 size_t count;
 loff_t index;
 loff_t version;
 struct mutex lock;
 struct seq_operations *op;
 void *private;
};

struct seq_file描述了seq处理的缓冲区及处理方法，buf是动态分配的，大小不小于PAGE_SIZE，通常这个结构是通过struct file结构中的private_data来指向的。
char *buf：seq流的缓冲区
size_t size：缓冲区大小
size_t from：from指向当前要显示的数据头位置
size_t count：缓冲区中已有的数据长度
loff_t index：数据记录索引值
loff_t version：版本号，是struct file的版本号的拷贝
struct mutex lock：seq锁
struct seq_operations *op：seq操作结构，定义数据显示的操作函数
void *private：私有数据


2.2 seq操作结构

seq的操作结构比较简单，就是4个操作函数，完成开始、停止、显示和取下一个操作：

/* include/linux/seq_file.h */
struct seq_operations {
 void * (*start) (struct seq_file *m, loff_t *pos);
 void (*stop) (struct seq_file *m, void *v);
 void * (*next) (struct seq_file *m, void *v, loff_t *pos);
 int (*show) (struct seq_file *m, void *v);
};


3. seq操作函数

seq操作包括以下一系列函数：
int seq_open(struct file *, struct seq_operations *);
打开seq流，为struct file分配struct seq_file结构，并定义seq_file的操作；

ssize_t seq_read(struct file *, char __user *, size_t, loff_t *);
从seq流中读数据到用户空间，其中循环调用了struct seq_file中的各个函数来读数据；
ssize_t seq_read(struct file *file, char __user *buf, size_t size, loff_t *ppos)
{
 struct seq_file *m = (struct seq_file *)file->private_data;
 size_t copied = 0;
 loff_t pos;
 size_t n;
 void *p;
 int err = 0;
// 先加锁
 mutex_lock(&m->lock);
 /*
  * seq_file->op->..m_start/m_stop/m_next may do special actions
  * or optimisations based on the file->f_version, so we want to
  * pass the file->f_version to those methods.
  *
  * seq_file->version is just copy of f_version, and seq_file
  * methods can treat it simply as file version.
  * It is copied in first and copied out after all operations.
  * It is convenient to have it as  part of structure to avoid the
  * need of passing another argument to all the seq_file methods.
  */
 m->version = file->f_version;
 /* grab buffer if we didn't have one */
// 如果struct seq_file结构中的缓冲区没有分配的话，
// 分配缓冲，大小为PAGE_SIZE
 if (!m->buf) {
  m->buf = kmalloc(m->size = PAGE_SIZE, GFP_KERNEL);
  if (!m->buf)
   goto Enomem;
 }
 /* if not empty - flush it first */
// count表示当时有多少数据还没有传给用户空间
// 尽量先将这些数据传出
 if (m->count) {
  n = min(m->count, size);
  err = copy_to_user(buf, m->buf + m->from, n);
  if (err)
   goto Efault;
  m->count -= n;
  m->from += n;
  size -= n;
  buf += n;
  copied += n;
  if (!m->count)
   m->index++;
  if (!size)
   goto Done;
 }
// 进行主要传数据过程，缓冲区中至少要有一个记录单位的数据
 /* we need at least one record in buffer */
 while (1) {
// 数据记录的位置
  pos = m->index;
// 初始化操作，返回值为对象相关指针
  p = m->op->start(m, &pos);
  err = PTR_ERR(p);
  if (!p || IS_ERR(p))
   break;
// 执行具体的显示过程
  err = m->op->show(m, p);
  if (err)
   break;
// 当前缓冲区中的实际数据小于缓冲区大小，转到填数据部分
  if (m->count < m->size)
   goto Fill;
// 否则说明一个记录的数据量太大，原来缓冲区大小不够；
// 先停操作，重新分配缓冲区，大小增加一倍，重新操作,
// 要保证缓冲区大小大于一个数据记录的大小
  m->op->stop(m, p);
  kfree(m->buf);
  m->buf = kmalloc(m->size <<= 1, GFP_KERNEL);
  if (!m->buf)
   goto Enomem;
  m->count = 0;
  m->version = 0;
 }
 m->op->stop(m, p);
 m->count = 0;
 goto Done;
Fill:
// 继续读数据到缓冲区
 /* they want more? let's try to get some more */
 while (m->count < size) {
  size_t offs = m->count;
  loff_t next = pos;
  p = m->op->next(m, p, &next);
  if (!p || IS_ERR(p)) {
   err = PTR_ERR(p);
   break;
  }
  err = m->op->show(m, p);
  if (err || m->count == m->size) {
   m->count = offs;
   break;
  }
  pos = next;
 }
// 停seq
 m->op->stop(m, p);
 n = min(m->count, size);
// 将数据拷贝到用户空间
 err = copy_to_user(buf, m->buf, n);
 if (err)
  goto Efault;
 copied += n;
 m->count -= n;
 if (m->count)
  m->from = n;
 else
  pos++;
 m->index = pos;
Done:
 if (!copied)
  copied = err;
 else
  *ppos += copied;
 file->f_version = m->version;
 mutex_unlock(&m->lock);
 return copied;
Enomem:
 err = -ENOMEM;
 goto Done;
Efault:
 err = -EFAULT;
 goto Done;
}

loff_t seq_lseek(struct file *, loff_t, int);
定位seq流当前指针偏移；
int seq_release(struct inode *, struct file *);
释放seq流所分配的动态内存空间，即struct seq_file的buf及其本身；

int seq_escape(struct seq_file *, const char *, const char *);
将seq流中需要进行转义的字符转换为8进制数字；

int seq_putc(struct seq_file *m, char c);
向seq流中写一个字符

int seq_puts(struct seq_file *m, const char *s);
向seq流中写一个字符串

int seq_printf(struct seq_file *, const char *, ...)
 __attribute__ ((format (printf,2,3)));
向seq流方式写格式化信息；

int seq_path(struct seq_file *, struct vfsmount *, struct dentry *, char *);
在seq流中添加路径信息，路径字符都转换为8进制数。

int seq_release_private(struct inode *, struct file *);
释放seq_file的private然后进行seq_release

3. 用seq流填写/proc文件

以下使用文件/proc/net/ip_conntrack的生成代码来说明seq流的使用：

3.1 创立文件
以前2.4版本中使用proc_net_create()来建立/proc/net下的文件，现在使用seq流时要使用 proc_net_fops_create()函数来创建，区别在于函数的最后一个参数，proc_net_create()的是一个函数指针，而 proc_net_fops_create()的是一个文件操作指针：
......
 proc = proc_net_fops_create("ip_conntrack", 0440, &ct_file_ops);
......

proc_net_fops_create()函数其实也很简单，调用create_proc_entry()函数建立/proc文件项，然后将文件项的操作结构指针指向所提供的文件操作指针：
static inline struct proc_dir_entry *proc_net_fops_create(const char *name,
 mode_t mode, const struct file_operations *fops)
{
 struct proc_dir_entry *res = create_proc_entry(name, mode, proc_net);
 if (res)
  res->proc_fops = fops;
 return res;
}

3.2 文件操作结构
/proc/net/ip_conntrack所用的文件结构如下：
static struct file_operations ct_file_ops = {
 .owner   = THIS_MODULE,
 .open    = ct_open,
 .read    = seq_read,
 .llseek  = seq_lseek,
 .release = seq_release_private,
};
可见，结构中除了open()函数是需要自定义外，其他的读、定位、释放函数都可以用seq标准函数。

3.3 open函数定义
open函数主要就是调用seq_open()函数将一个struct seq_operations结构和struct file链接起来，如果需要有私有数据的话，需要分配出动态空间作为struct seq_file的私有数据：
static int ct_open(struct inode *inode, struct file *file)
{
 struct seq_file *seq;
 struct ct_iter_state *st;
 int ret;
 st = kmalloc(sizeof(struct ct_iter_state), GFP_KERNEL);
 if (st == NULL)
  return -ENOMEM;
 ret = seq_open(file, &ct_seq_ops);
 if (ret)
  goto out_free;
 seq          = file->private_data;
 seq->private = st;
 memset(st, 0, sizeof(struct ct_iter_state));
 return ret;
out_free:
 kfree(st);
 return ret;
}
简单的如exp_open()函数，就只调用seq_open()函数就完了：
static int exp_open(struct inode *inode, struct file *file)
{
 return seq_open(file, &exp_seq_ops);
}

3.4 seq操作结构

static struct seq_operations ct_seq_ops = {
 .start = ct_seq_start,
 .next  = ct_seq_next,
 .stop  = ct_seq_stop,
 .show  = ct_seq_show
};
这个结构就是填写4个操作函数：

start()函数完成读数据前的一些预先操作，通常如加锁，定位数据记录位置等，该函数返回值就是show()函数第二个参数：
static void *ct_seq_start(struct seq_file *seq, loff_t *pos)
{
 read_lock_bh(&ip_conntrack_lock);
 return ct_get_idx(seq, *pos);
}

stop()函数完成读数据后的一些恢复操作，如解锁等：
static void ct_seq_stop(struct seq_file *s, void *v)
{
 read_unlock_bh(&ip_conntrack_lock);
}

next()函数定位数据下一项：
static void *ct_seq_next(struct seq_file *s, void *v, loff_t *pos)
{
 (*pos)++;
 return ct_get_next(s, v);
}

show()函数实现读数据过程，将要输出的数据直接用seq_printf()函数打印到seq流缓冲区中，由seq_printf()函数输出到用户空间：
static int ct_seq_show(struct seq_file *s, void *v)
{
// start()虽然返回的是struct list_head的指针，
// 但struct ip_conntrack_tuple_hash结构的第一
// 项参数就是struct list_head，所以可以进行直接
// 类型转换而不用再计算偏移量
 const struct ip_conntrack_tuple_hash *hash = v;
 const struct ip_conntrack *conntrack = tuplehash_to_ctrack(hash);
 struct ip_conntrack_protocol *proto;
 ASSERT_READ_LOCK(&ip_conntrack_lock);
 IP_NF_ASSERT(conntrack);
 /* we only want to print DIR_ORIGINAL */
 if (DIRECTION(hash))
  return 0;
 proto = __ip_conntrack_proto_find(conntrack->tuplehash[IP_CT_DIR_ORIGINAL].tuple.dst.protonum);
 IP_NF_ASSERT(proto);
// 以下打印连接和协议信息
 if (seq_printf(s, "%-8s %u %ld ",
        proto->name,
        conntrack->tuplehash[IP_CT_DIR_ORIGINAL].tuple.dst.protonum,
        timer_pending(&conntrack->timeout)
        ? (long)(conntrack->timeout.expires - jiffies)/HZ
        : 0) != 0)
  return -ENOSPC;
......
 if (seq_printf(s, "use=%u\n", atomic_read(&conntrack->ct_general.use)))
  return -ENOSPC;
 return 0;
}

4. 结论

seq流函数的使用保证了数据能顺序输出，这也就是/proc只读文件中使用它的最大原因吧。

发表于： 2006-09-18，修改于： 2006-09-18 08:53，已浏览4739次，有评论3条 推荐 投诉
	网友： s_x_g 	时间：2008-06-11 15:10:50 IP地址：221.239.61.★


seq file 可以统一proc的输出方式，让proc更容易使用；

seq file 可以输出任意大小的文件，不必受限于proc的单页限制和复杂处理。

这两个应该是最大原因哦。


	网友： 本站网友 	时间：2009-06-15 17:48:40 IP地址：202.111.2.★


多谢LZ的资料

此处内核源码我也看到

不过仍有写不明白的地方，

一下是我的设想：（假设我想看/proc/diskstats目录）

当我输入cat /proc/diskstats 后，会获取到/proc/diskstats这个目录并调用相应于diskstats的seq_open()方法，然后是seq_read()中引用到的：

p = m->op->start(m, &pos); 和

m->op->show(m, p);

即start和show方法 将seq流中的数据show到stdout上，实现查看数据的目的。


那我现在的问题是，cat /proc/diskstats   enter 后 是做了什么工作才调用到内核中的seq_open（）方法的呢？ 

我知道在init的main.c中的start_kernel（）方法中会使用create_proc_entry （）初始化这些虚拟目录

但是 不知道cat /proc/diskstats   之后 是调用怎样的功能（shell脚本吗？）？ 此功能又是怎么样和内核联系上的呢？


如果LZ晓得  希望指教指教  不胜感激！！


	网友： 本站网友 	时间：2009-10-16 10:04:43 IP地址：124.207.141.★


cat程序内部会有针对文件/proc/diskstats的read系统调用，

由于文件是proc文件，最终会调用proc_file_read(fs/generic.c)，

再由于create_proc的时候指定了file_ops::read函数为seq_read，

因此会通过seq_read来调用seq->start/next/show/stop
上一篇： JAVA学习笔记-----设计模式之工厂模式
下一篇： Linux中的time命令的用法
Linux内核中的seq操作

Linux内核中的seq操作

Linux中的time命令的用法

详解Linux 操作系统下安装rpm包的方法步骤

Linux 中fork的执行的实例详解

编译Linux源码树中的dtc(设备树编译器)

Linux内核的Container_of机制

linux源码中的二分法：lib/bsearch.c

linux内核中send与recv函数详解

linux内核 hash表的基本使用

Linux内核中内存cache的实现