欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

[apue] getopt 可能重排参数

程序员文章站 2022-07-06 10:13:09
看第21章时,介绍到了解析命令行的神器 getopt,了解了 linux 下处理通用命令行的方法。 命令行可分为参数与选项,其中不带 - 或 -- 前缀的为参数,对一个命令而言数量是固定的,多个参数之间的顺序也是固定的(不然命令没法区分);而选项就是带 - 或 -- 前缀的,可有可没有的,由用户的输 ......

看第21章时,介绍到了解析命令行的神器 getopt,了解了 linux 下处理通用命令行的方法。

命令行可分为参数与选项,其中不带 - 或 -- 前缀的为参数,对一个命令而言数量是固定的,多个参数之间的顺序也是固定的(不然命令没法区分);而选项就是带 - 或 -- 前缀的,可有可没有的,由用户的输入决定,另外选项也可以有自己的跟随参数,它们之间是没有顺序的。比如说:

> wget -c http://strawberryperl.com/download/5.30.2.1/strawberry-perl-5.30.2.1-32bit.msi

 

这个 wget 命令行有两个输入,一个是选项 -c,表示断点续传;一个是参数 url,就是后面这一串下载的地址。

当然这只是一个简单的例子,并没有多个参数,也没有多个选项,选项也没有带自己的参数。后面我们会自己做一个复杂的例子,来做验证。

 

回到 getopt,它的作用就是简化对这些输入的处理。

如何简化呢,就是通过定义一个可接受的选项“模板”,然后通过不停调用 getopt 来将所有选项解析出来,

最后剩下的就是不能被识别的参数了,但是这种场景就简单了,只需按顺序处理它们即可。

下面是一个用来作验证的例子:

 

 1 #include "../apue.h"
 2 int main (int argc, char *argv[])
 3 {
 4     int c, i; 
 5     char fmt[1024] = { 0 }; 
 6     char *abc = "abcdefghijklmnopqrtsuvwxyz"; 
 7     char *abc = "a:b:c:d:e:f:g:h:i:j:k:l:m:n:o:p:q:r:s:t:u:v:w:x:y:z:"; 
 8     strcat (fmt, abc); 
 9     strcat (fmt, abc); 
10     while ((c = getopt (argc, argv, fmt)) != -1) {
11         printf ("got option [%d]: '%c' ('%c')", optind, c, optopt); 
12         if (optarg)
13             printf (" arg: '%s'", optarg); 
14 
15         printf ("\n"); 
16     }
17 
18     printf ("end up at %d\n", optind); 
19     if (optind < argc)
20         printf ("some argument left, from %s\n", argv[optind]); 
21     exit (1); 
22 }

 

这个例子比较“贪心”,定义了所有的字母做选项,其中小写字母不带参数,大写字母均带参数。最后打印解析不了的参数。

它可以用来验证 getopt 有没有正确的执行:

$ ./getopt -a -b -c -a 1 -b 2 -c 3 admin 123qwe
got option [2]: 'a' ('')
got option [3]: 'b' ('')
got option [4]: 'c' ('')
got option [6]: 'a' ('') arg: '1'
got option [8]: 'b' ('') arg: '2'
got option [10]: 'c' ('') arg: '3'
end up at 10
some argument left, from admin

 

打印了一些 getopt 相关设施 (optind/optarg/optopt) 的返回值,以便可以观察它们随着选项解析后的变化。

其中中括号中的是 optind 代表的值,表示下一个输入在 argv 中的位置。

当所有选项解析完成后,这个位置将被更新到结尾或第一个参数的位置(如果有)。

 

我一直有个疑问,如果当参数夹杂在选项中时,这个位置是定位到哪里呢?

如果定位到那个参数的位置,那么应用在向后遍历剩余参数时,岂不是会遍历到已经解析的选项?

如果不是,那岂不是漏掉了一个参数?

 

于是我用这个小程序做了个测试,就像这样:

$ ./getopt -a -b admin -c -a 1 -b 2 123qwe -c 3
got option [2]: 'a' ('')
got option [3]: 'b' ('')
got option [5]: 'c' ('')
got option [7]: 'a' ('') arg: '1'
got option [9]: 'b' ('') arg: '2'
got option [12]: 'c' ('') arg: '3'
end up at 10
some argument left, from admin

 

这次我把用户名参数放在了 -b 与 -c 之间,把密码参数放在了 -b 与 -c 之间。

可以看到,各个选项都解析出来了,没有漏掉;而参数貌似也是正确的。

等等,这个optind显示位置是 argv[10],也就是说 admin 位于 argv[10],但是明明它是 argv[3] 啊!

而且解析完 -c 时 optind 已经到了 12 就是结尾了,怎么最后又倒回去了?

 

为了解释这种种谜团,在解析完成后加入以下两句代码,打印解析后的命令行:

1     for (i = 0; i<argc; ++ i)
2         printf ("%s  ", argv[i]); 
3 
4     printf ("\n"); 

 

新的程序执行输出如下:

$ ./getopt -a -b admin -c -a 1 -b 2 123qwe -c 3
got option [2]: 'a' ('')
got option [3]: 'b' ('')
got option [5]: 'c' ('')
got option [7]: 'a' ('') arg: '1'
got option [9]: 'b' ('') arg: '2'
got option [12]: 'c' ('') arg: '3'
end up at 10
./getopt  -a  -b  -c  -a  1  -b  2  -c  3  admin  123qwe  
some argument left, from admin

 

原来是命令行参数顺序被重新排列了。

所有选项经过解析后排在了参数之前,而参数保持输入时的顺序被排列在选项后面。

这样通过 optind 进行遍历,就会得到原顺序的参数输入,perfect !

 

通过 man 3 getopt 也发现了这样描述:

       by  default, getopt() permutes the contents of argv as it scans, so that eventually
       all the non-options are at the end. 

 

其它的谜团也迎刃而解。

其实回过头来想,这种 permute argv 参数的成本几乎没有,就是移动几个指针的指向而已,可以说用最小的代价完成了最大的收益。

当然了,getopt 也不是万能的,例如在选项中有重复的输入时,就需要你来处理它们了(不做特别处理的话是后面的选项覆盖前面的)。