一个 fork 的面试题
openkk 12年前
<p>前两天有人问了个关于Unix的fork()系统调用的面试题,这个题正好是我大约十年前找工作时某公司问我的一个题,我觉得比较有趣,写篇文章与大家分享一下。这个题是这样的:</p> <p><strong>题目:请问下面的程序一共输出多少个“-”?</strong></p> <div> <div class="syntaxhighlighter cpp"></div> </div> <p></p> <pre class="brush:cpp; toolbar: true; auto-links: false;">#include <stdio.h> #include <sys types.h=""> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); printf("-"); } return 0; } </unistd.h> </sys> </stdio.h></pre> <p></p> <p>如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-”,但是,实际上这个程序会很tricky地输出8个“-”。</p> <p>要讲清这个题,我们首先需要知道fork()系统调用的特性,</p> <p></p> <ul> <li>fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。</li> </ul> <ul> <li>还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。</li> </ul> <p>所以,上面的那个程序为什么会输入8个“-”,这是因为printf(“-”);语句,我们知道,Unix下的设备有“<a href="/misc/goto?guid=4958521606785031853" rel="nofollow" target="_blank">块设备</a>”和“<a href="/misc/goto?guid=4958521606893403767" rel="nofollow" target="_blank">字符设备</a>”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存、显示器都是块设备,字符设备如键盘和串口。<strong>块设备一般都有缓存,而字符设备一般都没有缓存</strong>。</p> <p>所以,对于上述程序,printf(“-”);把“-”放到了缓存中,并没有真正的输出(参看《<a href="/misc/goto?guid=4958197012092950411" rel="nofollow" target="_blank">C语言的迷题</a>》中的第一题),<strong>在fork的时候,缓存被复制到了子进程空间</strong>,所以,就多了两个,就成了8个,而不是6个。</p> <p>我们如果修改一下上面的printf的那条语句为:</p> <p></p> <pre class="brush:cpp; toolbar: true; auto-links: false;">printf("-\n");</pre> <p></p> <p>或是</p> <p></p> <pre class="brush:cpp; toolbar: true; auto-links: false;">printf("-"); flush();</pre> <p></p> <div> <div class="syntaxhighlighter cpp"></div> </div> <p>就没有问题了,因为程序遇到“\n”或是EOF,或是缓中区满,或是文件描述符关闭,或是主动flush,就会把数据刷出缓冲区。</p> <p>我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:</p> <p></p> <pre class="brush:cpp; toolbar: true; auto-links: false;">#include <stdio.h> #include <sys types.h=""> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); //注意:下面的printf有“\n” printf("ppid=%d, pid=%d, i=%d \n", getppid(), getpid(), i); } sleep(10); //让进程停留十秒,这样我们可以用pstree查看一下进程树 return 0; } </unistd.h> </sys> </stdio.h></pre> <p></p> <div> <div class="syntaxhighlighter cpp"></div> </div> <p>于是,上面这段程序会输出下面的结果,(注:编译出的可执行的程序名为fork)</p> <p></p> <pre class="brush:shell; toolbar: true; auto-links: false;">ppid=8858, pid=8518, i=0 ppid=8858, pid=8518, i=1 ppid=8518, pid=8519, i=0 ppid=8518, pid=8519, i=1 ppid=8518, pid=8520, i=1 ppid=8519, pid=8521, i=1 $ pstree -p | grep fork |-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521) | | `-fork(8520)</pre> <p></p> <div> <div class="syntaxhighlighter bash"></div> </div> <p>面对这样的图你可能还是看不懂,没事,我好事做到底,画个图给你看看:</p> <p><img title="fork 程序调用图" alt="一个 fork 的面试题" src="https://simg.open-open.com/show/7873fad902d34e8736de97573d9cc97a.jpg" width="560" height="367" /></p> <p>注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)</p> <p><img title="fork进程树" alt="一个 fork 的面试题" src="https://simg.open-open.com/show/249f746c03f7c3e6dc8da208b2656287.jpg" width="437" height="97" /></p> <p>这样,对于printf(“-”);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)</p> <p><img title="fork程序执行图" alt="一个 fork 的面试题" src="https://simg.open-open.com/show/07222ca5cc4c403bb7f823c9a472ea07.jpg" width="569" height="377" /></p> <p>现在你明白了吧。(另,对于图中的我本人拙劣的配色,请见谅!)</p> <p>(全文完)</p> <div> <p><strong>文章来源:<a href="/misc/goto?guid=4958185560036269721" rel="nofollow">酷壳 – CoolShell.cn</a> </strong></p> </div>