android启动--深入理解init进程

jopen 13年前

init是一个进程，它是linux系统中用户空间的第一个进程，其进程PID是1，父进程为linux
系统内核的0号进程。所以其被赋予很多极其重要的职责,linux内核初始化完成后就开始执行它。

代码路径：\system\core\init\init.c

下面就分析一下先吧，只分析重点的函数功能：
int main(int argc, char **argv)
{
   // 1、设置子进程退出的信号处理函数：sigchld_handler
   act.sa_handler = sigchld_handler;
   act.sa_flags = SA_NOCLDSTOP;
   act.sa_mask = 0;
   act.sa_restorer = NULL;
   sigaction(SIGCHLD, &act, 0);

   // 2、创建文件夹，并挂载设备
   mkdir("/dev", 0755);
   mkdir("/proc", 0755);
   ....

   // 3、重定向标准输入输出错误到 /dev/null
   open_devnull_stdio();

   // 4、解析 init.rc 脚本
   parse_config_file("/init.rc");

// 5、解析机器相关的配置文件，一般相关的放在init.rc中利用service action调过去
snprintf(tmp, sizeof(tmp), "/init.%s.rc", hardware);
   parse_config_file(tmp);

// 6、建立 uevent,用于与linux kernel交互的socket
device_fd = device_init();

// 7、初始化及加载属性相关资源，这里利用ashmem共享，属于整个系统的资源
property_init();

// 8、执行 on init 、early-boot 及 boot 片段动作,这些定义于 init.rc 中
   / execute all the boot actions to get us started /
   action_for_each_trigger("init", action_add_queue_tail);
   drain_action_queue();

   / execute all the boot actions to get us started /
   action_for_each_trigger("early-boot", action_add_queue_tail);
   action_for_each_trigger("boot", action_add_queue_tail);

   // 9、这里定义的init进程需要关注的四个方面事情
ufds[0].fd = device_fd;
   ufds[0].events = POLLIN; // Uevent事件
   ufds[1].fd = property_set_fd;
   ufds[1].events = POLLIN; // 属性事件
   ufds[2].fd = signal_recv_fd;
   ufds[2].events = POLLIN; // 子进程事件
   fd_count = 3;

   ufds[3].fd = keychord_fd;
   ufds[3].events = POLLIN; // keychord热键事件
   fd_count++;

// ok, 下面就是init进程的处理循环
for(;;) {
// I、执行init.rc 脚本中的动作
   drain_action_queue();

   // II、执行标志为SVC_RESTARTING的进程，利用fork+execve启动新的进程
   restart_processes();

// III、调用poll轮询上述的四个事件
   nr = poll(ufds, fd_count, timeout);
   if (nr <= 0)
   continue;

// IV、依次处理各个事件
   if (ufds[2].revents == POLLIN) {
   / we got a SIGCHLD - reap and restart as needed /
   read(signal_recv_fd, tmp, sizeof(tmp));
   while (!wait_for_one_process(0))
   ;
   continue;
   }

   if (ufds[0].revents == POLLIN)
   handle_device_fd(device_fd);

   if (ufds[1].revents == POLLIN)
   handle_property_set_fd(property_set_fd);
   if (ufds[3].revents == POLLIN)
   handle_keychord(keychord_fd);
...
}

return 0;
}

这里我们重点关注一下service的解析过程：

这里以启动 zygote 为例讲解一下：
service zygote /system/bin/app_process -Xzygote /system/bin --zygote --start-system-server
   socket zygote stream 666 //创建一个stream流式套接字
   onrestart write /sys/android_power/request_state wake
   onrestart write /sys/power/state on
   onrestart restart media

服务名称： zygote
进程路径： /system/bin/app_process
进程启动参数：-Xzygote /system/bin --zygote --start-system-server

解析入口函数：parse_new_section

void parse_new_section(struct parse_state state, int kw,
   int nargs, char **args)
{
   switch(kw) {
   case K_service:
   state->context = parse_service(state, nargs, args);
   if (state->context) {
   state->parse_line = parse_line_service;
   return;
   }
   break;
...
}

--> 其中所有的解析的service放在如下双链表结构中
struct service {
   / list of all services /
   struct listnode slist;

   const char name;
   const char classname; //所属class名字，默认为"default"

   unsigned flags;
   pid_t pid;

   struct socketinfo sockets;
   struct svcenvinfo envvars;

   struct action onrestart; / Actions to execute on restart. /
   ...
};

static void parse_service(struct parse_state state, int nargs, char **args)
{
   struct service svc;

   svc = service_find_by_name(args[1]);

   svc->name = args[1];
   svc->classname = "default";
   memcpy(svc->args, args + 2, sizeof(char) nargs);
   svc->args[nargs] = 0;
   svc->nargs = nargs;
   svc->onrestart.name = "onrestart";
   list_init(&svc->onrestart.commands);

   // 加入到全局 service_list 链表中
   list_add_tail(&service_list, &svc->slist);
   return svc;
}

然后执行点都使用 list_for_each(node, &service_list) 循环遍历所有服务及执行动作

service 启动：

在解析 init.rc 脚本中
class_start default
这个class_start 是一个COMMAND,其对应的函数是 do_class_start ,注意类似的COMMAND也一样
加上前缀 do_xxx 即函数名称： ex: mount 对应于 do_mount
代码：/system/core/init/builtins.c

do_class_start()
-->service_start_if_not_disabled()
--> service_start(svc, NULL);

void service_start(struct service svc, const char dynamic_args)
{
   // 已经运行则直接返回
   if (svc->flags & SVC_RUNNING) {
   return;
   }

   NOTICE("starting '%s'\n", svc->name);
   pid = fork(); //创建子进程
   if(pid == 0){
   // 运行于子进程中

   // 准备好执行环境
   add_environment(ei->name, ei->value);
   create_socket(si->name,
   !strcmp(si->type, "dgram") ?
   SOCK_DGRAM : SOCK_STREAM,
   si->perm, si->uid, si->gid);

   // 开始执行具体的进程
   execve(svc->args[0], (char) arg_ptrs, (char) ENV);
   }

   svc->time_started = gettime();
   svc->pid = pid;
   svc->flags |= SVC_RUNNING;

   notify_service_state(svc->name, "running");
}

onrestart 用于重启使用，这就是最开始那个 sigchld_handler 函数：

static void sigchld_handler(int s)
{
   write(signal_fd, &s, 1); // 写数据
}

读取数据处理：
在 init 进程的main函数中处理:
   if (ufds[2].revents == POLLIN) {
   / we got a SIGCHLD - reap and restart as needed /
   read(signal_recv_fd, tmp, sizeof(tmp));
   while (!wait_for_one_process(0))
   ;
   continue;
   }

-->
static int wait_for_one_process(int block)
{
   while ( (pid = waitpid(-1, &status, block ? 0 : WNOHANG)) == -1 && errno == EINTR );

// 如果zygote 死则整个系统崩溃
   if (!(svc->flags & SVC_ONESHOT)) {
   kill(-pid, SIGKILL);
   NOTICE("process '%s' killing any children in process group\n", svc->name);
   }

//超时及重启次数系统重启进入recovery模式
   if (svc->flags & SVC_CRITICAL) {
   if (svc->time_crashed + CRITICAL_CRASH_WINDOW >= now) {
   if (++svc->nr_crashed > CRITICAL_CRASH_THRESHOLD) {
   ERROR("critical process '%s' exited %d times in %d minutes; "
   "rebooting into recovery mode\n", svc->name,
   CRITICAL_CRASH_THRESHOLD, CRITICAL_CRASH_WINDOW / 60);
   sync();
   __reboot(LINUX_REBOOT_MAGIC1, LINUX_REBOOT_MAGIC2,
   LINUX_REBOOT_CMD_RESTART2, "recovery");
   return 0;
   }
   }
...
</span>

}

android启动--深入理解init进程

相关经验

目录