Android开发Android开发经验谈Android开发

Android FrameWork - 开机启动 Init 进程

2019-08-04  本文已影响73人  红橙Darren

相关文章链接:
1. Android FrameWork - 学习启动篇
2. Android FrameWork - 开机启动 Init 进程

相关源码文件:

/system/core/init/Init.cpp
/system/core/rootdir/init.rc
/system/core/init/init_parser.cpp
/system/core/init/builtins.cpp
/system/core/init/signal_handler.cpp

操作系统本身也是一个程序,只是这个程序是用来管理我们 App 应用程序的。不知大家是否了解计算机的启动过程?当然不了解也没关系这里并不影响。如果大家想要了解操作系统的基本原理,可以去听听国内外的一些公开课,推荐清华大学的《计算机操作系统》公开课。Android 系统虽然也是基于 Linux 系统的,但是由于 Android 属于移动设备,并没有像 PC 那样的 BIOS 程序。 取而代之的是 BootLoader (系统启动加载器)。 它类似于 BIOS,在系统加载前,用以初始化硬件设备,建立内存空间的映像图,为最终调用系统内核准备好环境。 在 Android 里没有硬盘,而是 ROM,它类似于硬盘存放操作系统,用户程序等。 ROM 跟硬盘一样也会划分为不同的区域,用于放置不同的程序。当 Linux 内核启动后会初始化各种软硬件环境,加载驱动程序,挂载根文件系统,Linux 内核加载的准备完毕后就开始加载一些特定的程序(进程)了。第一个加载的就是 init 进程,我们就从这里开始分析,至于之前的过程大家感兴趣可以自行研究下,作为一个 App 应用开发者不了解也没关系。

Init 进程

我们应该都知道不管是 Java 还是 C/C++ 去运行某一个程序(进程)都是 XXX.xxx 的 main 方法作为入口,相信有很多大佬都跟我一样,App 开发做久了渐渐就忘记了还有个 main 方法。因此我们找到 /system/core/init/Init.cpp 的 main() 方法:

int main(int argc, char** argv) {
    ...
    // 初始化 signal handler
    signal_handler_init();
    // 解析 init.rc 脚本文件
    init_parse_config_file("/init.rc"); 
    // 将解析脚本中对应的操作添加到 action_queue 队列中
    action_for_each_trigger("early-init", action_add_queue_tail);
    // Queue an action that waits for coldboot done so we know ueventd has set up all of /dev...
    queue_builtin_action(wait_for_coldboot_done_action, "wait_for_coldboot_done");
    // ... so that we can start queuing up actions that require stuff from /dev.
    queue_builtin_action(mix_hwrng_into_linux_rng_action, "mix_hwrng_into_linux_rng");
    queue_builtin_action(keychord_init_action, "keychord_init");
    queue_builtin_action(console_init_action, "console_init");
    
    ...
    // 这里是个死循环
    while (true) {
        if (!waiting_for_exec) {
            // 执行命令
            execute_one_command();
            restart_processes();
        }
        ...
    }
    return 0;
}

main 方法里面有 148 行代码(不包括子函数代码)具体分为四个步骤:1.创建目录,挂载分区,2.解析启动脚本,3.启动解析的服务,4.守护解析的服务。init.rc 文件是 Android 系统的重要配置文件,位于 /system/core/rootdir/init.rc

// 导入其它的一些脚本
import /init.environ.rc
import /init.usb.rc
// 当前硬件版本的脚本
import /init.${ro.hardware}.rc
import /init.${ro.zygote}.rc
import /init.trace.rc

on early-init
...
on init
...
// 服务 服务名称 执行文件路径 执行参数
// 有几个重要的服务
service zygote /system/bin/app_process64 -Xzygote /system/bin --zygote --start-system-server
service servicemanager /system/bin/servicemanager
service surfaceflinger /system/bin/surfaceflinger
service media /system/bin/mediaserver
service installd /system/bin/installd

上面主要分为有 import 导入、on 命令和 service 服务,最主要的几个服务有 zygote、servicemanager、surfaceflinger 、media 、installd (后面还会分析到),接着往下看是如何解析的:

int init_parse_config_file(const char* path) {
    INFO("Parsing %s...\n", path);
    Timer t;
    std::string data;
    if (!read_file(path, &data)) {
        return -1;
    }

    data.push_back('\n'); // TODO: fix parse_config.
    // 解析
    parse_config(path, data);
    dump_parser_state();

    NOTICE("(Parsing %s took %.2fs.)\n", path, t.duration());
    return 0;
}

static void parse_config(const char *fn, const std::string& data)
{
    struct listnode import_list;
    struct listnode *node;
    
    for (;;) {
        // next_token 内部实现是一个字符一个字符去解析
        // 0:T_EOF 文件结尾
        // \n: T_NEWLINE
        switch (next_token(&state)) {
        case T_EOF:
            // 文件结尾,跳转到 parser_done
            state.parse_line(&state, 0, 0);
            goto parser_done;
        // 如果是新的一行,就认为是一个新的命令
        case T_NEWLINE:
            state.line++;
            if (nargs) {
                // 不同的命令选择不同的结构体
                int kw = lookup_keyword(args[0]);
                if (kw_is(kw, SECTION)) {
                    // 是一个 Section
                    state.parse_line(&state, 0, 0);
                    // 解析三种 Section:parse_service、parse_action、parse_import
                    parse_new_section(&state, kw, nargs, args);
                } else {
                    // 普通命令
                    state.parse_line(&state, nargs, args);
                }
                nargs = 0;
            }
            break;
        case T_TEXT:
            if (nargs < INIT_PARSER_MAXARGS) {
                args[nargs++] = state.text;
            }
            break;
        }
    }

parser_done:
    // 循环解析 import 
    list_for_each(node, &import_list) {
         struct import *import = node_to_item(node, struct import, list);
         int ret;

         ret = init_parse_config_file(import->filename);
         if (ret)
             ERROR("could not import file '%s' from '%s'\n",
                   import->filename, fn);
    }
}

接下来看下是如何执行的,这里我们主要了解服务是如何启动的:

void execute_one_command() {
    Timer t;

    char cmd_str[256] = "";
    char name_str[256] = "";

    if (!cur_action || !cur_command || is_last_command(cur_action, cur_command)) {
        cur_action = action_remove_queue_head();
        cur_command = NULL;
        if (!cur_action) {
            return;
        }

        build_triggers_string(name_str, sizeof(name_str), cur_action);

        INFO("processing action %p (%s)\n", cur_action, name_str);
        cur_command = get_first_command(cur_action);
    } else {
        cur_command = get_next_command(cur_action, cur_command);
    }

    if (!cur_command) {
        return;
    }
    // 服务的 func 跳转到 service_for_each_class
    int result = cur_command->func(cur_command->nargs, cur_command->args);
    ...
}

int do_class_start(int nargs, char **args)
{
   /* Starting a class does not start services
   * which are explicitly disabled.  They must
   * be started individually.
   */
    service_for_each_class(args[1], service_start_if_not_disabled);
    return 0;
}

void service_for_each_class(const char *classname,void (*func)(struct service *svc))
{
    struct listnode *node;
    struct service *svc;
    list_for_each(node, &service_list) {
        svc = node_to_item(node, struct service, slist);
        // 如果名字是一致的执行 func ,这是一个回调函数也就是 service_start_if_not_disabled
        if (!strcmp(svc->classname, classname)) {
            func(svc);
        }
    }
}

static void service_start_if_not_disabled(struct service *svc)
{
    if (!(svc->flags & SVC_DISABLED)) {
        service_start(svc, NULL);
    } else {
        svc->flags |= SVC_DISABLED_START;
    }
}

void service_start(struct service *svc, const char *dynamic_args)
{
    ...
    // fork 创建了一个子进程
    pid_t pid = fork();
    if (pid == 0) {
        // 代表子进程,子进程会继承父进程的所有资源,可简单理解为读时共享写事复制
        ...
        // exc 函数族,这些都是 linux 基础知识
        execve(svc->args[0], (char**) arg_ptrs, (char**) ENV);
    }
}

最后再来看下 init 进程是如何守护子进程的:

void signal_handler_init() {
    // Create a signalling mechanism for SIGCHLD.
    int s[2];
    // 创建 socket pair 用于通信
    if (socketpair(AF_UNIX, SOCK_STREAM | SOCK_NONBLOCK | SOCK_CLOEXEC, 0, s) == -1) {
        ERROR("socketpair failed: %s\n", strerror(errno));
        exit(1);
    }
    // 当捕获信号SIGCHLD,则写入signal_write_fd
    signal_write_fd = s[0];
    signal_read_fd = s[1];

    // Write to signal_write_fd if we catch SIGCHLD.
    struct sigaction act;
    memset(&act, 0, sizeof(act));
    act.sa_handler = SIGCHLD_handler;
    act.sa_flags = SA_NOCLDSTOP;
    // SA_NOCLDSTOP 使 init 进程只有在其子进程终止时才会受到 SIGCHLD 信号
    sigaction(SIGCHLD, &act, 0);
    // 进入 waitpid 来处理子进程是否退出的情况
    reap_any_outstanding_children();
    // 调用 epoll_ctl 方法来注册 epoll 的回调函数
    register_epoll_handler(signal_read_fd, handle_signal);
}

//读取数据
static void handle_signal() {
    // Clear outstanding requests.
    char buf[32];
    // 读取 signal_read_fd 中的数据,并放入 buf,这里读出并没有什么实际作用,只是用于阻塞等待
    read(signal_read_fd, buf, sizeof(buf));
    reap_any_outstanding_children();
}

//写入数据
static void SIGCHLD_handler(int) {
    // 向signal_write_fd写入1 
    if (TEMP_FAILURE_RETRY(write(signal_write_fd, "1", 1)) == -1) {
        ERROR("write(signal_write_fd) failed: %s\n", strerror(errno));
    }
}

static void reap_any_outstanding_children() {
    while (wait_for_one_process()) { }
}

static bool wait_for_one_process() {
    int status;
    //等待任意子进程,如果子进程没有退出则返回 0,否则则返回该子进程 pid。
    pid_t pid = TEMP_FAILURE_RETRY(waitpid(-1, &status, WNOHANG));
    if (pid == 0) {
        return false;
    } else if (pid == -1) {
        return false;
    }
    //根据 pid 查找到相应的 service
    service* svc = service_find_by_pid(pid);

    //当 flags 为 RESTART,且不是 ONESHOT 时, kill 进程组内所有的子进程或子线程
    if (!(svc->flags & SVC_ONESHOT) || (svc->flags & SVC_RESTART)) {
        kill(-pid, SIGKILL);
    }

    //移除当前服务 svc 中的所有创建过的 socket
    for (socketinfo* si = svc->sockets; si; si = si->next) {
        char tmp[128];
        snprintf(tmp, sizeof(tmp), ANDROID_SOCKET_DIR"/%s", si->name);
        unlink(tmp);
    }

    //当 flags 为 EXEC 时,释放相应的服务
    if (svc->flags & SVC_EXEC) {
        waiting_for_exec = false;
        list_remove(&svc->slist);
        free(svc->name);
        free(svc);
        return true;
    }
    ...

    // 对于 ONESHOT 服务,使其进入 disabled 状态
    if ((svc->flags & SVC_ONESHOT) && !(svc->flags & SVC_RESTART)) {
        svc->flags |= SVC_DISABLED;
    }
    // 禁用和重置的服务,都不再自动重启
    if (svc->flags & (SVC_DISABLED | SVC_RESET))  {
        svc->NotifyStateChange("stopped"); //设置相应的service状态为stopped
        return true;
    }

    // 执行当前 service 中所有 onrestar t命令,这个就是重启了
    struct listnode* node;
    list_for_each(node, &svc->onrestart.commands) {
        command* cmd = node_to_item(node, struct command, clist);
        cmd->func(cmd->nargs, cmd->args);
    }
    // 设置相应的 service 状态为 restarting
    svc->NotifyStateChange("restarting");
    return true;
}

至此 init 进程已全部分析完毕,有四个步骤:1. 创建目录,挂载分区,2. 解析启动脚本,3. 启动解析的服务,4. 守护解析的服务。最需要注意的是 init 创建了 zygote(创建 App 应用的服务)、servicemanager (client 与 service 通信管理的服务)、surfaceflinger(显示渲染服务) 和 media(多媒体服务) 等 service 进程。

上一篇下一篇

猜你喜欢

热点阅读