Android FrameWork - 开机启动 Init 进程
相关文章链接:
1. Android FrameWork - 学习启动篇
2. Android FrameWork - 开机启动 Init 进程
相关源码文件:
/system/core/init/Init.cpp
/system/core/rootdir/init.rc
/system/core/init/init_parser.cpp
/system/core/init/builtins.cpp
/system/core/init/signal_handler.cpp
操作系统本身也是一个程序,只是这个程序是用来管理我们 App 应用程序的。不知大家是否了解计算机的启动过程?当然不了解也没关系这里并不影响。如果大家想要了解操作系统的基本原理,可以去听听国内外的一些公开课,推荐清华大学的《计算机操作系统》公开课。Android 系统虽然也是基于 Linux 系统的,但是由于 Android 属于移动设备,并没有像 PC 那样的 BIOS 程序。 取而代之的是 BootLoader (系统启动加载器)。 它类似于 BIOS,在系统加载前,用以初始化硬件设备,建立内存空间的映像图,为最终调用系统内核准备好环境。 在 Android 里没有硬盘,而是 ROM,它类似于硬盘存放操作系统,用户程序等。 ROM 跟硬盘一样也会划分为不同的区域,用于放置不同的程序。当 Linux 内核启动后会初始化各种软硬件环境,加载驱动程序,挂载根文件系统,Linux 内核加载的准备完毕后就开始加载一些特定的程序(进程)了。第一个加载的就是 init 进程,我们就从这里开始分析,至于之前的过程大家感兴趣可以自行研究下,作为一个 App 应用开发者不了解也没关系。
Init 进程
我们应该都知道不管是 Java 还是 C/C++ 去运行某一个程序(进程)都是 XXX.xxx 的 main 方法作为入口,相信有很多大佬都跟我一样,App 开发做久了渐渐就忘记了还有个 main 方法。因此我们找到 /system/core/init/Init.cpp 的 main() 方法:
int main(int argc, char** argv) {
...
// 初始化 signal handler
signal_handler_init();
// 解析 init.rc 脚本文件
init_parse_config_file("/init.rc");
// 将解析脚本中对应的操作添加到 action_queue 队列中
action_for_each_trigger("early-init", action_add_queue_tail);
// Queue an action that waits for coldboot done so we know ueventd has set up all of /dev...
queue_builtin_action(wait_for_coldboot_done_action, "wait_for_coldboot_done");
// ... so that we can start queuing up actions that require stuff from /dev.
queue_builtin_action(mix_hwrng_into_linux_rng_action, "mix_hwrng_into_linux_rng");
queue_builtin_action(keychord_init_action, "keychord_init");
queue_builtin_action(console_init_action, "console_init");
...
// 这里是个死循环
while (true) {
if (!waiting_for_exec) {
// 执行命令
execute_one_command();
restart_processes();
}
...
}
return 0;
}
main 方法里面有 148 行代码(不包括子函数代码)具体分为四个步骤:1.创建目录,挂载分区,2.解析启动脚本,3.启动解析的服务,4.守护解析的服务。init.rc 文件是 Android 系统的重要配置文件,位于 /system/core/rootdir/init.rc
// 导入其它的一些脚本
import /init.environ.rc
import /init.usb.rc
// 当前硬件版本的脚本
import /init.${ro.hardware}.rc
import /init.${ro.zygote}.rc
import /init.trace.rc
on early-init
...
on init
...
// 服务 服务名称 执行文件路径 执行参数
// 有几个重要的服务
service zygote /system/bin/app_process64 -Xzygote /system/bin --zygote --start-system-server
service servicemanager /system/bin/servicemanager
service surfaceflinger /system/bin/surfaceflinger
service media /system/bin/mediaserver
service installd /system/bin/installd
上面主要分为有 import 导入、on 命令和 service 服务,最主要的几个服务有 zygote、servicemanager、surfaceflinger 、media 、installd (后面还会分析到),接着往下看是如何解析的:
int init_parse_config_file(const char* path) {
INFO("Parsing %s...\n", path);
Timer t;
std::string data;
if (!read_file(path, &data)) {
return -1;
}
data.push_back('\n'); // TODO: fix parse_config.
// 解析
parse_config(path, data);
dump_parser_state();
NOTICE("(Parsing %s took %.2fs.)\n", path, t.duration());
return 0;
}
static void parse_config(const char *fn, const std::string& data)
{
struct listnode import_list;
struct listnode *node;
for (;;) {
// next_token 内部实现是一个字符一个字符去解析
// 0:T_EOF 文件结尾
// \n: T_NEWLINE
switch (next_token(&state)) {
case T_EOF:
// 文件结尾,跳转到 parser_done
state.parse_line(&state, 0, 0);
goto parser_done;
// 如果是新的一行,就认为是一个新的命令
case T_NEWLINE:
state.line++;
if (nargs) {
// 不同的命令选择不同的结构体
int kw = lookup_keyword(args[0]);
if (kw_is(kw, SECTION)) {
// 是一个 Section
state.parse_line(&state, 0, 0);
// 解析三种 Section:parse_service、parse_action、parse_import
parse_new_section(&state, kw, nargs, args);
} else {
// 普通命令
state.parse_line(&state, nargs, args);
}
nargs = 0;
}
break;
case T_TEXT:
if (nargs < INIT_PARSER_MAXARGS) {
args[nargs++] = state.text;
}
break;
}
}
parser_done:
// 循环解析 import
list_for_each(node, &import_list) {
struct import *import = node_to_item(node, struct import, list);
int ret;
ret = init_parse_config_file(import->filename);
if (ret)
ERROR("could not import file '%s' from '%s'\n",
import->filename, fn);
}
}
接下来看下是如何执行的,这里我们主要了解服务是如何启动的:
void execute_one_command() {
Timer t;
char cmd_str[256] = "";
char name_str[256] = "";
if (!cur_action || !cur_command || is_last_command(cur_action, cur_command)) {
cur_action = action_remove_queue_head();
cur_command = NULL;
if (!cur_action) {
return;
}
build_triggers_string(name_str, sizeof(name_str), cur_action);
INFO("processing action %p (%s)\n", cur_action, name_str);
cur_command = get_first_command(cur_action);
} else {
cur_command = get_next_command(cur_action, cur_command);
}
if (!cur_command) {
return;
}
// 服务的 func 跳转到 service_for_each_class
int result = cur_command->func(cur_command->nargs, cur_command->args);
...
}
int do_class_start(int nargs, char **args)
{
/* Starting a class does not start services
* which are explicitly disabled. They must
* be started individually.
*/
service_for_each_class(args[1], service_start_if_not_disabled);
return 0;
}
void service_for_each_class(const char *classname,void (*func)(struct service *svc))
{
struct listnode *node;
struct service *svc;
list_for_each(node, &service_list) {
svc = node_to_item(node, struct service, slist);
// 如果名字是一致的执行 func ,这是一个回调函数也就是 service_start_if_not_disabled
if (!strcmp(svc->classname, classname)) {
func(svc);
}
}
}
static void service_start_if_not_disabled(struct service *svc)
{
if (!(svc->flags & SVC_DISABLED)) {
service_start(svc, NULL);
} else {
svc->flags |= SVC_DISABLED_START;
}
}
void service_start(struct service *svc, const char *dynamic_args)
{
...
// fork 创建了一个子进程
pid_t pid = fork();
if (pid == 0) {
// 代表子进程,子进程会继承父进程的所有资源,可简单理解为读时共享写事复制
...
// exc 函数族,这些都是 linux 基础知识
execve(svc->args[0], (char**) arg_ptrs, (char**) ENV);
}
}
最后再来看下 init 进程是如何守护子进程的:
void signal_handler_init() {
// Create a signalling mechanism for SIGCHLD.
int s[2];
// 创建 socket pair 用于通信
if (socketpair(AF_UNIX, SOCK_STREAM | SOCK_NONBLOCK | SOCK_CLOEXEC, 0, s) == -1) {
ERROR("socketpair failed: %s\n", strerror(errno));
exit(1);
}
// 当捕获信号SIGCHLD,则写入signal_write_fd
signal_write_fd = s[0];
signal_read_fd = s[1];
// Write to signal_write_fd if we catch SIGCHLD.
struct sigaction act;
memset(&act, 0, sizeof(act));
act.sa_handler = SIGCHLD_handler;
act.sa_flags = SA_NOCLDSTOP;
// SA_NOCLDSTOP 使 init 进程只有在其子进程终止时才会受到 SIGCHLD 信号
sigaction(SIGCHLD, &act, 0);
// 进入 waitpid 来处理子进程是否退出的情况
reap_any_outstanding_children();
// 调用 epoll_ctl 方法来注册 epoll 的回调函数
register_epoll_handler(signal_read_fd, handle_signal);
}
//读取数据
static void handle_signal() {
// Clear outstanding requests.
char buf[32];
// 读取 signal_read_fd 中的数据,并放入 buf,这里读出并没有什么实际作用,只是用于阻塞等待
read(signal_read_fd, buf, sizeof(buf));
reap_any_outstanding_children();
}
//写入数据
static void SIGCHLD_handler(int) {
// 向signal_write_fd写入1
if (TEMP_FAILURE_RETRY(write(signal_write_fd, "1", 1)) == -1) {
ERROR("write(signal_write_fd) failed: %s\n", strerror(errno));
}
}
static void reap_any_outstanding_children() {
while (wait_for_one_process()) { }
}
static bool wait_for_one_process() {
int status;
//等待任意子进程,如果子进程没有退出则返回 0,否则则返回该子进程 pid。
pid_t pid = TEMP_FAILURE_RETRY(waitpid(-1, &status, WNOHANG));
if (pid == 0) {
return false;
} else if (pid == -1) {
return false;
}
//根据 pid 查找到相应的 service
service* svc = service_find_by_pid(pid);
//当 flags 为 RESTART,且不是 ONESHOT 时, kill 进程组内所有的子进程或子线程
if (!(svc->flags & SVC_ONESHOT) || (svc->flags & SVC_RESTART)) {
kill(-pid, SIGKILL);
}
//移除当前服务 svc 中的所有创建过的 socket
for (socketinfo* si = svc->sockets; si; si = si->next) {
char tmp[128];
snprintf(tmp, sizeof(tmp), ANDROID_SOCKET_DIR"/%s", si->name);
unlink(tmp);
}
//当 flags 为 EXEC 时,释放相应的服务
if (svc->flags & SVC_EXEC) {
waiting_for_exec = false;
list_remove(&svc->slist);
free(svc->name);
free(svc);
return true;
}
...
// 对于 ONESHOT 服务,使其进入 disabled 状态
if ((svc->flags & SVC_ONESHOT) && !(svc->flags & SVC_RESTART)) {
svc->flags |= SVC_DISABLED;
}
// 禁用和重置的服务,都不再自动重启
if (svc->flags & (SVC_DISABLED | SVC_RESET)) {
svc->NotifyStateChange("stopped"); //设置相应的service状态为stopped
return true;
}
// 执行当前 service 中所有 onrestar t命令,这个就是重启了
struct listnode* node;
list_for_each(node, &svc->onrestart.commands) {
command* cmd = node_to_item(node, struct command, clist);
cmd->func(cmd->nargs, cmd->args);
}
// 设置相应的 service 状态为 restarting
svc->NotifyStateChange("restarting");
return true;
}
至此 init 进程已全部分析完毕,有四个步骤:1. 创建目录,挂载分区,2. 解析启动脚本,3. 启动解析的服务,4. 守护解析的服务。最需要注意的是 init 创建了 zygote(创建 App 应用的服务)、servicemanager (client 与 service 通信管理的服务)、surfaceflinger(显示渲染服务) 和 media(多媒体服务) 等 service 进程。