系统启动 之 Linux系统启动概述(2)


博客:http://blog.csdn.net/younger_china/article/details/51615916linux


Linu系统启动是一个”冗长乏味”的过程,那么咱们现就须要去经历一下这个冗长乏味的生活。咱们按照以下流程来分析:小程序

 


1. 史前时代:BIOS

计算机在上电那一刻几乎是毫无用处的,此时,RAM中包含的所有是随机数据。缓存

在开始启动时,一个特殊的硬件电路在CPU的一个引脚上产生一个RESET逻辑值,在RESET产生以后,就把处理器的一些寄存器设置成固定的值,并执行在物理地址0xFFFFFFF0处找到的代码(Younger注:该代码我称之为BIOS代码)。硬件会把这个地址映射到某个只读、持久的存储芯片中,该芯片被称为ROM(即:Read-Only Memory)。函数

Linux一旦进入实模式,就再也不使用BIOS,而是linux自己为计算机上的每一个硬件设备提供各自的设备驱动程序。实际上,由于BIOS过程必须在实模式下运行,而内核在保护模式下运行,因此即便在两者之间共享函数是有益的,也不能共享。工具

BIOS是采用实模式寻址的,由于在上电启动时,计算机只能寻址这么大的地址空间(请参阅实模式与保护模式的区别)。实模式地址由一个segment段和一个offset偏移量组成.。相应的物理地址样计算方法:segment*16 + offset。此时,CPU寻址电路不须要全局描述表(GDT)、局部描述表(LDT)和页表(PT)。显然,对GDT,LDT和PT进行初始化的代码必须在实模式下运行。性能

那么在BIOS阶段,都是作了哪些工做哪?.BIOS启动过程实际上执行一下4个操做:测试

1. 上电自检:对计算机硬件执行一系列的测试,用来检测如今都有什么设备以及这些设备是否正常工做,这个阶段一般称为POST(上电自检)。这个阶段中,会显示一些信息,如BIOS版本号等。spa

2. 初始化硬件设备:这个阶段在现代基于PCI的体系机构中至关重要,由于它能够保证全部的硬件设备操做不会引发IRQ线与I/O端口的冲突。在本阶段的最后,会显示系统中所安装的全部PCI设备的一个列表。(实际上,由BIOS扫描的一系列设备数据都会被内存引用,尤为是在PCI扫描的过程,通常只是对 BIOS扫描结果后的一种确认,而内核也通常不须要过多地从新扫描PCI资源)。操作系统

3. 搜索一个操做系统来启动:实际上,根据BIOS的设置,这个过程可能要试图访问系统中的软盘,硬盘和CDROM等设备的第一个扇区。.net

4. 装载代码(引导程序):只要找到一个有效的设备,就把第一个扇区的内容拷贝到RAM中从物理地址0x00007c00(X86)0x00008000(ARM)开始的位置,而后跳转到这个地址处,开始执行刚才转载进来的代码。

head-y          := arch/arm/kernel/head$(MMUEXT).o arch/arm/kernel/init_task.o

textofs-y       := 0x00008000

 

2. 远古时代:BootLoader

引导装入程序(Bootloader)是BIOS将操做系统内核映像装载到RAM中执行的第一个程序。

软盘启动与磁盘启动过程稍有不一样,仅此处仅仅分析磁盘启动方式。

从硬盘启动时,硬盘的第一个扇区MBR(Master Boot Record)中包含分区表和一小段程序,这段小程序用来装载被启动的操做系统所在分区的第一个扇区的内容。针对Linux系统,第一个扇区中存放的是bootloader,能够容许用户选择要启动的操做系统。

从磁盘启动linux内核,Bootloader通被BIOS加载到RAM的0x00008000处开始执行。

Bootloader的主要执行过程:

1. 初始化 RAM:由于 Linux 内核通常都会在 RAM 中运行,因此在调用 Linux 内核以前 bootloader 必须设置和初始化 RAM,为调用 Linux内核作好准备。初始化 RAM 的任务包括设置CPU 的控制寄存器参数,以便能正常使用 RAM 以及检测RAM 大小等。

2. 初始化串口:串口在 Linux 的启动过程当中有着很是重要的做用,它是 Linux内核和用户交互的方式之一。Linux 在启动过程当中能够将信息经过串口输出,这样即可清楚的了解 Linux 的启动过程。虽然它并非 Bootloader 必需要完成的工做,可是经过串口输出信息是调试Bootloader 和Linux 内核的强有力的工具,因此通常的 Bootloader 都会在执行过程当中初始化一个串口作为调试端口。

3. 检测处理器类型:Bootloader在调用 Linux内核前必须检测系统的处理器类型,并将其保存到某个常量中提供给 Linux 内核。Linux 内核在启动过程当中会根据该处理器类型调用相应的初始化程序。

4. 设置 Linux启动参数:Bootloader在执行过程当中必须设置和初始化 Linux 的内核启动参数。

5. 调用 Linux内核映像:Bootloader完成的最后一项工做即是调用 Linux内核。若是 Linux 内核存放在 Flash 中,而且可直接在上面运行(该 Flash 指 Nor Flash),那么可直接跳转到内核中去执行。但因为在 Flash 中执行代码会有种种限制,并且速度也远不及RAM 快,因此通常的嵌入式系统都是将 Linux内核拷贝到 RAM 中,而后跳转到 RAM 中去执行,不论哪一种状况,在跳到 Linux 内核执行以前 CPU的寄存器必须知足如下条件:r0=0,r1=处理器类型,r2=标记列表在 RAM中的地址。

 

3. 内核启动

 

3.1            原始时代:加载内核

在 bootloader将 Linux 内核映像拷贝到 RAM 之后,能够经过下例代码启动 Linux 内核: 

call_linux(0, machine_type, kernel_params_base)。 

其中,machine_tpye 是 bootloader检测出来的处理器类型, kernel_params_base 是启动参 数在 RAM 的地址。经过这种方式将 Linux 启动须要的参数从 bootloader传递到内核。 

Linux 内核有两种映像:一种是非压缩内核,叫 Image,另外一种是它的压缩版本,叫 zImage。

根据内核映像的不一样,Linux 内核的启动在开始阶段也有所不一样。zImage 是 Image 通过压缩造成的,因此它的大小比 Image 小。但为了能使用 zImage,必须在它的开头加上解压缩的代码,将 zImage 解压缩以后才能执行,所以它的执行速度比 Image 要慢。但考虑 到嵌入式系统的存储空容量通常比较小,采用 zImage 能够占用较少的存储空间,所以牺牲一点性能上的代价也是值得的。因此通常的嵌入式系统均采用压缩内核的方式。

对于 ARM 系列处理器来讲,zImage 的入口程序即为 arch/arm/boot/compressed/head.S。 它依次完成如下工做:开启 MMU 和Cache,调用 decompress_kernel()解压内核,最后经过 调用 call_kernel()进入非压缩内核 Image 的启动。下面将具体分析在此以后 Linux 内核的启 动过程。 

3.2            封建时代:Linux内核入口 

Linux 非压缩内核的入口位于文件/arch/arm/kernel/head-armv.S 中的 stext 段。该段的基 地址就是压缩内核解压后的跳转地址。若是系统中加载的内核是非压缩的 Image,那么 bootloader将内核从 Flash中拷贝到 RAM 后将直接跳到该地址处,从而启动 Linux 内核。 不一样体系结构的 Linux 系统的入口文件是不一样的,并且由于该文件与具体体系结构有 关,因此通常均用汇编语言编写[3] 。对基于 ARM 处理的 Linux 系统来讲,该文件就是 head-armv.S。该程序经过查找处理器内核类型和处理器类型调用相应的初始化函数,再创建页表,最后跳转到 start_kernel()函数开始内核的初始化工做。 

检测处理器内核类型是在汇编子函数__lookup_processor_type中完成的。经过如下代码 可实现对它的调用: bl __lookup_processor_type。 __lookup_processor_type调用结束返回原程序时,会将返回结果保存到寄存器中。其中 r8保存了页表的标志位,r9 保存了处理器的 ID 号,r10 保存了与处理器相关的 stru proc_info_list 结构地址。 检测处理器类型是在汇编子函数 __lookup_architecture_type 中完成的。与 __lookup_processor_type相似,它经过代码:“bl __lookup_processor_type”来实现对它的调 用。该函数返回时,会将返回结构保存在 r五、r6 和 r7 三个寄存器中。其中 r5 保存了 RAM 的起始基地址,r6 保存了 I/O基地址,r7 保存了 I/O的页表偏移地址。 

当检测处理器内核和处理器类型结束后,将调用__create_page_tables 子函数来创建页 表,它所要作的工做就是将RAM 基地址开始的 4M 空间的物理地址映射到 0xC0000000 开 始的虚拟地址处。当全部的初始化结束以后,使用以下代码来跳到C程序的入口函数 start_kernel()处,开始以后的内核初始化工做:

 b SYMBOL_NAME(start_kernel) 

 

3.3            近代:start_kernel函数 

start_kernel是全部 Linux 平台进入系统内核初始化后的入口函数,它主要完成剩余的与 硬件平台相关的初始化工做,在进行一系列与内核相关的初始化后,调用第一个用户进程- init 进程并等待用户进程的执行,这样整个 Linux 内核便启动完毕。该函数所作的具体工做 
有[4][5] : 

1) 调用 setup_arch()函数进行与体系结构相关的第一个初始化工做; 对不一样的体系结构来讲该函数有不一样的定义。对于 ARM 平台而言,该函数定义在 arch/arm/kernel/Setup.c。它首先经过检测出来的处理器类型进行处理器内核的初始化,而后 经过 bootmem_init()函数根据系统定义的 meminfo 结构进行内存结构的初始化,最后调用 paging_init()开启MMU,建立内核页表,映射全部的物理内存和 IO空间。 

2) 建立异常向量表和初始化中断处理函数; 

3) 初始化系统核心进程调度器和时钟中断处理机制;

4) 初始化串口控制台(serial-console); 

ARM-Linux 在初始化过程当中通常都会初始化一个串口作为内核的控制台,这样内核在 启动过程当中就能够经过串口输出信息以便开发者或用户了解系统的启动进程。 

5) 建立和初始化系统 cache,为各类内存调用机制提供缓存,包括;动态内存分配,虚拟文 件系统(VirtualFile System)及页缓存。 

6) 初始化内存管理,检测内存大小及被内核占用的内存状况;

7) 初始化系统的进程间通讯机制(IPC); 

当以上全部的初始化工做结束后,start_kernel()函数会调用 rest_init()函数来进行最后的 

初始化,包括建立系统的第一个进程-init 进程来结束内核的启动。Init 进程首先进行一系列的硬件初始化,而后经过命令行传递过来的参数挂载根文件系统。最后 init 进程会执行用户传递过来的“init=”启动参数执行用户指定的命令,或者执行如下几个进程之一: 

execve("/sbin/init",argv_init,envp_init); 

execve("/etc/init",argv_init,envp_init); 

execve("/bin/init",argv_init,envp_init); 

execve("/bin/sh",argv_init,envp_init)。 

当全部的初始化工做结束后,cpu_idle()函数会被调用来使系统处于闲置(idle)状态并等待用户程序的执行。至此,整个 Linux 内核启动完毕。

 

4.      参考文献

1.  《深刻理解linux内核》



 

Linu系统启动是一个冗长乏味的过程,那么咱们现就须要去经历一下这个冗长乏味的生活。咱们按照以下流程来分析:

 

1. 史前时代:BIOS

计算机在上电那一刻几乎是毫无用处的,此时,RAM中包含的所有是随机数据。

在开始启动时,一个特殊的硬件电路在CPU的一个引脚上产生一个RESET逻辑值,在RESET产生以后,就把处理器的一些寄存器设置成固定的值,并执行在物理地址0xFFFFFFF0处找到的代码(Younger注:该代码我称之为BIOS代码)。硬件会把这个地址映射到某个只读、持久的存储芯片中,该芯片被称为ROM(即:Read-Only Memory)

Linux一旦进入实模式,就再也不使用BIOS,而是linux自己为计算机上的每一个硬件设备提供各自的设备驱动程序。实际上,由于BIOS过程必须在实模式下运行,而内核在保护模式下运行,因此即便在两者之间共享函数是有益的,也不能共享。

BIOS是采用实模式寻址的,由于在上电启动时,计算机只能寻址这么大的地址空间(请参阅实模式与保护模式的区别)。实模式地址由一个segment段和一个offset偏移量组成.。相应的物理地址样计算方法:segment16 + offset。此时,CPU寻址电路不须要全局描述表(GDT)、局部描述表(LDT)和页表(PT)。显然,对GDT,LDTPT进行初始化的代码必须在实模式下运行。

那么在BIOS阶段,都是作了哪些工做哪?.BIOS启动过程实际上执行一下4个操做:

1. 上电自检:对计算机硬件执行一系列的测试,用来检测如今都有什么设备以及这些设备是否正常工做,这个阶段一般称为POST(上电自检)。这个阶段中,会显示一些信息,如BIOS版本号等。

2. 初始化硬件设备:这个阶段在现代基于PCI的体系机构中至关重要,由于它能够保证全部的硬件设备操做不会引发IRQ线与I/O端口的冲突。在本阶段的最后,会显示系统中所安装的全部PCI设备的一个列表。(实际上,由BIOS扫描的一系列设备数据都会被内存引用,尤为是在PCI扫描的过程,通常只是对 BIOS扫描结果后的一种确认,而内核也通常不须要过多地从新扫描PCI资源)

3. 搜索一个操做系统来启动:实际上,根据BIOS的设置,这个过程可能要试图访问系统中的软盘,硬盘和CDROM等设备的第一个扇区。

4. 装载代码(引导程序)只要找到一个有效的设备,就把第一个扇区的内容拷贝到RAM中从物理地址0x00007c00(X86)0x00008000ARM开始的位置,而后跳转到这个地址处,开始执行刚才转载进来的代码。

head-y          := arch/arm/kernel/head$(MMUEXT).o arch/arm/kernel/init_task.o

textofs-y       := 0x00008000

 

2. 远古时代:BootLoader

引导装入程序(Bootloader)是BIOS将操做系统内核映像装载到RAM中执行的第一个程序。

软盘启动与磁盘启动过程稍有不一样,仅此处仅仅分析磁盘启动方式。

从硬盘启动时,硬盘的第一个扇区MBRMaster Boot Record)中包含分区表和一小段程序,这段小程序用来装载被启动的操做系统所在分区的第一个扇区的内容。针对Linux系统,第一个扇区中存放的是bootloader,能够容许用户选择要启动的操做系统。

从磁盘启动linux内核,Bootloader通被BIOS加载到RAM0x00008000处开始执行。

Bootloader的主要执行过程:

1. 初始化 RAM由于 Linux 内核通常都会在 RAM 中运行,因此在调用 Linux 内核以前 bootloader 必须设置和初始化 RAM,为调用 Linux内核作好准备。初始化 RAM 的任务包括设置CPU 的控制寄存器参数,以便能正常使用 RAM 以及检测RAM 大小等。

2. 初始化串口:串口在 Linux 的启动过程当中有着很是重要的做用,它是 Linux内核和用户交互的方式之一。Linux 在启动过程当中能够将信息经过串口输出,这样即可清楚的了解 Linux 的启动过程。虽然它并非 Bootloader 必需要完成的工做,可是经过串口输出信息是调试Bootloader Linux 内核的强有力的工具,因此通常的 Bootloader 都会在执行过程当中初始化一个串口作为调试端口。

3. 检测处理器类型Bootloader在调用 Linux内核前必须检测系统的处理器类型,并将其保存到某个常量中提供给 Linux 内核。Linux 内核在启动过程当中会根据该处理器类型调用相应的初始化程序。

4. 设置 Linux启动参数:Bootloader在执行过程当中必须设置和初始化 Linux 的内核启动参数。

5. 调用 Linux内核映像:Bootloader完成的最后一项工做即是调用 Linux内核。若是 Linux 内核存放在 Flash 中,而且可直接在上面运行(该 Flash  Nor Flash),那么可直接跳转到内核中去执行。但因为在 Flash 中执行代码会有种种限制,并且速度也远不及RAM 快,因此通常的嵌入式系统都是将 Linux内核拷贝到 RAM 中,而后跳转到 RAM 中去执行,不论哪一种状况,在跳到 Linux 内核执行以前 CPU的寄存器必须知足如下条件:r00r1=处理器类型,r2=标记列表在 RAM中的地址。

 

3. 内核启动

 

3.1            原始时代:加载内核

 bootloader Linux 内核映像拷贝到 RAM 之后,能够经过下例代码启动 Linux 内核: 

call_linux(0, machine_type, kernel_params_base) 

其中,machine_tpye  bootloader检测出来的处理器类型, kernel_params_base 是启动参 数在 RAM 的地址。经过这种方式将 Linux 启动须要的参数从 bootloader传递到内核。 

Linux 内核有两种映像:一种是非压缩内核,叫 Image,另外一种是它的压缩版本,叫 zImage

根据内核映像的不一样,Linux 内核的启动在开始阶段也有所不一样。zImage  Image 通过压缩造成的,因此它的大小比 Image 小。但为了能使用 zImage,必须在它的开头加上解压缩的代码,将 zImage 解压缩以后才能执行,所以它的执行速度比 Image 要慢。但考虑 到嵌入式系统的存储空容量通常比较小,采用 zImage 能够占用较少的存储空间,所以牺牲一点性能上的代价也是值得的。因此通常的嵌入式系统均采用压缩内核的方式。

对于 ARM 系列处理器来讲,zImage 的入口程序即为 arch/arm/boot/compressed/head.S 它依次完成如下工做:开启 MMU Cache,调用 decompress_kernel()解压内核,最后经过 调用 call_kernel()进入非压缩内核 Image 的启动。下面将具体分析在此以后 Linux 内核的启 动过程。 

3.2            封建时代:Linux内核入口 

Linux 非压缩内核的入口位于文件/arch/arm/kernel/head-armv.S 中的 stext 段。该段的基 地址就是压缩内核解压后的跳转地址。若是系统中加载的内核是非压缩的 Image,那么 bootloader将内核从 Flash中拷贝到 RAM 后将直接跳到该地址处,从而启动 Linux 内核。 不一样体系结构的 Linux 系统的入口文件是不一样的,并且由于该文件与具体体系结构有 关,因此通常均用汇编语言编写[3] 。对基于 ARM 处理的 Linux 系统来讲,该文件就是 head-armv.S。该程序经过查找处理器内核类型和处理器类型调用相应的初始化函数,再创建页表,最后跳转到 start_kernel()函数开始内核的初始化工做。 

检测处理器内核类型是在汇编子函数__lookup_processor_type中完成的。经过如下代码 可实现对它的调用: bl __lookup_processor_type __lookup_processor_type调用结束返回原程序时,会将返回结果保存到寄存器中。其中 r8保存了页表的标志位,r9 保存了处理器的 ID 号,r10 保存了与处理器相关的 stru proc_info_list 结构地址。 检测处理器类型是在汇编子函数 __lookup_architecture_type 中完成的。与 __lookup_processor_type相似,它经过代码:“bl __lookup_processor_type”来实现对它的调 用。该函数返回时,会将返回结构保存在 r5r6  r7 三个寄存器中。其中 r5 保存了 RAM 的起始基地址,r6 保存了 I/O基地址,r7 保存了 I/O的页表偏移地址。 

当检测处理器内核和处理器类型结束后,将调用__create_page_tables 子函数来创建页 表,它所要作的工做就是将RAM 基地址开始的 4M 空间的物理地址映射到 0xC0000000  始的虚拟地址处。当全部的初始化结束以后,使用以下代码来跳到C程序的入口函数 start_kernel()处,开始以后的内核初始化工做:

 b SYMBOL_NAME(start_kernel) 

 

3.3            近代:start_kernel函数 

start_kernel是全部 Linux 平台进入系统内核初始化后的入口函数,它主要完成剩余的与 硬件平台相关的初始化工做,在进行一系列与内核相关的初始化后,调用第一个用户进程- init 进程并等待用户进程的执行,这样整个 Linux 内核便启动完毕。该函数所作的具体工做 
[4][5]  

1) 调用 setup_arch()函数进行与体系结构相关的第一个初始化工做; 对不一样的体系结构来讲该函数有不一样的定义。对于 ARM 平台而言,该函数定义在 arch/arm/kernel/Setup.c。它首先经过检测出来的处理器类型进行处理器内核的初始化,而后 经过 bootmem_init()函数根据系统定义的 meminfo 结构进行内存结构的初始化,最后调用 paging_init()开启MMU,建立内核页表,映射全部的物理内存和 IO空间。 

2) 建立异常向量表和初始化中断处理函数; 

3) 初始化系统核心进程调度器和时钟中断处理机制;

4) 初始化串口控制台(serial-console); 

ARM-Linux 在初始化过程当中通常都会初始化一个串口作为内核的控制台,这样内核在 启动过程当中就能够经过串口输出信息以便开发者或用户了解系统的启动进程。 

5) 建立和初始化系统 cache,为各类内存调用机制提供缓存,包括;动态内存分配,虚拟文 件系统(VirtualFile System)及页缓存。 

6) 初始化内存管理,检测内存大小及被内核占用的内存状况;

7) 初始化系统的进程间通讯机制(IPC); 

当以上全部的初始化工做结束后,start_kernel()函数会调用 rest_init()函数来进行最后的 

初始化,包括建立系统的第一个进程-init 进程来结束内核的启动。Init 进程首先进行一系列的硬件初始化,而后经过命令行传递过来的参数挂载根文件系统。最后 init 进程会执行用户传递过来的“init启动参数执行用户指定的命令,或者执行如下几个进程之一: 

execve("/sbin/init",argv_init,envp_init); 

execve("/etc/init",argv_init,envp_init); 

execve("/bin/init",argv_init,envp_init); 

execve("/bin/sh",argv_init,envp_init) 

当全部的初始化工做结束后,cpu_idle()函数会被调用来使系统处于闲置(idle)状态并等待用户程序的执行。至此,整个 Linux 内核启动完毕。

 

4.      参考文献

1.  《深刻理解linux内核》

相关文章
相关标签/搜索