内容:
一. Bootloader
二.Kernel引导入口
三.核心数据结构初始化--内核引导第一部分
四.外设初始化--内核引导第二部分
五.init进程和inittab引导指令
六.rc启动脚本
七.getty和login
八.bash
附:XDM方式登陆
本文以Redhat 6.0 Linux 2.2.19 for Alpha/AXP为平台,描述了从开机到登陆的 Linux 启动全过程。该文对i386平台一样适用。
一. Bootloader
在Alpha/AXP平台上引导Linux一般有两种方法,一种是由MILO及其余相似的引导程序引 导,另外一种是由Firmware直接引导。MILO功能与i386平台的LILO相近,但内置有基本的磁盘 驱动程序(如IDE、SCSI等),以及常见的文件系统驱动程序(如ext2,iso9660等), firmware有ARC、SRM两种形式,ARC具备类BIOS界面,甚至还有多重引导的设置;而SRM则具 有功能强大的命令行界面,用户能够在控制台上使用boot等命令引导系统。ARC有分区 (Partition)的概念,所以能够访问到分区的首扇区;而SRM只能将控制转给磁盘的首扇区。 两种firmware均可以经过引导MILO来引导Linux,也能够直接引导Linux的引导代码。
“arch/alpha/boot”下就是制做Linux Bootloader的文件。“head.S”文件提供了对 OSF PAL/1的调用入口,它将被编译后置于引导扇区(ARC的分区首扇区或SRM的磁盘0扇区), 获得控制后初始化一些数据结构,再将控制转给“main.c”中的start_kernel(), start_kernel()向控制台输出一些提示,调用pal_init()初始化PAL代码,调用openboot() 打开引导设备(经过读取Firmware环境),调用load()将核心代码加载到START_ADDR(见 “include/asm-alpha/system.h”),再将Firmware中的核心引导参数加载到ZERO_PAGE(0) 中,最后调用runkernel()将控制转给0x100000的kernel,bootloader部分结束。
“arch/alpha/boot/bootp.c”以“main.c”为基础,可代替“main.c”与“head.S” 生成用于BOOTP协议网络引导的Bootloader。
Bootloader中使用的全部“srm_”函数在“arch/alpha/lib/”中定义。
以上这种Boot方式是一种最简单的方式,即不需其余工具就能引导Kernel,前提是按照 Makefile的指导,生成bootp_w_picpath文件,内含以上提到的bootloader以及vmlinux,而后将 bootp_w_picpath写入自磁盘引导扇区始的位置中。
当采用MILO这样的引导程序来引导Linux时,不须要上面所说的Bootloader,而只须要 vmlinux或vmlinux.gz,引导程序会主动解压加载内核到0x1000(小内核)或0x100000(大 内核),并直接进入内核引导部分,即本文的第二节。
对于I386平台
i386系统中通常都有BIOS作最初的引导工做,那就是将四个主分区表中的第一个可引导 分区的第一个扇区加载到实模式地址0x7c00上,而后将控制转交给它。
在“arch/i386/boot”目录下,bootsect.S是生成引导扇区的汇编源码,它首先将本身 拷贝到0x90000上,而后将紧接其后的setup部分(第二扇区)拷贝到0x90200,将真正的内核 代码拷贝到0x100000。以上这些拷贝动做都是以bootsect.S、setup.S以及vmlinux在磁盘上 连续存放为前提的,也就是说,咱们的bzImage文件或者zImage文件是按照bootsect,setup, vmlinux这样的顺序组织,并存放于始于引导分区的首扇区的连续磁盘扇区之中。
bootsect.S完成加载动做后,就直接跳转到0x90200,这里正是setup.S的程序入口。 setup.S的主要功能就是将系统参数(包括内存、磁盘等,由BIOS返回)拷贝到 0x90000-0x901FF内存中,这个地方正是bootsect.S存放的地方,这时它将被系统参数覆盖。 之后这些参数将由保护模式下的代码来读取。
除此以外,setup.S还将video.S中的代码包含进来,检测和设置显示器和显示模式。最 后,setup.S将系统转换到保护模式,并跳转到0x100000(对于bzImage格式的大内核是 0x100000,对于zImage格式的是0x1000)的内核引导代码,Bootloader过程结束。
对于2.4.x版内核
没有什么变化。
二.Kernel引导入口
在arch/alpha/vmlinux.lds的连接脚本控制下,连接程序将vmlinux的入口置于 "arch/alpha/kernel/head.S"中的__start上,所以当Bootloader跳转到0x100000时, __start处的代码开始执行。__start的代码很简单,只须要设置一下全局变量,而后就跳转 到start_kernel去了。start_kernel()是"init/main.c"中的asmlinkage函数,至此,启 动过程转入体系结构无关的通用C代码中。
对于I386平台
在i386体系结构中,由于i386自己的问题,在"arch/alpha/kernel/head.S"中须要更多的设置,但最终也是经过call SYMBOL_NAME(start_kernel)转到start_kernel()这个体系结构无关的函数中去执行了。
所不一样的是,在i386系统中,当内核以bzImage的形式压缩,即大内核方式 (__BIG_KERNEL__)压缩时就须要预先处理bootsect.S和setup.S,按照大核模式使用$(CPP) 处理生成bbootsect.S和bsetup.S,而后再编译生成相应的.o文件,并使用 "arch/i386/boot/compressed/build.c"生成的build工具,将实际的内核(未压缩的,含 kernel中的head.S代码)与"arch/i386/boot/compressed"下的head.S和misc.c合成到一块儿,其中的head.S代替了"arch/i386/kernel/head.S"的位置,由Bootloader引导执行 (startup_32入口),而后它调用misc.c中定义的decompress_kernel()函数,使用 "lib/inflate.c"中定义的gunzip()将内核解压到0x100000,再转到其上执行 "arch/i386/kernel/head.S"中的startup_32代码。
对于2.4.x版内核
没有变化。
三.核心数据结构初始化--内核引导第一部分
start_kernel()中调用了一系列初始化函数,以完成kernel自己的设置。 这些动做有的是公共的,有的则是须要配置的才会执行的。
在start_kernel()函数中,
输出Linux版本信息(printk(linux_banner))
设置与体系结构相关的环境(setup_arch())
页表结构初始化(paging_init())
使用"arch/alpha/kernel/entry.S"中的入口点设置系统自陷入口(trap_init())
使用alpha_mv结构和entry.S入口初始化系统IRQ(init_IRQ())
核心进程调度器初始化(包括初始化几个缺省的Bottom-half,sched_init())
时间、定时器初始化(包括读取CMOS时钟、估测主频、初始化定时器中断等,time_init())
提取并分析核心启动参数(从环境变量中读取参数,设置相应标志位等待处理,(parse_options())
控制台初始化(为输出信息而先于PCI初始化,console_init())
剖析器数据结构初始化(prof_buffer和prof_len变量)
核心Cache初始化(描述Cache信息的Cache,kmem_cache_init())
延迟校准(得到时钟jiffies与CPU主频ticks的延迟,calibrate_delay())
内存初始化(设置内存上下界和页表项初始值,mem_init())
建立和设置内部及通用cache("slab_cache",kmem_cache_sizes_init())
建立uid taskcount SLAB cache("uid_cache",uidcache_init())
建立文件cache("files_cache",filescache_init())
建立目录cache("dentry_cache",dcache_init())
建立与虚存相关的cache("vm_area_struct","mm_struct",vma_init())
块设备读写缓冲区初始化(同时建立"buffer_head"cache用户加速访问,buffer_init())
建立页cache(内存页hash表初始化,page_cache_init())
建立信号队列cache("signal_queue",signals_init())
初始化内存inode表(inode_init())
建立内存文件描述符表("filp_cache",file_table_init())
检查体系结构漏洞(对于alpha,此函数为空,check_bugs())
SMP机器其他CPU(除当前引导CPU)初始化(对于没有配置SMP的内核,此函数为空,smp_init())
启动init过程(建立第一个核心线程,调用init()函数,原执行序列调用cpu_idle() 等待调度,init())
至此start_kernel()结束,基本的核心环境已经创建起来了。
对于I386平台
i386平台上的内核启动过程与此基本相同,所不一样的主要是实现方式。
对于2.4.x版内核
2.4.x中变化比较大,但基本过程没变,变更的是各个数据结构的具体实现,好比Cache。
四.外设初始化--内核引导第二部分
init()函数做为核心线程,首先锁定内核(仅对SMP机器有效),而后调用 do_basic_setup()完成外设及其驱动程序的加载和初始化。过程以下:
总线初始化(好比pci_init())
网络初始化(初始化网络数据结构,包括sk_init()、skb_init()和proto_init()三部分,在proto_init()中,将调用protocols结构中包含的全部协议的初始化过程,sock_init())
建立bdflush核心线程(bdflush()过程常驻核心空间,由核心唤醒来清理被写过的内存缓冲区,当bdflush()由kernel_thread()启动后,它将本身命名为kflushd)
建立kupdate核心线程(kupdate()过程常驻核心空间,由核心按时调度执行,将内存缓冲区中的信息更新到磁盘中,更新的内容包括超级块和inode表)
设置并启动核心调页线程kswapd(为了防止kswapd启动时将版本信息输出到其余信息中间,核心线调用kswapd_setup()设置kswapd运行所要求的环境,而后再建立 kswapd核心线程)
建立事件管理核心线程(start_context_thread()函数启动context_thread()过程,并重命名为keventd)
设备初始化(包括并口parport_init()、字符设备chr_dev_init()、块设备 blk_dev_init()、SCSI设备scsi_dev_init()、网络设备net_dev_init()、磁盘初始化及分区检查等等,device_setup())
执行文件格式设置(binfmt_setup())
启动任何使用__initcall标识的函数(方便核心开发者添加启动函数,do_initcalls())
文件系统初始化(filesystem_setup())
安装root文件系统(mount_root())
至此do_basic_setup()函数返回init(),在释放启动内存段(free_initmem())并给内核解锁之后,init()打开/dev/console设备,重定向stdin、stdout和stderr到控制台,最后,搜索文件系统中的init程序(或者由init=命令行参数指定的程序),并使用 execve()系统调用加载执行init程序。
init()函数到此结束,内核的引导部分也到此结束了,这个由start_kernel()建立的第一个线程已经成为一个用户模式下的进程了。此时系统中存在着六个运行实体:
start_kernel()自己所在的执行体,这实际上是一个"手工"建立的线程,它在建立了init()线程之后就进入cpu_idle()循环了,它不会在进程(线程)列表中出现
init线程,由start_kernel()建立,当前处于用户态,加载了init程序
kflushd核心线程,由init线程建立,在核心态运行bdflush()函数
kupdate核心线程,由init线程建立,在核心态运行kupdate()函数
kswapd核心线程,由init线程建立,在核心态运行kswapd()函数
keventd核心线程,由init线程建立,在核心态运行context_thread()函数
对于I386平台
基本相同。
对于2.4.x版内核
这一部分的启动过程在2.4.x内核中简化了很多,缺省的独立初始化过程只剩下网络 (sock_init())和建立事件管理核心线程,而其余所须要的初始化都使用__initcall()宏 包含在do_initcalls()函数中启动执行。
五.init进程和inittab引导指令
init进程是系统全部进程的起点,内核在完成核内引导之后,即在本线程(进程)空 间内加载init程序,它的进程号是1。
init程序须要读取/etc/inittab文件做为其行为指针,inittab是以行为单位的描述性(非执行性)文本,每个指令行都具备如下格式:
id:runlevel:action:process其中id为入口标识符,runlevel为运行级别,action为动做代号,process为具体的执行程序。
id通常要求4个字符之内,对于getty或其余login程序项,要求id与tty的编号相同,不然getty程序将不能正常工做。
runlevel是init所处于的运行级别的标识,通常使用0-6以及S或s。0、一、6运行级别被系统保留,0做为shutdown动做,1做为重启至单用户模式,6为重启;S和s意义相同,表示单用户模式,且无需inittab文件,所以也不在inittab中出现,实际上,进入单用户模式时,init直接在控制台(/dev/console)上运行/sbin/sulogin。
在通常的系统实现中,都使用了二、三、四、5几个级别,在Redhat系统中,2表示无NFS支持的多用户模式,3表示彻底多用户模式(也是最经常使用的级别),4保留给用户自定义,5表示XDM图形登陆方式。7-9级别也是可使用的,传统的Unix系统没有定义这几个级别。runlevel能够是并列的多个值,以匹配多个运行级别,对大多数action来讲,仅当runlevel与当前运行级别匹配成功才会执行。
initdefault是一个特殊的action值,用于标识缺省的启动级别;当init由核心激活 之后,它将读取inittab中的initdefault项,取得其中的runlevel,并做为当前的运行级 别。若是没有inittab文件,或者其中没有initdefault项,init将在控制台上请求输入 runlevel。
sysinit、boot、bootwait等action将在系统启动时无条件运行,而忽略其中的runlevel,其他的action(不含initdefault)都与某个runlevel相关。各个action的定义在inittab的man手册中有详细的描述。
在Redhat系统中,通常状况下inittab都会有以下几项:
id:3:initdefault:
#表示当前缺省运行级别为3--彻底多任务模式;
si::sysinit:/etc/rc.d/rc.sysinit
#启动时自动执行/etc/rc.d/rc.sysinit脚本
l3:3:wait:/etc/rc.d/rc 3
#当运行级别为3时,以3为参数运行/etc/rc.d/rc脚本,init将等待其返回
0:12345:respawn:/sbin/mingetty tty0
#在1-5各个级别上以tty0为参数执行/sbin/mingetty程序,打开tty0终端用于
#用户登陆,若是进程退出则再次运行mingetty程序
x:5:respawn:/usr/bin/X11/xdm -nodaemon
#在5级别上运行xdm程序,提供xdm图形方式登陆界面,并在退出时从新执行
六.rc启动脚本
上一节已经提到init进程将启动运行rc脚本,这一节将介绍rc脚本具体的工做。
通常状况下,rc启动脚本都位于/etc/rc.d目录下,rc.sysinit中最多见的动做就是激活交换分区,检查磁盘,加载硬件模块,这些动做不管哪一个运行级别都是须要优先执行的。仅当rc.sysinit执行完之后init才会执行其余的boot或bootwait动做。
若是没有其余boot、bootwait动做,在运行级别3下,/etc/rc.d/rc将会获得执行,命令行参数为3,即执行/etc/rc.d/rc3.d/目录下的全部文件。rc3.d下的文件都是指向/etc/rc.d/init.d/目录下各个Shell脚本的符号链接,而这些脚本通常能接受start、stop、restart、status等参数。rc脚本以start参数启动全部以S开头的脚本,在此以前,若是相应的脚本也存在K打头的连接,并且已经处于运行态了(以/var/lock/subsys/下的文件做为标志),则将首先启动K开头的脚本,以stop做为参数中止这些已经启动了的服务,而后再从新运行。显然,这样作的直接目的就是当init改变运行级别时,全部相关的服务都将重启,即便是同一个级别。
rc程序执行完毕后,系统环境已经设置好了,下面就该用户登陆系统了。
七.getty和login
在rc返回后,init将获得控制,并启动mingetty(见第五节)。mingetty是getty的简化,不能处理串口操做。getty的功能通常包括:
打开终端线,并设置模式
输出登陆界面及提示,接受用户名的输入
以该用户名做为login的参数,加载login程序
缺省的登陆提示记录在/etc/issue文件中,但每次启动,通常都会由rc.local脚本根据系统环境从新生成。
注:用于远程登陆的提示信息位于/etc/issue.net中。
login程序在getty的同一个进程空间中运行,接受getty传来的用户名参数做为登陆的用户名。
若是用户名不是root,且存在/etc/nologin文件,login将输出nologin文件的内容,而后退出。这一般用来系统维护时防止非root用户登陆。
只有/etc/securetty中登记了的终端才容许root用户登陆,若是不存在这个文件,则root能够在任何终端上登陆。/etc/usertty文件用于对用户做出附加访问限制,若是不存在这个文件,则没有其余限制。
当用户登陆经过了这些检查后,login将搜索/etc/passwd文件(必要时搜索 /etc/shadow文件)用于匹配密码、设置主目录和加载shell。若是没有指定主目录,将默认为根目录;若是没有指定shell,将默认为/bin/sh。在将控制转交给shell之前, getty将输出/var/log/lastlog中记录的上次登陆系统的信息,而后检查用户是否有新邮件(/usr/spool/mail/{username})。在设置好shell的uid、gid,以及TERM,PATH 等环境变量之后,进程加载shell,login的任务也就完成了。
八.bash
运行级别3下的用户login之后,将启动一个用户指定的shell,如下以/bin/bash为例继续咱们的启动过程。
bash是Bourne Shell的GNU扩展,除了继承了sh的全部特色之外,还增长了不少特性和功能。由login启动的bash是做为一个登陆shell启动的,它继承了getty设置的TERM、PATH等环境变量,其中PATH对于普通用户为"/bin:/usr/bin:/usr/local/bin",对于root 为"/sbin:/bin:/usr/sbin:/usr/bin"。做为登陆shell,它将首先寻找/etc/profile 脚本文件,并执行它;而后若是存在~/.bash_profile,则执行它,不然执行 ~/.bash_login,若是该文件也不存在,则执行~/.profile文件。而后bash将做为一个交互式shell执行~/.bashrc文件(若是存在的话),不少系统中,~/.bashrc都将启动 /etc/bashrc做为系统范围内的配置文件。
当显示出命令行提示符的时候,整个启动过程就结束了。此时的系统,运行着内核,运行着几个核心线程,运行着init进程,运行着一批由rc启动脚本激活的守护进程(如 inetd等),运行着一个bash做为用户的命令解释器。
附:XDM方式登陆
若是缺省运行级别设为5,则系统中不光有1-6个getty监听着文本终端,还有启动了一个XDM的图形登陆窗口。登陆过程和文本方式差很少,也须要提供用户名和口令,XDM 的配置文件缺省为/usr/X11R6/lib/X11/xdm/xdm-config文件,其中指定了 /usr/X11R6/lib/X11/xdm/xsession做为XDM的会话描述脚本。登陆成功后,XDM将执行这个脚本以运行一个会话管理器,好比gnome-session等。
除了XDM之外,不一样的窗口管理系统(如KDE和GNOME)都提供了一个XDM的替代品,如gdm和kdm,这些程序的功能和XDM都差很少。