linux系统启动与故障排除

一、Linux系统启动过程的大体步骤与调用过程:linux

    第一阶段:BIOS启动引导阶段,主要实现硬件的初始化以及查找启动介质,从MBR中装载启动引导管理器(GRUB)并运行该启动引导管理;shell

 

    第二阶段:GRUB引导阶段,装载statge1statge1.5statge2,读取/boot/grub.conf文件并显示启动菜单,装载所选的kernelinitrd文件到内存中;vim

 

    第三阶段:内核阶段,运行内核启动参数,解压initrd文件并挂载initrd文件系统,装载必须的驱动,挂载根文件系统;windows

 

    第四阶段:Sysinit初始化阶段,启动/sbin/init/程序,运行rc.sysinit脚本,设置系统环境,启动swap分区,检查和挂载文件系统,读取/etc/inittab文件,运行/etc/rc.d/rcn.d中定义的不一样运行级别的服务初始化脚本,打开字符终端1-6号控制台或者图形显示管理的7号控制台bash

 

启动阶段服务器

读取的文件和操做的对象运维

BIOS启动引导阶段ide

Noneui

GRUB启动引导阶段spa

/boot/grub/grub.conf

/boot/grub/statge1_5

/boot/grub/statge2

内核阶段

/boot/vmlinux-<version>

/boot/initrd-<version>

Sysinit初始化阶段

/etc/rc.d/rc.sysinit

/etc/inittab

/etc/rc.d/rc<n>.d

/etc/rc.d/init.d/*

 

二、常见的系统启动故障与排除

 

    1)、故障一:root口令丢失

当你忘记本身的root口令时,只须要在系统启动时进入单用户模式,即系统运行的0级别下便可,这个模式下不须要root的口令便可登陆,具体过程以下:

 

在引导等待的读秒结束前按下回车键:


 wKioL1WvN0zDKUiPAAB4bqLIlDw587.jpg

而后进入BIOS模式,选择须要操做的系统(若是是多系统的话),按E进入编辑模式

wKioL1WvN3DByCWcAAE3FLKKF_o771.jpg


选择内核编辑,在quiet后面输入1或者single,表示进入单用户模式,


 wKioL1WvN3rxYv-xAAHOVwKoKXM145.jpg


 而后回车返回到内核,按下B启动系统


 wKioL1WvN4aDPI2SAADUspNgvO8850.jpg

执行runlevel,能够看到已经进入单用户模式

wKiom1WvNa6RBKdGAACIghewJYQ248.jpg

修改root帐号的密码

wKiom1WvNffSM088AADRjLWnED8342.jpg

 

或者直接删除root帐号的密码

wKioL1WvN-aCMMLOAABukNlKCVE981.jpg

 

修改完成后执行init 3,进入3级别运行系统

wKioL1WvN--TpK6kAADEZGbZrgs547.jpg

而后登入系统执行runlevel,能够看到运行正常

wKioL1WvOAWz6v8UAACdQuCEQCM286.jpg

 

 

    2)、故障二:grub.conf文件被误删除

/boot/grub/grub.conf文件肩负着引导内核和驱动等的重要功能,若是在操做中不当心误删除了该文件,那么系统的在启动时会自动进入grub shell模式,你只能手动来引导内核和驱动了,通常状况下,该文件最好作一个备份,防止因为误操做删除引发系统没法启动,具体解决过程以下:

 

没有grub.conf文件时开机会进入grub shell模式:

wKioL1WvOCKhiNpTAADeUiYzr-o796.jpg

 

输入help能够查看当前模式的可用命令

wKiom1WvNkzhMzfrAALW9WKMzh0561.jpg

 

输入root 按下tab键能够看到帮助,因为系统还没有启动,因此默认硬盘为hd0

wKioL1WvOELQioRGAAAhyzHU98c630.jpg

 

输入root hd0按下tab能够查看分区

wKioL1WvOE7ioy4hAACqg1O2Ovk769.jpg

 

若是不知道系统的/boot在那个分区上,能够一个一个试试,不过要注意,安装操做系统时,/boot分区确定是ext格式的文件系统,因此这也能够做为一个区分依据

 

假如我输入root hd0,1),即选择第二个分区,输入kernel / 按下tab键,会显示当前分区下的文件,由此能够发现并无咱们引导所需的内核和驱动

wKiom1WvNnmxDUv5AABfv7o83Ao655.jpg

 

输入正确的/boot分区,输入kernel / ,按下tab键,选择内核(ro表示只读,root=表示把引导程序交给/dev/sdb2分区,即为原系统的/boot/分区)

wKiom1WvNoaR0fdEAABWJsbOqvY632.jpg

 

输入initrd / 按下tab键,选择驱动文件

wKiom1WvNqTwTL5lAADT1ismn0w687.jpg

 

输入boot重启系统

wKiom1WvNrSw_vg1AAG0AfpIHsE231.jpg

 

进入系统后,查看一下grub引导文件

wKiom1WvNsCgZXswAABoPg_5nRg950.jpg

 

没有grub.conf文件,因此下次系统启动后还须要从新手动引导,咱们能够本身编写一个grub.conf文件,方便系统启动时自动引导

[root@fcy ~]# vim /boot/grub/grub.conf
default=0                   #默认启动第一个系统
timeout=5                  #引导等待时间
hiddenmenu              #隐藏BIOS,须要在timeout计时结束前按下enter进入
title CentOS-6.5       #系统启动显示的标题信息
     root (hd0,0)          #指定引导分区
  kernel /vmlinuz-2.6.32-431.el6.i686 ro root=/dev/sda2  rhgb quiet
         #指定内核文件,ro表示只读,root=/dev/sda2引导完成后交给真正的系统根目录,rhgb表示引导时以进度条的方式显示引导过程,quiet表示静默启动,即不输出引导进程
  initrd /initramfs-2.6.32-431.el6.i686.img                    #指定驱动文件名称


若是在指定内核和驱动时不知道文件完整名称,可使用vim的底行命令来调入

按住shift输入两个!!,便可以进入底行命令模式,而后输入使用ls命令显示内核文件和驱动文件便可,支持命令补全

 

Grub.conf文件编辑文成后,从新启动系统便可

这个即为rhgb的做用

wKiom1WvNujCEFudAAAyXcjksZQ997.jpg

 

这个是timeout指定的时间,CentOS-6.5即为title

wKiom1WvNvOTyjGhAABZpy9g3To939.jpg

 

系统正常启动

wKioL1WvOOqTQnOuAACd_xwJOiQ025.jpg

 

    3)、故障三:GRUB引导的statge1丢失(即MBR446字节被覆盖)


使用命令覆盖MBR引导分区的前446字节

dd if=/dev/zero of=/dev/sda bs=446 count=1

 

重启系统,并插入光盘

wKioL1WvOR-xBv4iAAIBATwJG_I830.jpg

 

发现选项里有一个Rescure install system,这是系统的救援模式,进入救援模式

wKiom1WvN1-goI32AADpdCZ7tnc653.jpg

 救援模式下输入chroot /mnt/sysp_w_picpath,执行grub-install  /dev/sda,便可从新设置MBR

wKioL1WvOW2xSSfaAAEHWgOMwi8984.jpg

重启系统,恢复正常

 

    4)、故障四:MBR丢失

    若是只是MBR的前446字节丢失,还能够用救援模式使用grub-install从新安装,这种状况下分区表并未丢失,若是整个MBR512字节都丢失了,也就是意味着连同分区表与引导去一块没有了,为了防止这种状况出现,要提早作好MBR的备份文件

 

使用命令备份MBR文件,保存在系统本地或者远程服务器上

wKioL1WvOY7BoKrkAADJpsvw3aA768.jpg

 

一但这种状况发生了,那么救援模式叶没法拯救你的系统了,这时候咱们须要一种光盘,名为liveCD的镜像光盘,相似于windowsPE盘,是一种移动系统,启动liveCD系统后能够救援你的硬盘上的文件资源

 

装上liveCD的光盘后进入BIOS,并设置光盘启动系统,F10保存退出

wKiom1WvN7qzKtzQAAEHsgSR45c915.jpg

 

登入系统后切换root帐号,查看/dev/sda盘的信息,发现没有分区表

wKioL1WvOaqDvZzYAABUyaLhph8209.jpg

 

登陆远程服务器,拷贝mbr的备份

wKiom1WvN9LRO35KAAEqxJCdck4651.jpg

恢复备份文件到MBR

wKiom1WvN-qhGKMcAADvMQIUZWI809.jpg

 

再次查看/dev/sda的分区状况

wKioL1WvOdvxtK9EAACeReald5w761.jpg

 

能够看到,MBR已经恢复,重启系统便可

 

 

    5)、故障五:statge2丢失(即/boot目录下的grub目录丢失)

 

进入系统,删除/boot/grub

wKiom1WvOCvS2yXfAAA6eRTIHpQ568.jpg

 

重启系统后进入grub shell模式,重复故障二的步骤,手动引导系统启动

wKiom1WvODqiIXKsAADd7LQBdmk799.jpg

 

进入系统后会,使用命令重装grub,指定路径为根目录/

wKiom1WvOEOhl0t7AAE0IPH5IHM093.jpg

 

查看生成的grub目录,发现没有grub.conf文件

 wKiom1WvOFKSRHDQAAGvkbiu1pQ853.jpg

  

手工建立/boot/grub/grub.conf

wKioL1WvOkLifjB5AACioAMzQRc302.jpg

 

重启系统便可

 

三、总结

    做为一个系统运维师,熟悉linux系统的启动过程是必需的,而且可以处理最多见的系统启动故障问题。因为没有接触过真实环境的系统启动故障 ,以上排除方法只是手动模拟出来的,因此有不少欠缺,有错误和建议请指导。

相关文章
相关标签/搜索