- 相關(guān)推薦
Linux系統(tǒng)故障排查和解決方法
Linux系統(tǒng)在啟動(dòng)過(guò)程中會(huì)出現(xiàn)一些故障,導(dǎo)致系統(tǒng)無(wú)法正常啟動(dòng),我在這里寫了幾個(gè)應(yīng)用單用戶模式、GRUB命令操作、Linux救援模式的故障修復(fù)案例幫助大家了解此類問(wèn)題的解決。
(一)單用戶模式
Linux系統(tǒng)提供了單用戶模式(類似Windows安全模式),可以在最小環(huán)境中進(jìn)行系統(tǒng)維護(hù)。在單用戶模式(運(yùn)行級(jí)別1)中,Linux引導(dǎo)進(jìn)入根shell,網(wǎng)絡(luò)被禁用,只有少數(shù)進(jìn)程運(yùn)行。單用戶模式可以用來(lái)修改文件系統(tǒng)損壞、還原配置文件、移動(dòng)用戶數(shù)據(jù)等。
以下列舉了幾個(gè)單用戶模式修復(fù)系統(tǒng)故障的典型案例:
案例一:root密碼忘記
在單用戶模式中,Linux不需要root密碼(Red Hat系統(tǒng)不需要root密碼,但SuSe則需要,不同Linux系統(tǒng)稍有差別,本文以Fedora Core6為例講解),這使更改root密碼非常容易。了解當(dāng)系統(tǒng)引導(dǎo)進(jìn)入多用戶模式失敗時(shí),如何進(jìn)入單用戶模式,非常重要。
1、在系統(tǒng)啟動(dòng)過(guò)程中,會(huì)出現(xiàn)開始界面,按任意鍵,進(jìn)入GRUB菜單選項(xiàng)。(若希望以后無(wú)此提示,直接進(jìn)入GRUB菜單選項(xiàng),刪除配置文件grub.conf中“hiddenmenu”項(xiàng)即可。)
2、按“e”鍵編輯GRUB引導(dǎo)菜單選項(xiàng),按“e”鍵后的GRUB屏幕。通過(guò)箭頭鍵下移到kernel行,并按“e”鍵。
3、在尾行光標(biāo)處添加single,按回車鍵返回前一個(gè)屏幕,按“b”鍵進(jìn)行引導(dǎo),則系統(tǒng)自動(dòng)進(jìn)入單用戶模式,如果要改變r(jià)oot密碼,則執(zhí)行命令:sh-3.1#passwd root
更改成功后,執(zhí)行命令exit退出重啟即可。
大家可以在單用戶模式中去糾正阻止系統(tǒng)正常啟動(dòng)的很多問(wèn)題,比如:
1、禁用可能中止系統(tǒng)運(yùn)行的服務(wù)如禁用Samba服務(wù),則執(zhí)行:sh-3.1#chkconfig smb off下次系統(tǒng)引導(dǎo)就不會(huì)啟動(dòng)Samba服務(wù)了。
2、更改系統(tǒng)缺省運(yùn)行級(jí)如果X Window無(wú)法啟動(dòng)或者出現(xiàn)故障,可以編輯/etc/inittab文件,采用文本方式登錄,更改initdefault引導(dǎo)級(jí)別為3:id:3:initdefault:
案例二:硬盤扇區(qū)錯(cuò)亂
在啟動(dòng)過(guò)程中最容易遇到的問(wèn)題就是硬盤可能有壞道或扇區(qū)錯(cuò)亂(數(shù)據(jù)損壞)的情況,這種情況多由于異常斷電、不正常關(guān)機(jī)導(dǎo)致。
此種問(wèn)題發(fā)生,在系統(tǒng)啟動(dòng)的時(shí)候,屏幕會(huì)顯示:Press root password or ctrl+D:
此時(shí)輸入root密碼系統(tǒng)自動(dòng)進(jìn)入單用戶模式,輸入:fsck-y/dev/hda6
(fsck為文件系統(tǒng)檢測(cè)修復(fù)命令,“-y”設(shè)定檢測(cè)到錯(cuò)誤自動(dòng)修復(fù),/dev/hda6為發(fā)生錯(cuò)誤的硬盤分區(qū),請(qǐng)依據(jù)具體情況更改此參數(shù))
系統(tǒng)修復(fù)完成后,用命令“reboot”重新啟動(dòng)即可。
案例三、GRUB選項(xiàng)設(shè)置錯(cuò)誤
“Error 15”顯示系統(tǒng)無(wú)法找到grub.conf中指定的內(nèi)核。
GRUB引導(dǎo)錯(cuò)誤信息,我們觀察發(fā)現(xiàn)因?yàn)榇蜃皱e(cuò)誤,內(nèi)核文件的“vmlinuz”打成了“vmlinux”,所以系統(tǒng)無(wú)法找到內(nèi)核的可執(zhí)行文件。
我們可以按任意鍵回到GRUB編輯界面,修改此錯(cuò)誤,回車保存后按“b”鍵即可正常引導(dǎo),當(dāng)然不要忘記進(jìn)入系統(tǒng)后修改grub.conf文件中此處錯(cuò)誤。
這是很多初學(xué)Linux的用戶在修改GRUB設(shè)置時(shí)很容易犯的錯(cuò)誤,出現(xiàn)此黑屏提示時(shí)注意觀察報(bào)錯(cuò)信息,即可針對(duì)性修復(fù)。
(二)GRUB引導(dǎo)故障排除
我發(fā)現(xiàn)有時(shí)Linux啟動(dòng)后會(huì)直接進(jìn)入GRUB命令行界面(只有“grub>”提示符),此時(shí)很多用戶就選擇了重新安裝GRUB甚至重新安裝系統(tǒng)。
其實(shí)一般而言此故障的原因最常見的有兩個(gè):
一是GRUB配置文件中選項(xiàng)設(shè)置錯(cuò)誤;
二是GRUB配置文件丟失(還有少數(shù)原因,如內(nèi)核文件或鏡像文件損壞、丟失,/boot目錄誤刪除等)
如果是第一種情況,可以首先通過(guò)GRUB命令引導(dǎo)系統(tǒng)后修復(fù);若是第二種情況,則要使用Linux救援模式修復(fù)了。
首先,我們需要了解GRUB啟動(dòng)系統(tǒng)的引導(dǎo)過(guò)程,grub.conf文件中主要的配置選項(xiàng)如下:
(注意,GRUB配置文件為/boot/grub/grub.conf,/etc/grub.conf只是此文件的軟鏈接)
title Fedora Core(2.6.18-1.2798.fc6)
root(hd0,0)
kernel/boot/vmlinuz-2.6.18-1.2798.fc6 ro root=LABEL=/rhgb quiet initrd/boot/initrd-2.6.18-1.2798.fc6.img
其中:
“title”段指定了GRUB引導(dǎo)的系統(tǒng):
“root”段指定了/boot分區(qū)所在的位置:
“kernel”段指定了內(nèi)核文件所在位置,內(nèi)核加載時(shí)權(quán)限屬性為只讀(“ro”)以及指定根分區(qū)所在位置(root=LABEL=/);
“initrd”指定了鏡像文件所在位置。
所以GRUB在引導(dǎo)時(shí)順序?yàn)槭紫燃虞d/boot分區(qū),然后依次載入內(nèi)核與鏡像文件。
案例
“title Fedora Core(2.6.18-1.2798.fc6)”段被誤刪除
此時(shí),系統(tǒng)啟動(dòng)后會(huì)自動(dòng)進(jìn)入“GRUB>”命令行,為排除故障我們可以依次做如下操作:
1、查找/boot/grub/grub.conf文件所在分區(qū)GRUB>find/boot/grub/grub.conf(hd0,0)
2、查看grub.conf文件錯(cuò)誤GRUB>cat(hd0,0)/boot/grub/grub.conf建議系統(tǒng)安裝設(shè)置好后,要將grub.conf文件備份,如果有備份文件如grub.conf.bak,則此時(shí)可以查看備份文件,與當(dāng)前文件比較,發(fā)現(xiàn)錯(cuò)誤:GRUB>cat(hd0,0)/boot/grub/grub.conf.bak
3、確認(rèn)錯(cuò)誤后,先通過(guò)命令行方式完成GRUB引導(dǎo),進(jìn)入系統(tǒng)后再行修復(fù)grub.conf文件錯(cuò)誤:
1)指定/boot分區(qū)root(hd0,0)
2)指定內(nèi)核加載kernel/boot/vmlinuz-2.6.18-1.2798.fc6 ro root=LABEL=/rhgb quiet
3)指定鏡像文件所在位置initrd/boot/initrd-2.6.18-1.2798.fc6.img
提示:GRUB支持tab鍵命令補(bǔ)全功能
4、從/boot分區(qū)啟動(dòng)boot(hd0,0)
命令行模式可以在GRUB菜單模式中通過(guò)按“c”鍵調(diào)用,也可以用于測(cè)試新編譯的內(nèi)核(設(shè)置kernel、initrd引導(dǎo)新內(nèi)核及鏡像文件)。增加對(duì)GRUB引導(dǎo)以及Linux系統(tǒng)引導(dǎo)知識(shí)的了解將對(duì)此類故障排除大有幫助。
(三)Linux救援模式應(yīng)用
當(dāng)系統(tǒng)連單用戶模式都無(wú)法進(jìn)入時(shí)或出現(xiàn)GRUB命令行也不能解決的引導(dǎo)問(wèn)題,我們就需要使用Linux救援模式來(lái)進(jìn)行故障排除了。
步驟如下:
1、將Linux安裝光盤(如果使用CD光盤,則放入第一張引導(dǎo)光盤)放入光驅(qū),設(shè)置固件CMOS/BIOS為光盤引導(dǎo),當(dāng)Linux安裝畫面出現(xiàn)后,在“boot:”提示符后輸入“l(fā)inux rescue”回車進(jìn)入救援模式。(想了解救援模式詳細(xì)信息,還可以按F5鍵查看)
2、系統(tǒng)會(huì)檢測(cè)硬件,引導(dǎo)光盤上的Linux環(huán)境,依次提示你選擇救援模式下使用的語(yǔ)言(建議選擇默認(rèn)的英文即可,根據(jù)筆者測(cè)試,部分Linux系統(tǒng)選擇中文會(huì)出現(xiàn)亂碼);鍵盤設(shè)置用默認(rèn)的“us”就好;網(wǎng)絡(luò)設(shè)置可以根據(jù)需要,大部分故障修復(fù)不需要網(wǎng)絡(luò)連接,可不進(jìn)行此項(xiàng)設(shè)置,選擇“No”。
3、接下來(lái)系統(tǒng)將試圖查找根分區(qū),出現(xiàn)掛載提示,設(shè)置默認(rèn)在救援模式,硬盤的根分區(qū)將掛載到光盤Linux環(huán)境的/mnt/sysimage目錄下,默認(rèn)選項(xiàng)“continue”表示掛載權(quán)限為讀寫:“Read-only”為只讀,如果出現(xiàn)檢測(cè)失敗可以選擇“skip”跳過(guò)。此處,因?yàn)橐獙?duì)系統(tǒng)進(jìn)行修復(fù),所以需要有讀寫權(quán)限,一般選擇默認(rèn)選項(xiàng)“continue”。
進(jìn)入下一步后,系統(tǒng)提示執(zhí)行“chroot/mnt/sysimage”命令,可以將根目錄掛載到我們硬盤系統(tǒng)的根目錄中去。
案例一:雙系統(tǒng)啟動(dòng)修復(fù)
當(dāng)我們安裝雙系統(tǒng)環(huán)境,先安裝Linux再安裝Windows;或者已經(jīng)安裝好雙系統(tǒng)環(huán)境的Windows損壞,在重新安裝Windows后,保存GRUB的MBR(Master Boot Record,主引導(dǎo)記錄)會(huì)被Windows系統(tǒng)的自舉程序NTLDR所覆蓋,造成Linux系統(tǒng)無(wú)法引導(dǎo)。
1、如果要恢復(fù)雙系統(tǒng)引導(dǎo),首先用上述方法進(jìn)入救援模式,執(zhí)行chroot命令如下:sh-3.1# chroot/mnt/sysimage
2、將根目錄切換到硬盤系統(tǒng)的根目錄中,然后執(zhí)行g(shù)rub-install命令重新安裝GRUB:sh-3.1# grub-install/dev/hda“/dev/hda”為硬盤名稱,如使用SCSI硬盤或Linux安裝在第二塊IDE硬盤,此項(xiàng)設(shè)置要做相應(yīng)調(diào)整。
3、然后依次執(zhí)行exit命令,退出chroot模式及救援模式(執(zhí)行兩次exit命令):sh-3.1# exit系統(tǒng)重啟后,將恢復(fù)GRUB引導(dǎo)的雙系統(tǒng)啟動(dòng)。
案例二:系統(tǒng)配置文件丟失修復(fù)
系統(tǒng)在引導(dǎo)期間,很重要的一個(gè)過(guò)程就是init進(jìn)程讀取其配置文件/etc/inittab,啟動(dòng)系統(tǒng)基本服務(wù)程序及默認(rèn)運(yùn)行級(jí)別的服務(wù)程序完成系統(tǒng)引導(dǎo),如果/etc/inittab誤刪除或修改錯(cuò)誤,Linux將無(wú)法正常啟動(dòng)。此時(shí),只有通過(guò)救援模式才可以解決此類問(wèn)題。
/etc/inittab文件丟失引導(dǎo)錯(cuò)誤示例
1、有備份文件的恢復(fù)辦法進(jìn)入救援模式,執(zhí)行chroot命令后,如果有此文件的備份(強(qiáng)烈建議系統(tǒng)中的重要數(shù)據(jù)目錄,如/etc、/boot等要進(jìn)行備份),直接將備份文件拷貝回去,退出重啟即可。
如果是配置文件修改錯(cuò)誤,如比較典型的/boot/grub/grub.conf及/etc/passwd的文件修改錯(cuò)誤,也可以直接修正恢復(fù)。
假設(shè)有備份文件/etc/inittab.bak,則在救援模式下執(zhí)行:sh-3.1#chroot/mnt/sysimage sh-3.1# cp/etc/inittab.bak/etc/inittab
2、沒(méi)有備份文件的恢復(fù)辦法如果一些配置文件丟失或軟件誤刪除,且無(wú)備份,可以通過(guò)重新安裝軟件包來(lái)恢復(fù)。
首先查找到/etc/inittab屬于哪一個(gè)RPM包(即便文件丟失,因?yàn)榇嬖赗PM數(shù)據(jù)庫(kù),一樣可以查找到結(jié)果):
sh-3.1#chroot/mnt/sysimage sh-3.1#rpm-qf/etc/inittab initscripts-8.45.3-1
退出chroot模式:
sh-3.1#exit
掛載存放RPM包的安裝光盤(在救援模式下,光盤通常掛載在/mnt/source目錄下):
sh-3.1#mount/dev/hdc/mnt/source
Fedora系統(tǒng)的RPM包存放在光盤Fedora/RPMS目錄下,其他Linux存放位置大同小異,我在這里不一一列舉;
另外,因?yàn)橐迯?fù)的硬盤系統(tǒng)的根目錄在/mnt/sysimage下,需要使用——root選項(xiàng)指定其位置。
覆蓋安裝/etc/inittab文件所在的RPM包:
sh-3.1#rpm-ivh——replacepkgs——root/mnt/sysimage/mnt/source/Fedora/RPMS/ initscripts-8.45.3-1.i386.rpm
其中的rpm命令選項(xiàng)“——replacepkgs”表示覆蓋安裝,執(zhí)行完成后,即已經(jīng)恢復(fù)了此文件。
如果想只提取RPM包中的/etc/inittab文件進(jìn)行恢復(fù),可以在進(jìn)入救援模式后,執(zhí)行命令:
sh-3.1#rpm2cpio/mnt/source/Fedora/RPMS/initscripts-8.45.3-1.i386.rpm|cpio-idv ./etc/inittab sh-3.1#cp etc/inittab/mnt/sysimage/etc
注意此命令執(zhí)行時(shí)不能將文件直接恢復(fù)至/etc目錄,只能提取到當(dāng)前目錄下,且恢復(fù)的文件名稱所在路徑要寫完整的絕對(duì)路徑。提取文件成功后,將其復(fù)制到根分區(qū)所在的/mnt/sysimage目錄下相應(yīng)位置即可。
救援模式是維護(hù)Linux的有力武器,本文以上述兩個(gè)例子講解了它的應(yīng)用方法,希望能夠給讀者一點(diǎn)啟示。解決Linux系統(tǒng)啟動(dòng)的故障,必須充分理解Linux的引導(dǎo)過(guò)程,才能夠?qū)收线M(jìn)行有效的判斷和處理。
擴(kuò)展:使用Linux系統(tǒng)常見的問(wèn)題
1、在不登錄情況下,獲得root權(quán)限
如果沒(méi)有設(shè)置GRUB密碼,那我們可以使用最簡(jiǎn)單的方法,首先啟動(dòng)電腦,等待GRUB菜單,如果GRUB菜單隱藏,可以按Esc調(diào)出,選擇Ubuntu,kernel 2.6.12-*-*(recovery mode),也就是“恢復(fù)模式”按Enter啟動(dòng)就可以了。
另外一個(gè)辦法是用Ubuntu安裝盤獲得root權(quán)限,用Ubuntu安裝盤啟動(dòng)電腦,當(dāng)顯示“boot:”時(shí),輸入“rescue”
boot:rescue
按屏幕提示操作就可以了。
2、通過(guò)改變內(nèi)核啟動(dòng)參數(shù)獲得根權(quán)限
啟動(dòng)電腦,等待GRUB菜單,如果GRUB菜單隱藏,可以按Esc調(diào)出,如果設(shè)置了GRUB密碼,按p來(lái)解鎖,比如我們選擇了Ubuntu,kernel 2.6.12-8-386,按e在啟動(dòng)前編輯啟動(dòng)參數(shù),選擇kernel/boot/vmlinuz-2.6.12-8-386 root=/dev/hda 2ro quiet splash,按e編輯選定的啟動(dòng)菜單項(xiàng),在參數(shù)最后添加rw init=/bin/bash,即改為如下命令行:
grub edit>kernel/boot/vmlinuz-2.6.12-8-386 root=/dev/hda2 ro quiet splash rw init=/bin/bash
按b啟動(dòng)即可。
3、忘記了root用戶/主用戶密碼
按照第一項(xiàng):在不登錄情況下,獲得root權(quán)限后,在命令行輸入:
passwd root
按照提示,輸入兩次密碼就可以設(shè)定root用戶密碼了,
要更改主用戶密碼:
passwd system_main_username
按照提示,輸入兩次密碼就可以了。
4、忘記了GRUB菜單密碼
在命令行輸入
grub
等提示符變?yōu)間rub>后,輸入:
md5crypt
這是計(jì)算密碼的md5值,也就是加密值,然后在提示Password:后,輸入新密碼:
Password:******(ubuntu)
系統(tǒng)會(huì)計(jì)算出加密值:
Encrypted:$1$ZWnke0$1fzDBVjUcT1Mpdd4u/T961
按quit退出,
quit
然后備份并編輯文件menu.lst:
sudo cp/boot/grub/menu.lst/boot/grub/menu.lst_backup
sudo gedit/boot/grub/menu.lst
找到
...
password --md5 $1$gLhU0/$aW78kHK1QfV3P2b2znUoe/
...
替換為
password --md5 $1$ZWnke0$1fzDBVjUcT1Mpdd4u/T961(這是我們上面計(jì)算出的加密值)
保存文件即可。
5、在安裝Windows后恢復(fù)GRUB啟動(dòng)菜單
經(jīng)常出現(xiàn)的情況是,我們想重裝一下windows系統(tǒng),但是重裝會(huì)把啟動(dòng)Linux的菜單沖掉,這是個(gè)讓人頭疼的問(wèn)題,我們這樣來(lái)解決它:
首先按照第一項(xiàng),用Ubuntu安裝盤獲得root權(quán)限,我們假定/dev/hda為/boot所在分區(qū),然后在提示符輸入:
#grub-install/dev/hda
這樣grub-install程序會(huì)為我們安裝grub菜單。
6、在Windows中讀取Linux分區(qū)(ext2,ext3)
我們用軟件Ext2fs可以在Windows中讀取Linux分區(qū),軟件官方首頁(yè):http://www.fs-driver.org/,下載地址是:http://www.fs-driver.org/download/Ext2IFS_1_10b.exe程序
7、開機(jī)時(shí),某些服務(wù)啟動(dòng)太慢
比如Configuring network interfaces...和Synchronizing clock to ntp.ubuntulinux.org...可能要長(zhǎng)時(shí)間才能啟動(dòng),對(duì)于這些服務(wù),我們可以用Ctrl+C在啟動(dòng)時(shí)暫時(shí)跳過(guò)一些服務(wù)的啟動(dòng)
也可以運(yùn)行服務(wù)設(shè)置:系統(tǒng)->系統(tǒng)管理->服務(wù),清除勾選“時(shí)鐘同步服務(wù)(ntpdate)”等服務(wù),然后 確定。
8、把系統(tǒng)時(shí)間從UTC(GMT)改回來(lái)
如果你裝linux系統(tǒng)時(shí),設(shè)置啟用UTC(GMT),那么每當(dāng)重啟到了我的windws分區(qū),系統(tǒng)時(shí)間總是和本地時(shí)間有N小時(shí)的誤差。在Ubuntu下我這樣解決這個(gè)問(wèn)題呢。
編輯文件/etc/default/rcS,在命令行輸入:
sudo cp/etc/default/rcS/etc/default/rcS_backup
sudo gedit/etc/default/rcS
找到
...
UTC=yes
...
替換為
UTC=no
保存文件,在系統(tǒng)->系統(tǒng)管理->日期和時(shí)間中,設(shè)置為正確的日期和時(shí)間,
在命令行輸入下面的命令重啟時(shí)間:
sudo/etc/init.d/hwclock.sh restart
9、給Flash配置聲音
如果你播放Flash是沒(méi)有聲音,在命令行輸入這個(gè)命令:
sudo ln -fs/usr/lib/libesd.so.0/usr/lib/libesd.so.1
10、強(qiáng)制清空回收站
如果你點(diǎn)了清空回收站,但還是有垃圾的話,你可以運(yùn)行這個(gè)命令:
sudo rm -fr $HOME/.Trash/
Ubuntu Linux的回收站就是一個(gè)隱藏文件夾,在主目錄的.Trash/下,rm-fr命令的意思是強(qiáng)制、遞歸的刪除。
11、清除GNOME菜單中的重復(fù)項(xiàng)
如果菜單中出現(xiàn)重復(fù)項(xiàng),不能像windows里一樣,直接刪去,我們要啟動(dòng)Applications Menu Editor:應(yīng)用程序->系統(tǒng)工具->Applications Menu Editor,逐個(gè)刪除重復(fù)項(xiàng)即可
【Linux系統(tǒng)故障排查和解決方法】相關(guān)文章:
Linux 系統(tǒng)故障排查和修復(fù)技巧04-10
Linux中ftp連接530錯(cuò)誤的解決方法07-31
Linux磁盤故障導(dǎo)致系統(tǒng)運(yùn)行緩慢的解決方法07-20
linux中pagbuffer和cache的區(qū)別06-13
Linux系統(tǒng)命令和使用技巧04-10
安裝和使用Linux CURL的方法02-07
Linux的基礎(chǔ)命令和使用方法03-04
Unix和Linux有什么區(qū)別07-24