KAKIMASSE

ネットで見つけた面白い記事や、役立つのではと感じたネタなどを書いています。

CentOS:ネットワーク関係が何故かカーネルパニックでフリーズしてしまう。

      2011/01/12

昨日からずーっとこれでハマってました (泣
現象は
・ADSLに接続するとフリーズ。
・一度フリーズしてしまって電源断で再起動するとLANにも繋がらない。
・その状態で再起動すると以下のエラーを出力してフリーズする。
・OSを再インストールしても同じ。
・サーバ機を交換して同じ手順でサーバ構築しても一緒。
■ /var/log/messages 抜粋

Sep 24 19:56:23 localhost kernel: *pde = 37f2e067
Sep 24 19:56:23 localhost kernel: Oops: 0000 [#1]
Sep 24 19:56:23 localhost kernel: Modules linked in: parport_pc lp parport autofs4 i2c_dev i2c_core sunrpc ip_conntrack cpufreq_powersave ib_srp ib_sdp ib_ipoib rdma_ucm rdma_cm iw_cm ib_addr ib_umad ib_ucm ib_uverbs ib_cm ib_sa ib_mad ib_core dm_mirror dm_mod button battery ac md5 ipv6 joydev uhci_hcd ehci_hcd i3000_edac edac_mc hw_random tg3 ext3 jbd ata_piix libata sd_mod scsi_mod
Sep 24 19:56:23 localhost kernel: CPU: 0
Sep 24 19:56:23 localhost kernel: EIP: 0060:[] Not tainted VLI
Sep 24 19:56:23 localhost kernel: EFLAGS: 00010212 (2.6.9-78.0.1.EL)
Sep 24 19:56:23 localhost kernel: EIP is at nf_unregister_sockopt+0x47/0x81
Sep 24 19:56:23 localhost kernel: eax: 00000002 ebx: c03a2020 ecx: c0dbfb80 edx: f8ae8160
Sep 24 19:56:23 localhost kernel: esi: f8b2e380 edi: 00000000 ebp: d3c4c000 esp: d3c4cf5c
Sep 24 19:56:23 localhost kernel: ds: 007b es: 007b ss: 0068
Sep 24 19:56:23 localhost kernel: Process modprobe (pid: 5111, threadinfo=d3c4c000 task=d3a771a0)
Sep 24 19:56:23 localhost kernel: Stack: 00000000 c037d800 f8b25732 f8b2e880 c014030d 00000000 635f7069 746e6e6f
Sep 24 19:56:23 localhost kernel: 6b636172 00000000 d341db40 b7ffa000 b7ffb000 c01602d6 d341db40 d4d49cf0
Sep 24 19:56:23 localhost kernel: c016067b d4d49900 d341db40 d341db70 00000000 d3c4c000 0955fae0 00000000
Sep 24 19:56:23 localhost kernel: Call Trace:
Sep 24 19:56:23 localhost kernel: [] init_or_cleanup+0x1e6/0x1ea [ip_conntrack]
Sep 24 19:56:23 localhost kernel: [] sys_delete_module+0x139/0x180
Sep 24 19:56:23 localhost kernel: [] unmap_vma_list+0xe/0x17
Sep 24 19:56:23 localhost kernel: [] do_munmap+0x1a7/0x1b1
Sep 24 19:56:23 localhost kernel: [] syscall_call+0x7/0xb
Sep 24 19:56:23 localhost kernel: Code: 17 05 00 89 d9 ff 0d 20 20 3a c0 0f 88 40 0d 00 00 8b 0d 48 20 3a c0 8b 01 0f 18 00 90 81 f9 48 20 3a c0 74 2f 8b 51 08 8b 46 08 <39> 42 08 8b 11 75 1e 8b 41 04 89 42 04 89 10 89 c8 c7 01 00 01
Sep 24 19:56:23 localhost kernel: <0>Fatal exception: panic in 5 seconds

ググってみたらまさしくなのがHIT
Bug 456664 – Kernel panic when unloading ip conntrack modules
英語なので翻訳サイトで調べながらでしたがカーネルのバージョンが 2.6.9-78や79 の場合iptablesを実行すると(?)
このパターンになるっていうバグらしいです。
確かにインストールCDのカーネル(2.6.9-67)の場合は問題ありません。
で、添付してくれているパッチを当てようかとも考えたのですが
他の問題を引き起こしてもイヤやなーと思った(面倒くさかった)ので
GRUBの起動時に選択しているデフォルトのカーネルを変更する方法を探しました。

vi /boot/grub/grub.conf
default=1  ← ここで 2.6.9-67 の順番(私の場合は1でした)を指定

これで再起動したらデフォルトのカーネルは2.6.9-67になってて無事回避出来ました´д`)ノ
ちなみに保存して再起動するときもフリーズしました。
何でもかんでも最新が良いって訳じゃないんですねー
今回は問題の切り分けにかなり時間がかかってしまいました。
英語がいっぱいで読むのが面倒だからってログをよく確認しなかった事が最大の原因ですね。反省。
あとやっぱり英語は理解できるレベルになっておきたいと思いました。

 - サーバ環境

SPONSORD LINKS

スポンサーリンク

スポンサーリンク

Comment

  1. 通りすがり より:

    SECRET: 0
    PASS: 74be16979710d4c4e7c6647856088456
    私も CentOS 4.7 で再起動時に kernel panic 起こす事に
    先ほど気が付きました。
    リモートメンテナンスだったらお手上げの所でした。
    2.6.9-78.0.1にアップデートしてから
    今まで再起動してなかった訳でして・・・
    やはり、バグだったようですね。
    私の場合は iptables ではなかったです。

Message

メールアドレスが公開されることはありません。

  関連記事

no image
CentOS:サーバ起動時に特定のサービスで止まってしまう時の対処(シングルユーザモード)

CentOSのサーバで起動時に各サービスの起動をしている中で一つのサービスのとこ ...

no image
ネットワークネタ:サーバ1台に複数のIPアドレスを割り当てたい

題記の通り、複数固定IPアドレスなどを取得した場合、 別にIPアドレス毎にサーバ ...

no image
Linuxコマンド:ファイルの中身を空にしたい

膨大になったログファイルとかいちいち削除して作成してどーのこーのするの面倒だなー ...

au携帯動画再生エラー
FFmpegで変換した3g2動画をau(ezweb)の携帯(ガラケー)で動画再生時に「再生できません(再生不可データ)」と表示されるエラーの対応方法

FFmpegで変換した3g2動画をauのガラケーで再生すると、 上の画像のエラー ...

androidのConnectBotにpoderosaの秘密鍵をインポートしてスマホからSSH接続する方法

photo credit: johncatral via photopin cc ...

no image
PEARで HTTP error, got response: HTTP/1.1 404 Not Found...と表示されるときの対処方法 

※2008/4/24追記 下記の手順では上手くいかない事がありました。 その場合 ...

Uhhuh. NMI received for unknown reason 20 on CPU 0. Do you havea a strange power saving mode enabled? と表示された時の対処方法

使っているサーバ(Dell Power Edge sc440)に突然アクセスでき ...

no image
Linux:postfixで送信されずに残っているメールキューを削除したい。

CentOS4.5でpostfixを使用している環境で 毎日メールサーバから送ら ...

no image
PEARで HTTP error, got response: HTTP/1.1 404 Not Found...と表示されるときの対処方法2

以前書いた PEARで HTTP error, got response: HT ...