Ubuntu 18.04.4が頻繁にフリーズする


あらすじ

自作PCにGPUを乗っけてから頻繁にフリーズするようになったので、ためしたことをメモ。

状況

起動は普通にできるのだが、しばらく使っていると突然(数日おきくらいに)突然フリーズし、入力を受け付けなくなる。
外部からのSSH接続もできず、電源長押しで強制シャットダウンするしかない。
ログを取って確認したが、CPU温度やメモリ使用量も正常。
sysrq+r+e+i+s+u+bも効かないので、カーネルが死んでいる?どうもカーネルパニックを起こしてるような気がする。
(参考:http://ukituriboku8136.blog.fc2.com/blog-entry-273.html)

やったこと

  • grub設定を変更する:Ubuntuのバグを踏んで似たような状況に陥っている可能性があるので、設定を変更した。GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"-->GRUB_CMDLINE_LINUX_DEFAULT="quiet splash intel_idle.max_cstate=1"
  • カーネルパニック時に再起動するように設定/etc/sysctl.confkernel.panic = 10を追記、sudo sysctl -pで反映。
  • sysrqを有効化:sysrq+r+e+i+s+u+bすら受け付けなかったのだが、もしかしてsysrqが無効になっていたからでは?(一応/proc/sys/kernel/sysrqはデフォルトの176に設定されており、sysrq+Bは有効のはずだが)、ということで、/etc/sysctl.confkernel.sysrq = 1のコメントアウトを外す。ついでにこれでsysrq+cが有効になるので、意図的にカーネルパニックを起こして正しく再起動されるかテストした。

その後

うまくいってくれるといいのだが……