Жил был linux-6.3.6 с замечательной вайфай-карточкой intel ax200. Вдруг ни с того ни с сего на 20ых сутках аптайма вайфайка перестала работать:
Jul 03 02:40:09 [kernel] [1717525.431120] iwlwifi 0000:02:00.0: Queue 3 is stuck 185 154
Jul 03 02:40:09 [kernel] [1717525.448160] ------------[ cut here ]------------
Jul 03 02:40:09 [kernel] [1717525.448162] Timeout waiting for hardware access (CSR_GP_CNTRL 0xffffffff)
Jul 03 02:40:09 [kernel] [1717525.448190] WARNING: CPU: 7 PID: 0 at drivers/net/wireless/intel/iwlwifi/pcie/trans.c:2170 __iwl_trans_pcie_grab_nic_access+0x146/0x150 [iwlwifi]
...
Jul 03 02:40:09 [kernel] [1717525.448443] ---[ end trace 0000000000000000 ]---
Jul 03 02:40:09 [kernel] [1717525.448445] iwlwifi 0000:02:00.0: iwlwifi transaction failed, dumping registers
...
Jul 03 02:40:09 [kernel] [1717525.448554] iwlwifi 0000:02:00.0: Read failed at 0x100
...
Jul 03 02:42:19 [kernel] [1717655.351087] iwlwifi 0000:02:00.0: Error sending STATISTICS_CMD: time out after 2000ms.
Jul 03 02:42:19 [kernel] [1717655.351094] iwlwifi 0000:02:00.0: Current CMD queue read_ptr 185 write_ptr 186
Jul 03 02:42:19 [kernel] [1717655.385332] ------------[ cut here ]------------
Jul 03 02:42:19 [kernel] [1717655.385334] WARNING: CPU: 5 PID: 10398 at drivers/net/wireless/intel/iwlwifi/iwl-trans.h:1422 iwl_fwrt_dump_lmac_error_log+0x493/0x550 [iwlwifi]
...
Jul 03 02:42:19 [kernel] [1717655.385612] ---[ end trace 0000000000000000 ]---
Jul 03 02:42:19 [kernel] [1717655.385614] iwlwifi 0000:02:00.0: HW error, resetting before reading
Jul 03 02:42:19 [kernel] [1717655.410378] iwlwifi 0000:02:00.0: Loaded firmware version: 74.a5e9588b.0 cc-a0-74.ucode
...
Jul 03 02:42:19 [kernel] [1717655.513787] ieee80211 phy0: Hardware restart was requested
Подобное с этой сетевухой уже бывало много раз, и раньше оно самочинилось спустя несколько десятков секунд. Но в этот раз дело застопорилось, и даже попытки выяснить чёт у iwconfig лишь подвисали:
Jul 03 02:42:39 [kernel] [1717675.221671] iwlwifi 0000:02:00.0: WRT: Failed to dump region: id=2, type=11
Jul 03 02:42:39 [kernel] [1717675.323813] iwlwifi 0000:02:00.0: Failed to get monitor header
Jul 03 02:42:39 [kernel] [1717675.323817] iwlwifi 0000:02:00.0: WRT: Failed to fill region header: id=16, type=2
Лан, думаю, s2ram должен резетнуть карточку:
Jul 03 02:42:48 [kernel] [1717677.213244] Freezing user space processes
Jul 03 02:42:48 [kernel] [1717678.390709] iwlwifi 0000:02:00.0: Error, can not clear persistence bit
Jul 03 02:42:48 [kernel] [1717678.390715] iwlwifi 0000:02:00.0: mac start retry 0
Jul 03 02:42:48 [kernel] [1717678.390718] ------------[ cut here ]------------
Jul 03 02:42:48 [kernel] [1717678.390719] Hardware became unavailable during restart.
...
Jul 03 02:42:48 [kernel] [1717678.392021] wlan0: Failed check-sdata-in-driver check, flags: 0x0
...
Jul 03 02:42:48 [kernel] [1717678.397515] Freezing remaining freezable tasks completed (elapsed 0.001 seconds)
А хуй там:
Jul 03 02:43:15 [kernel] [1717707.378876] iwlwifi 0000:02:00.0: Error, can not clear persistence bit
Jul 03 02:43:15 [kernel] [1717707.378881] iwlwifi 0000:02:00.0: mac start retry 0
Jul 03 02:43:15 [kernel] [1717707.378889] iwlwifi 0000:02:00.0: Error, can not clear persistence bit
Jul 03 02:43:15 [kernel] [1717707.378890] iwlwifi 0000:02:00.0: mac start retry 1
Jul 03 02:43:15 [kernel] [1717707.378897] iwlwifi 0000:02:00.0: Error, can not clear persistence bit
Jul 03 02:43:15 [kernel] [1717707.378898] iwlwifi 0000:02:00.0: mac start retry 2
Ладно, думаю, пойду модуль перезагружу:
Jul 03 02:43:43 [kernel] [1717734.678478] iwlwifi 0000:02:00.0: Detected Intel(R) Wi-Fi 6 AX200 160MHz, REV=0x340
Jul 03 02:43:43 [kernel] [1717734.678542] thermal thermal_zone3: failed to read out thermal zone (-61)
Jul 03 02:43:43 [kernel] [1717734.678552] iwlwifi 0000:02:00.0: Error, can not clear persistence bit
Ух, чёт серьёзное. Может, чёт отвалилось? Ухожу в s2disk, разбираю ноут, шатаю карточку в разъёме, собираю, загружаюсь:
Jul 03 02:50:02 [kernel] [1718032.574838] Intel(R) Wireless WiFi driver for Linux
Jul 03 02:50:02 [kernel] [1718032.586331] iwlwifi 0000:02:00.0: enabling device (0400 -> 0402)
Jul 03 02:50:02 [kernel] [1718032.586414] iwlwifi 0000:02:00.0: HW_REV=0xFFFFFFFF, PCI issues?
Jul 03 02:50:02 [kernel] [1718032.586480] iwlwifi: probe of 0000:02:00.0 failed with error -5
Всё, думаю, пиздец карточке. Достаю usb wifi, пересаживаюсь на него, в робкой надежде на проблемы с ядром утягиваю 6.4.1, собираю, загружаюсь в него. Всё работает. Покупайте лучшие в мире продукты корпорации Intel.
При всём при этом встроенный на ту же карточку bluetooth-адаптер, сидящий на usb-интерфейсе minipcie, всё это время функционировал (ну, хотя бы отзывался, работоспособность самого радиоинтерфейса я не проверял).
Плохо написанный анальный зонд при неработоспособности сервера вешает прошивку. С новой версией ему пришло обновление.