Nutanix LCMのFW更新関連の既知事象とトラブルシューティングについてのメモ

事象概要

Dell XCモデルにてNutanix LCMによるFW更新を実施し、問題なく完了したように見えたが、一部のFWが更新されていなかった。

再度LCM Inventoryを実施したところ、同じLCM Bundleでの再更新が必要と表示された。

そのままリトライを実施したら、今度は1度目で更新されなかったFWも更新された。

 

 

関連KB

以下のKBに事象と思われる。(ログ出力が一致した)

https://portal.nutanix.com/page/documents/kbs/details?targetId=kA07V000000H6G3SAK

 

対処

ログを見る限りはNutanix LCM側の問題と考えられるため、LCM Update後にもう一度インベントリを実行して、更新がある(Need Update)と表示された場合は再度LCMを実行するのが良い。

iDRAC側のログを見る限りは該当FWUpdateがそもそもNutanix LCM側から依頼されておらず、

XC専用のLCM関連スクリプト(get_update_list.py)は、Upgrade未実施のコンポーネントを正常に返答しているが、Nutanix LCM側が未実施のままLCM処理を終了してしまっている状態なので、将来のリリースでの改善を期待したい。

 

トラブルシューティングで利用したコマンドやログなど

コマンド

用途

補足

CVM$ lcm_leader

LCMリーダーを特定する

ログファイル参照などの以降の操作はLCMリーダーのCVMで実施する

CVM$ lcm_upgrade_status

LCM Updateの履歴を確認する

ログファイルのどの時間帯を見ればいいかの判断基準にもなる

CVM$ cd /home/nutanix/data/logs

ログファイルのあるディレクトリに移動

 

CVM$ less lcm_ops.out

メインとなるログファイル

ログファイルのあるディレクトリで実行

CVM$ grep -rni "Candidate list is not empty" lcm*

本事象の特定

 

CVM$ grep -rni "Uploading image" lcm_*

UpdateされてFWコンポーネントを確認

XCモデルはidracFWファイルがUploadされている

CVM$ grep -rni 'GET - https://169.254.0.1/redfish/v1/UpdateService/FirmwareInventory/Installed-' lcm_* | less

当時のFWバージョンの取得

更新前後のFWバージョンの取得が可能

 

 

 

 

コメント

このブログの人気の投稿

(Nutanix)Dell XC モデルのアップグレード準備メモ(LTS 6.5.x -> 6.10)

Dell XC モデルのFirmware更新(LTS 6.10)

NutanixサイザーのCPUリソース計算について調べたこと