LE社のエンジニアたちの風がふくまま気の向くまま本音コラム

保守業者との駆け引き

»

 リーディング・エッジ社の篠澤です。現在、先輩Aさんと2人でヘルプデスク業務を担当しています。今回は我々ヘルプデスクと保守業者とのやり取りについてお伝えします。

■改善しない障害

 私が担当しているシステムは、1週間に数回はAPサーバのサービスがダウンするという爆弾を抱えています。ひどい時は1日に10回ということもありました。

 最初の頃はAPサーバのサービスダウンが原因だとはわからなかったので、Web/AP/DBサーバ等を再起動していました。ただ、これではシステムが利用できるまで時間がかかってしまうため、数カ月前から保守業者に原因調査の依頼をしていました。

 ところが、原因究明が難航していので、別プロジェクトにいる先輩Bさんにも相談しました。一緒のプロジェクトにいる先輩Aさんは技術的に詳しいのですが、BさんもIT業界の経験が20年くらいのベテランです。

 結局、あっさりと原因を発見、対処方法も簡単に見つけてしまったのです。

 先輩Aさんも「原因究明や障害対応はこちらの仕事ではないけど、この状況じゃやらなければいけないね。君はサービスダウン時に利用者から電話が来た時のためにうまく説明できるようにしてくれ。まさか1日に何回もダウンしているとは言えないからね」という指示がありました。

 説明すると言っても、ダウンしているAPサーバのサービスを起動させるだけで復旧するので、発見してから復旧までは1分程度です。それくらいならネットワークが混雑しているなど、考えられる理由は多くあるので、うまく切り抜けています。ダウンしていると指摘されたことは一度もありません。

■保守業者を動かすには

 APサーバのサービスダウン以外にもさまざまな障害が発生します。先輩Bさんの活躍でサービスダウンの障害はすぐに対応できるようになったのは良いのですが、保守業者は我々が技術的に詳しく、対応を任せてもいいと思ったのでしょう。メールで障害発生を知らせても返答が遅くなり長時間改善しないことが珍しくなくなりました。

 特に、Netvaultに障害が起きて、DBのバックアップが取れていない時は「DBサーバのハードディスクに障害が起きたらどうしよう……」と生きた心地がしなかったのをはっきり覚えています。

 できる限り、我々が対応したいのですが、さすがに限界があります。そんな時に致命的な障害が起きたら取り返しのつかないことになるだけではなく、お客さんも我々の対応が悪いのではないかと思うかもしれません。

 お客さんには、こちらは一生懸命動いているということを示す(証拠を見せる)必要があります。もちろんメールのやり取りは見せますが、それだと専門用語が入り乱れてお客さんが理解するには難しすぎます。内容が複雑になった時はお客さんに会って、どのような障害が発生していて、どういう原因が考えられて復旧作業を行うのは我々ヘルプデスクなのか、それとも保守業者なのかを相手が理解できるように伝えなければいけません。

 サービスがダウンした時も私は簡単なシステムの構成図が入った資料を作ってからお客さんに説明しました。ITの知識が皆無の人にもわかるように説明することでお客さんから信頼を得るように努力しました。

 これが功を奏したのか、保守業者からの返答が遅くなった時は、お客さんが対応の催促をしてくれるようになり、障害も前と比べると速く改善されるようになりました。

■最後に

 相手が理解するのに負担がかからないように説明しなければならないのはヘルプデスクだけではありません。基本的なことのように思えますが、これができていない人が多いです。

 現場では口答での説明も重要ですが、ドキュメントなどの資料が大切になります。我々が来た時は手順書やドキュメントがほとんどない状態だったので、先輩と2人ですべて作成しました。常に初心者が見ても理解できるものを作ろうと意識していたので大変だと思いましたが、私の資料作成能力は飛躍的に上がりました。

 今回のヘルプデスク業務で培った問題解決能力・コミュニケーション能力・資料作成能力を、今後の夢であるシステムの構築をする時に活かしていきたいと思います。

Comment(0)