LE社のエンジニアたちの風がふくまま気の向くまま本音コラム

初めての1人勤務

»

 リーディング・エッジ社の篠澤です。現在、先輩と2人でヘルプデスク業務を担当しています。今回は1人で勤務している時に起こった障害をどのように対応したのかをお伝えします。

■まさかの障害

 現場に配属されて約2カ月して、ヘルプデスク業務に必要な専門用語にも慣れてきた頃、先輩が用事で休みを取り、私が1人で業務をこなす日がきました(1人と言っても別プロジェクトにいるもう1人の先輩が来てくれるので数時間ですが……)。

 ただ、例え数時間でも初めての経験だったので、不安を胸に出社するとシステムのWebページを表示できないことに気付きました。これは以前からあった問題でアプリケーションサーバのサービスがダウンすることが原因でした(これが原因だと気付いたのはもう少し後です)。このタイミングで落ちたかと焦って先輩に連絡しても電話に出ない状態でした。さらにお客さんに報告の電話をしてもまだ出社していないらしく連絡がつかない状態でした。

 どうすればいいんだ……。

■試される問題解決能力

 先輩が前回どのように対応していたかを冷静に考えてみました。この場合はサーバの再起動をすることを思い出しました。繋がらない電話をかけ続けても意味がないので、再起動に必要な手順書を用意しました。

 ただ、勝手に再起動することはできないため、とりあえず休みを取っている先輩に連絡を取ることにしました。あっさりと電話は繋がり、お客さんには後程経緯を説明するとして手順書に従いサーバの再起動を行う事になりました。Web・AP・DBなど全部で8台のサーバを再起動するという作業が必要です。しかも時間をかけると利用者から問い合わせが殺到するため迅速に行わなければならないことに加え、シャットダウンと起動の順番を間違えると、大変なことになってしまうというプレッシャーも付きまといました。この作業だけでも苦労するのに、「途中で利用者からシステムが使えないけど何かあったのか?」という電話が数件かかってくるなど思うように作業は進みませんでした。結局、先輩は30分程度で終了する作業を60分程度かけて終了してシステムは正常に動作しました。

■起こりうる問題を予想することの重要性

 今回の経験で分かったことはどのような問題が起りえるかを考えて、手順を整理しておくことが重要だということでした。今回は、先輩が作成してくれた手順書のおかげでサーバに触ったこともない私でも作業を終えることができましたが、それがなければシステムは数時間停止したままとなり大損害になってしまいます。

 そのため、私も時間が空いた時はマニュアルを読んで、自分なりの手順書を作成して問題に対応できるよう努力しています。今日の仕事は終わったのでやることがないと言っている人がいますが、余程の単純作業でない限り、数カ月でやることがないということはありえないと思います。そういう人はやるべきことに気付いてないだけなのです。今回のことはそれを痛感させられる経験でした。

 さて、次回は障害の対応を依頼する保守業者と我々ヘルプデスクとの確執についてをメインにお話したいと思います。お楽しみに。

Comment(0)