知っておきたいトラブルシューティングの基礎知識
システムに、何らかの異常が発生したときに有効なのがトラブルシューティングです。突然のトラブルは誰でも驚き、焦りが先立つもの。しかし、体系化された復旧への手順があれば、最短距離でトラブルを解決することが可能です。
ここでは、トラブルシューティングの考え方と方法について解説します。
トラブルシューティングとは?
トラブルシューティングとは、何らかの問題が起こったときに、その原因を探して取り除くことを意味する言葉です。「トラブルシュート」といわれることもあります。
テレビ・ビデオといった家電やPCのマニュアルの巻末に、何らかの異常が起こったときにユーザーが対処できるよう、故障・不具合に応じた対策が記載されているのを目にしたことがあるのではないでしょうか。この項目や、対策を詳しくまとめた冊子のことをトラブルシューティングと呼ぶ場合もあります。
トラブルシューティングそのものは、幅広い分野で使われる問題解決のための手法ですが、おもに機械類やソフトウェアにおける問題解決を指すことが多いです。この記事では、システムやソフトウェアのトラブルシューティングについてご紹介します。
トラブルシューティングが必要な理由
システムやプログラムの不具合や異常は、いつでも起こる可能性があります。その状態も原因もさまざまで、時として深刻な状態に陥っていることもある一方、単純な原因で異常が発生しているケースもあります。
重大なトラブルであれば、IT部門のスタッフが対応し、プログラムの修復やハードウェアの交換などをしなくてはなりません。しかし、状況によっては、簡単な操作で復旧することができる場合も多々あります。たとえば、PCを再起動するだけで回復できるトラブルに、その都度IT部門が対応していては、無駄な業務が増えるばかりです。
また、何らかのトラブルが起こった場合、初期対応を間違えてしまうと、傷口をさらに広げることにもなりかねませんし、サーバーやシステムに障害が起これば、その間は仕事が止まってしまうことにもなります。
そうした無駄や危険を排除し、スピーディな復旧を行うために、トラブルシューティングが必要になるのです。
トラブルシューティングの基本的な考え方
トラブルシューティングは「最も単純で、頻度の高い原因から可能性を消していく」という、消去法の考え方を基本としています。そのため、たとえば「PCが動かない」というトラブルに対して、最初に確認することは「電源が入っているか?」「電源プラグはコンセントに挿さっているか?」というところからあたっていきます。
最もシンプルで、発生の可能性が高いところからチェックしていき、現状を把握しながら進めていく。こうして一歩ずつ段階を踏んで、トラブルの原因を探っていくのです。
カスタマーサービス最新事情
トラブルシューティングの方法
1. 状況を把握する
2. 問題の発生箇所を突き止める
次に、どこで問題が起こっているのかを突き止めていきます。これは手間のかかる作業ですが、トラブルシューティングでは最も重要な工程です。この工程では、次に紹介する3つのルールが役立ちます。
- ひとつひとつ、結果を確認する
どの場所で問題が起こっているのか、ひとつひとつチェックして結果を確認します。まとめてチェックすると、問題のある箇所を見逃す危険があるためです。これは、原因を特定する際にも必要になる、重要なルールです。
- 近くから遠くへチェックしていく
たとえば、ある端末がネットワークにつながらないという異常があったからといって、その端末自体に問題があるとは限りません。その際には、まず異常が見られる端末をチェックし、そこからハブまで、さらにルーターまで…という具合に、近くから始めて遠くへ向かってチェックしていきます。
- 下から上へチェックしていく
下から上というのは、機能上の階層構造に注目したチェックのしかたです。特定のPCに異常が現れたのであれば、まずベースとなるハードウェアに問題はないか、OSは正常に機能しているか、アプリケーションはどうか…という具合に、ベースとなる部分から階層を上にたどってチェックしていきます。
3. 発生条件を見極める
トラブルによっては、特定の条件下で発生する場合もあります。それを記録しておくことで、原因を正確に特定できることは多いものです。
よくある発生条件として挙がるのは、時間帯のほか、問題が起こったときに実行していたシステムやアプリケーション、特定の作業・動作などです。ある条件がそろうと必ず異常が起こるかどうかという再現性の有無も、原因究明に大きく役立ちます。
4. 原因を想定し検証する
適切なトラブルシューティングを実現するためには?
トラブルシューティングが適切に行われれば、何らかの異常が起こった際にも原因の特定がスムーズにでき、早期の普及を図れます。しかし、実際の運用面では、トラブルシューティングにはいくつかの課題も見られ、思うように運用できていないこともあるようです。
最後に、トラブルシューティングをより適切に行うためのポイントをご紹介します。
優先順位の高低に、どう対応するか
システム全体を常に監視しているIT部門のスタッフからすれば、たとえ優先順位の低いトラブルであっても、アラートが発生したらすぐに対処しなくてはならず、それが「無駄な作業」になってしまうこともあるでしょう。
取るに足らない異常でも、それがより大きなトラブルの要因になりかねない…という見方もできますが、優先度が極端に低いアラートに対する処理についてどう対処するかは、あらかじめ検討しておく必要があります。
対処のプロセスを体系化する
起こりうるトラブルに、どう対処するか。それを末端のユーザーにも可能にするのが、トラブルシューティングです。そして、専門性が必要なトラブルについては、IT部門が対処することになります。
しかし、IT部門の中でも、エンジニアごとにスキルの差がありますから、難しいトラブルについては、スキルの高いスタッフに業務が集中してしまう可能性があります。
そうした状況を避けるためには、トラブル対応の業務を体系化し、マニュアルとして標準化しておくことが重要です。そうすることで、誰でも同じ対応ができ、スムーズな解決・復旧が図れるようになります。
ITツールやサービスを活用する
トラブルシューティングに関して、専用のツールが用意されていることもあります。
社内のシステムやネットワークを監視し、トラブルが起こった際の原因究明をサポートする保守ツールは市場に多数登場していますし、さらに身近なところでは、OSに標準装備されているトラブルシューティングツールもあります。
また、各種ITツールやクラウドサービスでは、ベンダーの自社サイト内にトラブルシューティングをコンテンツとして用意しています。中には非常に幅広く、しかも手厚い内容のものもありますし、ユーザーコミュニティでトラブルとその解決法について、活発な報告がなされている例もあります。
こうしたツールやサイトを活用すれば、いざというときに大きな助けとなるでしょう。
トラブルの際は、まず落ち着いて冷静な対応を
何らかのトラブルが起こったとき、経験則だけに頼ってしまうと、傷口をさらに広げることにもなりかねません。それよりも、まずはプロセス化されたトラブルシューティングを施してみてください。
トラブルのときこそ、落ち着くことが肝心です。慌てず、効率の良い解決を図りましょう