Contents 目次
AIOpsとは
AIOps(エーアイオプス)とは、Artificial Intelligence for IT Operationsを略した用語で、AI(人工知能)を活用して、IT業務の自動化や効率化を図る運用手法を意味します。
AI(人工知能)のほかに、機械学習(ML)やビッグデータを組み合わせて、システムの安定的な運用をサポートします。
ここでは、AIOpsの仕組みや用途について解説します。
AIOpsの仕組み
AIOps の仕組みは、以下に挙げる5つの主要なアルゴリズムによって形成されています。
- データの選択
AIOps は膨大な量のデータを評価し、関連したデータを特定することで、あらかじめ定義されている優先順位に基づいて、データが埋もれている箇所から重要な情報を見つけ出します。
- パターン検出
関連したデータの詳細を分析し、異なるソースのデータ間の関連を特定してグループ化することで、さらなる詳細な分析を可能とします。
- 推定
詳細な分析によって、インシデントの根本原因、発生したイベントや傾向を特定し、起こすべきアクションに役立つ明確な方法を提案できます。
- コラボレーション
適切なチームや担当者へ関連する情報を提供し、オペレーター同士が離れたエリアにいても、連携して作業できるようなコラボレーションプラットフォームとして機能できます。
- 自動化
AIOps は自動応答が可能で、インシデントを自動で直接修正できるよう設計されています。
AIOpsの要素
ここでは、AIOpsの 6つの要素について解説します。
- 大規模な IT データ
AIOps に求められる機能は、データのサイロの解消です。サイロとは、企業における業務アプリケーションが個々に独立していて連携されていない状態を意味します。
AIOpsは、IT サービスの管理とIT 運用の管理における、さまざまなデータの集計を行います。それにより、根本的な原因の特定までを迅速に実施し、自動化が可能となります。
- ビッグデータの集計
あらゆる AIOps プラットフォームの中で、中心的な存在がビッグデータです。連携されていない業務アプリケーションを連携させてデータを抽出することで、既存データだけでなく変化するリアルタイムデータを利用した、高度な分析が可能です。
- 機械学習
機械学習を活用することで、AIOpsは膨大なデータ分析を可能とします。自動分析により、インシデント発生時には、関連するソフトやハードからの情報を収集し、人の作業では不可能な速度で分析を行います。
- ドメインアルゴリズム
ドメインアルゴリズムにより、構造化されていないデータを関連づけ、ノイズの除去や異常発生時のアラート、原因の特定を行います。
AIOpsの特徴
AIOpsは、主に「複数のデータソースからデータを取り込む」「機械学習から分析や提案を行う」という2つの特徴を持っています。
ネットワークやシステム、クラウドなど複数のソースからデータを取り込むことで、過去のデータから分析してリアルタイムデータに対して予測することが可能となります。
また、機械学習を活用して、データの取り込みと同時にリアルタイムでデータを自動分析することも可能です。情報システムの根本的な問題パターンを発見することで、将来に発生する可能性があるインシデントや、システムの新たな動作を予測するために活用されます。
AIOpsが注目されている理由
AIOpsが注目される理由は、これまでの情報システムの管理・運用方法では、現代における状況や環境にマッチしなくなりつつあるからです。
ITシステムの大規模化により、発生するイベントや課題に対して、人が一つひとつ分析・判断するには現実的ではなくなってきています。また、近年における労働人口の低下によって、エンジニアが不足している面も大きく起因しています。
その半面、AIや機械学習が進歩してきたことにより、発生したイベントの分析を自動で行えることが、これらの課題解決に期待されることも、AIOpsが注目される後押しとなりっています。
このことから、今後ますますAIOpsを導入する企業が増えることが予想され、それを見越したAIOpsツール導入のための人材確保などの準備がすでに開始されています。
AIOps導入の主なメリット
AIOpsを導入すると、以下のようなメリットを享受できます。
- 生産性の向上とヒューマンエラーの削減
- コスト・リソースの削減
- リアルタイムのデータ分析
それぞれ詳しく解説します。
生産性の向上とヒューマンエラーの削減
AIOps導入の最大のメリットは、生産性の向上とヒューマンエラーの削減です。人が監視する場合、長時間における監視体制や、多忙な日々の業務による疲れや体調不良などがあると、人為的ミスを誘発しかねません。自動化することで判断ミスを軽減でき、安定したパフォーマンスを保てるようになります。
また、発生したアラートは、AIが対処不要か重大かを自動で分類してくれます。これまで、人間がアラートの内容を分析し、対応の必要があるかを判断していた時間を大きく削減できるようになるのです。その結果、システム運用の確実性高めることができ、顧客満足度の向上にもつながります。
コスト・リソースの削減
情報システムのアラート発生の原因を分析し、自動で修復を行ってくれるAIOpsは、不足しているエンジニアのリソースを削減できます。アラート内容の分類など、単純な作業の自動化によって、人員コストの大幅な削減が可能となります。
これによって、AIでは対応できないクライアントとのミーティングなど、重要な業務に人員を集中させられるようになります。
リアルタイムのデータ分析
DX戦略に伴い、企業のデジタル化が進んだことで、クラウドを活用したサーバーやネットワーク機器、セキュリティアプライアンスから、さまざまなデータやログが発生します。これらの膨大な量のデータ分析は、とても人の手ではさばききれません。
AIOpsの導入により、出力された膨大なデータを自動的に形成することで、データ分析を一連の流れとして実現でき、リアルタイムでデータ分析を行えるようになります。
AIOpsが役立つ場面
AIOpsは、以下のような場面で役立ちます。
- パフォーマンスの監視・分析
- 異常検知
- アラートの原因分析・特定
- アラート対応の自動化
- ITサービス管理(ITSM)
それぞれ、以下で詳しく解説します。
パフォーマンスの監視・分析
AIと機械学習により、情報システムの大量なイベントデータを収集・分析して問題の原因を特定します。将来起こりうる問題を予測し、問題が発生しないよう監視して未然に防ぎます。
異常検知
過去のデータの中から、問題が発生していることを示唆する異常値を特定します。アルゴリズムに基づいて、情報システムの予測値と実データの差を自動で比較して異常を検知します。
アラートの原因分析・特定
情報システムでイベントやアラートが発生した際、自動で分類して対処が必要と判断されれば、過去データから根本原因を特定します。さらに、修正方法や対処法を検索します。
アラート対応の自動化
アラート発生時、関連情報を取得して原因分析をこれまでは人が行っていましたが、AIOpsの導入により自動化が可能となります。発生したアラートに対して、機器のログやデータを取得して分析することで、対応の可否を自動で判断してくれます。
ITサービス管理(ITSM)
ITサービス管理(ITSM)とは、企業内の情報システムの設計や構築、サポートや運用に関する全てのプロセスを指します。ネットワークに接続されたデバイスやインフラの管理、ストレージのリソース管理業務に対し、AIOpsを適用することも可能です。
AIOps導入事例
ここでは、AIOpsの導入事例をいくつか紹介します。
顧客より先にシステム異変の検出が可能に
総合ITサービスを提供するTISは、顧客システムの保守や監視業務において、以下のような課題に悩まされていました。
- 顧客からの申告によりサービスの異変に気づく
- 障害の切り分けに時間がかかり、多くの人材コストを要している
- 調査に伴う現地への駆付ける時間により対応が遅れる
AIOpsの導入により、不具合箇所の早期発見、調査工数の削減・迅速化、調査に伴う現地への駆け付け対応を回避することが可能となりました。
分析作業の自動化により属人化を解消
日立ハイテクノロジーズのPLMシステム(製品ライフサイクル管理システム)は、ユーザーよりさらに速いレスポンスが求められていました。その他、以下のような課題をかかえていました。
- ログデータ収集やレスポンスの測定、データ集計における工数が膨大
- 障害の原因特定までに時間がかかっている
- 分析作業が属人的になっている
- サーバーの性能分析作業に多くの時間を費やしている
AIの導入により、手作業で行っていたレスポンス測定・データ集計が自動化でき、分析作業と原因特定までの工数と時間を大きくカットしました。プログラムやSQLの詳細分析は、これまで専任担当者の経験に基づいていましたが、他の担当者でも分析できるようになり、属人化を解消でたのです。
システムのユーザー体感レスポンスを改善
航海機器や魚群探知機などを開発する、総合船舶電子機器メーカーの古野電気は、顧客のニーズに合わせた製品を提供しています。
同社が活用しているシステムにおいて、品目検索という機能を使い、最適な組み合わせの機器を制作するのですが、検索のレスポンスが遅いことに課題感を覚えていました。社内でSQL Serverを2ヶ月かけ分析しましたが、原因を特定できませんでした。
AIOpsツールを導入し分析を実施したところ、なんと数分で原因を特定できたのです。現場のユーザーからおどろきの声があがるほど、劇的なレスポンス改善に成功しました。AIOpsの導入により、システム処理の遅延解析、原因究明にかかる工数の削減、期間短縮を可能とした事例です。
AIOps導入方法
ここでは、AIOps導入における4ステップについて解説します。
- 対象システムの課題を抽出
- AIOpsで課題を解決できるツールベンダーを選定
- 費用対効果を判断
- 対象システムの課題を抽出
情報システムの運用において、何に困っているかをリストアップします。
例えば、顧客へシステムの保守や運用サービスを提供している企業であれば、システムのアラート発報よりも、顧客が先に異変に気づいてしまうことなどです。障害発生時に、原因特定にはリモートでの対応では原因が特定できず客先へ駆けつける必要があり時間がかかってしまうなどです。
- AIOpsで課題を解決できるツールベンダーへ相談
課題を抽出したのち、解決可能なAIOpsツールを提供しているベンダーから情報を収集します。現在かかえている課題を提示し、AIによってどのように解決が可能なのかを調査します。
例えば、社内システムの運用において、ユーザーから毎回のように発生するクレームや、改修依頼のある事象を提示し、AIで分析することで解決できる事象はないかを確認します。
- 費用対効果を判断
社内でかかえている課題を、一番多く解決してくれるAIOpsツールを選定することが望ましいのですが、事前に導入後の費用対効果を計算する必要があります。業務効率化に最適とは言え、あまりに高額なAIを導入しても、結果的に赤字では大問題です。現状の業務課題を解消することで、人員のコスト削減額や、顧客満足度の向上による売上げの最大化など、費用対効果を計算した上でAIの導入を判断しましょう。
まとめ
AIOpsは、AIや機械学習を活用し、情報システムの障害発生時などに自動で分析を行い、解決策を特定することが可能です。これまで、システムの不具合を検知した際、対応が必要か不要かを人が判断していたことも、AIがさまざまなログやデータから分析し、自動で判断できるようになります。それにより、早期なる障害復旧や、人件費の削減が期待できます。