1. TOP
  2. BLOG
  3. TECH ARTICLE:JENNIFER AIを活用した
    リアルタイム性能管理の
    新たな可能性を探る(第1回)
TECH ARTICLE

2025年07月07日

JENNIFER AIを活用した
リアルタイム性能管理の
新たな可能性を探る(第1回)

システムの複雑化とモニタリングの課題

今回は、モニタリングの課題をシステムの複雑化進行の観点から考察します。最大の問題は、時間の経過と共にシステムが益々複雑化する一方で、運用者のスキルや対応力に限界があるという点です。特に、Webサービスはリアルタイムで運用されるため、障害が発生すれば即座にユーザーに影響を及ぼします。そのため、システムの運用者は迅速な対応を求められます。

このような緊迫した状況で、システムの複雑化で問題解決が遅れると、ダウンタイムが長引きます。この複雑化は日常の運用においても大きな課題となり、サービスの全体像を把握できなければ、性能低下の根本原因を特定するのが困難になります。その結果、問題の解決が益々難しくなります。また、サービスの機能が増える程、一部の機能に問題が発生しても運用者がそれを見逃す可能性があります。

AIによる課題解決のアプローチ

システムの現状を正確に把握する強力な分析ツールがなければ、このような問題は繰り返し発生するでしょう。システムが複雑化する程、運用コストの増加にも直結します。そこで、AIがこの問題の解決策となる可能性があります。

AIは、データを解析するアルゴリズムを活用して、情報を要約しフィルタリングするだけでなく、運用者に代わり問題の原因を特定し、解決策を提示できます。このようなAIツールを活用すれば、システムの複雑化を抑制し、個々の運用スキルの限界を補い、運用コストの増加を抑えられます。何故なら、データは問題と解決策を結ぶ橋渡しの役割を果たすからです。

現代の複雑なシステムが生成する膨大なデータは、人間の認識能力を超えることが多々あります。しかし、AIはデータ量が多い程、効果的に動作するという特性を持っているため、モニタリングツールとAI技術を組み合わせることで、より効果的なリアルタイム性能管理が可能となります。

図1. AIを活用したシステムの複雑性の管理

JENNIFER AIの特徴

AI技術の導入には機械学習などの高度な計算処理のために、追加のサーバーリソースやコストが必要になる場合がありますが、JENNIFERはこれらを必要としません。

JENNIFERは、既存の環境で動作するように最適化されており、最新バージョンをインストールするだけでAI機能をそのまま活用できます。このように、技術的にコストを抑えながら、時間の経過と共に効果が最大化されるAI機能を開発することが、私たちエンジニアの役割です。

ここでは、JENNIFERのAI機能のうち、メトリクス分析とトランザクション分析におけるAIの役割について説明します。その後、JENNIFERのアプリケーションインサイトがこの2つを統合する機能として、更に生成AIを活用した新機能をどのように実装しているかを紹介します。先ずは、比較的一般に普及している異常検知から解説します。

メトリクス分析と異常検知

1. 異常イベント検知

図2. 異常イベントの発生の仕組み

「異常イベント」は、その名の通り、メトリクス(指標)から異常値を検出し、イベントとして運用者に通知する機能です。従来は、システム運用者が手動で指標を監視し、正常かどうかを判断する必要がありました。しかし、システムの複雑化に伴い、監視すべき指標も増加し、手動での監視は現実的ではなくなっています。

例えば、以下の指標を人間が全てチェックするのはほぼ不可能です。

• リクエストの応答時間
• SQLの実行時間
• ハードウェアのCPUやメモリ使用率
• サービス全体のTPS(Transactions Per Second)や同時接続ユーザー数

そこで、JENNIFERはAI技術を活用し、運用者の代わりにメトリクスを自動分析し、異常が発生した場合にリアルタイムで通知します。

図3. AI基板の異常検知プロセス

2. 正常範囲の自動設定

異なる種類のメトリクスに対して適切な正常範囲を設定するのは、非常に難しいです。この問題を解決するため、JENNIFERは「正常範囲設定の推奨機能」を開発しました。この機能は、直近24時間のデータを基に正常範囲をシミュレーションし、適切な閾値を自動設定します。さらに、直近7日間のデータを活用したより広範なシミュレーションも可能です。

また、複数のメトリクスに対して一括で通知設定できる機能も備えており、異常検知のイベントを迅速に活用できます。

3. メトリクス相関分析

異常イベントとして検出されたデータは、「メトリクス相関分析」によってさらに深い分析ができます。この機能は、システム内の様々なメトリクスの関係性を明確にし、運用者が簡単に問題の相関関係を理解できるようにするものです。

例えば、CPU使用率の急上昇が異常イベントとして検出されたとすると、アクティブユーザー数やデータベースの接続数との相関関係を確認することで、根本原因を特定できます。

しかし、従来の相関分析では時差のある因果関係を見逃すことがあります。例えば、以下のような順序で問題が発生している場合、AIは同時発生しないイベントの相関関係を低く評価するために、適切な分析が難しくなります。

① トラフィックの急増
② CPU使用率の上昇
③ 応答時間の遅延

JENNIFERは、この問題を解決するために「時差相関分析(Lagged Correlation Analysis)」を導入しました。これにより、時間のずれたイベントの関連性を正しく評価し、システム異常の因果関係を正確に把握できます。

次回は、トランザクション分析とアプリケーションインサイトを活用したリアルタイム性能管理について詳しく解説します。

JENNIFER AIを活用したリアルタイム性能管理の新たな可能性を探る(第2回)に続きます!

お気軽にお問い合わせください

製品に関する事やご不明な点など、お気軽にご相談ください。
また、ジェニファーソフトでは2週間の無償トライアルを提供しています。

詳しく知りたい方は
導入や費用のご相談は