アプライド マテリアルズのプロアクティブディテクションでは、APMで監視しているアプリケーションの異常が、アクティビティストリームと異常情報フィードに自動的に表示されます。各異常をクリックすると、自動分析が行われます。
異常時の通知はSlackで配信することもできますし、Webhookを設定して必要な時にメッセージを配信することもできます。これらのイベントは、クエリ、カスタムダッシュボードの作成、アラートの送信に利用できます。Proactive Detectionの構成(関心のあるアプリのグループ)を設定した後、この構成をソースとして追加できます。そうすると、異常はIncident Intelligenceを介して他のデータソースと自動的に関連付けられます。
異常現象の発生場所、異常現象を利用してインシデントになる前に潜在的な問題を把握する方法、異常現象からアラートを作成する方法については、こちらのショートビデオをご覧ください(約4分15秒)。
要件
プロアクティブディテクションを使用するには、以下の条件を満たしている必要があります。
- 少なくとも1つのアプリケーションにAPMエージェントがインストールされていること。
- Slackで通知を受け取るためには、IT管理者に依頼して、Slackのワークスペース にNew Relicのアプリケーションをインストールしてもらう必要があります。
データ制限については、 Data limits を参照してください。
重要な理由
プロアクティブディテクションでは、アプライド マテリアルズがお客様の生産システムの異常を把握し、その異常を自動的に分析します。この機能は自動的に有効になり、追加費用はかかりません。異常が検出されると、Applied Intelligenceの異常フィードで確認できます。また、SlackチャンネルやWebhookに直接通知が送られます。
使用方法
プロアクティブディテクションは、以下の方法でアプリのデータの異常を検出します。
- プロアクティブディテクションは、APMエージェントから報告されるメトリックデータを監視し、典型的なアプリケーションダイナミクスのモデルを構築し、主要なゴールデンシグナルであるスループット、レスポンスタイム、エラーに焦点を当てます。
- これらのゴールデンシグナルの一つが異常な動作を示した場合、システムはそれにフラグを立て、正常な動作への回復を追跡します。
- お客様のデータの変化に適応し、新しいデータに基づいてモデルを継続的に更新していきます。
Automatically on: デフォルトでは、プロアクティブディテクションはすべての APM アプリケーションを監視し、お客様は何もする必要がありません。異常が検出されると、さまざまなアクティビティストリームやアプライドインテリジェンスの異常フィードに自動的に表示され、NRQLによるクエリが可能になります。
Receiving notifications: スループット、エラーレート、または応答時間の異常な変化を検出したときに、通知を送信します。通知は、選択したSlackチャンネルに送信されるか、webhookで送信されます。異常が正常に戻ったときには、回復メッセージが送信されます。通知を受け取りたくない場合でも、 NRQLクエリ を通じてデータにアクセスすることができます。
異常の分析: 各異常に対して、Slackで異常の分析ページへのリンクを提供しています。このページでは、異常に対する洞察が自動的に生成されます。このページは、最近の異常を一覧表示する「異常」タブからも利用できます。このページでは、既存のAPMとプロアクティブディテクションのデータを使用して、異常の原因に関する説明を提供します。
アクティビティ ストリーム: New Relic One ホームページ、APM サマリー ページ、Lookout、Explorer などの様々なアクティビティ ストリームの中には、APM で監視しているアプリケーションからの関連する異常イベントが表示されます。アクティビティ ストリーム内の異常イベントをクリックすると、その異常の分析ページが表示されます。
アプリケーションは常に異常を発生させるわけではないので、検出されないのが普通の場合もあります。
プロアクティブディテクションのための通知の設定
プロアクティブ検知は、追加費用なしで自動的に有効になります。通知を受信したり、インシデント インテリジェンスのソースとして追加できる構成(アプリのグループ)を作成するには、プロアクティブ検出の構成を作成する必要があります。構成はプロアクティブ検知のUIで作成できます。
From one.newrelic.com , click Alerts& AI.
プロアクティブディテクション の下で、 設定 をクリックします。
クリック Add a configuration.
以下の情報をフォームに入力してください。
- アカウント内の他の構成と簡単に区別できるように、構成の名前を決めてください。
- アカウントを選択します。
- 最大1,000個のアプリケーションを選択します。なお、スループットが低いアプリケーションは、少量のデータ変動に敏感に反応するため、プロアクティブ検知には適していない場合があります。
オプション:異常を監視したいゴールデンシグナルを選択します。
オプション: インシデント・インテリジェンスへの接続.
通知のミュート(Slackのみ)
Slackでは、特定のアプリケーションからの検出音を一時的または恒久的にミュートすることができます。また、チャンネル全体を一時的にミュートにすることもできます。この機能は、インシデントが発生した場合や、チャンネルを中断させたくない場合に便利です。
Slackでミュートにするには、 Mute this app's warnings または Mute all warnings を選択し、期間を選択します。ミュートの期間が終了すると、検出された場合の通知の送信が再開されます。
アプリケーションをミュートすると、そのアプリケーションは設定から永久に削除されます。再び追加するには、 one.newrelic.com 、トップナビで Alerts& AI をクリックし、 Proactive Detection をクリックして、編集する設定を選択します。
プロアクティブ検知の通知をミュートしても、アラートには影響しません。
Proactive Detection Slackメッセージの使用
それぞれの異常メッセージには、問題の詳細を把握し、トラブルシューティングを開始するために使用できるいくつかの重要な情報が含まれています。
- アプリケーション名と、New Relic One での詳細情報へのリンクです。
- 異常が発生しているメトリックと、New Relic Oneでの詳細へのリンクです。
- メトリクスの経時変化をグラフ化し、異常の挙動や程度を視覚的に理解することができます。
- Analyze ボタンをクリックすると、Applied Intelligenceの分析ページに移動し、異常に固有の重要な属性、上流または下流で見つかった異常、その他の関連するシグナルを特定することができます。
異常が正常に戻った時点で、フィードバックを提供するためのオプションを含む回復通知を送信します。お客様からのフィードバックは、開発チームが検出品質を向上させるための情報となります。スループットの異常に関するフィードバックの場合、より適切なモデルに適合させるために、フィードバックに基づいて毎時間評価が実行されます。私たちがお手伝いした場合は、 はい または いいえ を選択してください。
異常の概要を見る
Slackやwebhookを介して情報を提供する異常の通知に加えて、 Alerts& AI Overviewページ の Anomaliesタブ を介して、自分の環境の異常に関する詳細な情報を見ることができます。そのタブには、選択されたアカウントのすべての構成からの最近のすべての異常のリストが表示され、異常を選択して詳細な分析を行うことができます。
異常の可視化設定
異常は、New Relic のさまざまなアクティビティ ストリームと Applied Intelligence の異常フィードに表示されます。異常の可視性の設定により、表示内容をカスタマイズすることができます (たとえば、アクティビティ ストリーム上ではスループットの異常を非表示にし、異常フィードには表示するなど)。
これらの設定を確認するには、 Alerts& AI から、 Proactive Detection の下で、 Settings をクリックします。
これらの設定を使用する際の注意点
- これらの設定は、ユーザーレベルで適用されます。あなたが行った変更は、あなたの組織内の他のユーザーには影響しません。
- これらの設定にかかわらず、異常値は報告され、 NRQL クエリで利用可能です。 。
これらのUIセクションの詳細。
- AI overview and anomalies tab: AI overview and anomalies tab の設定で、異常値を非表示にします。また、これらのビューに固有のフィルターも使用できますのでご注意ください。
- グローバル アクティビティ ストリーム: グローバル アクティビティ ストリーム セクションを使用して、New Relic One ホームページ、APM Summary、Lookout など、さまざまな New Relic アクティビティ ストリームに表示する異常をカスタマイズします。
- Anomaly types: 特定のタイプの異常を隠すには、ここのチェックボックスを使用します。例えば、 Webスループット と Non-Webスループット 異常のチェックを外すと、これらのタイプの異常は、アクティビティストリームとAI概要および異常タブの両方から非表示になります。(ただし、これらの異常はレポートされ、クエリで利用可能です。)
アノマリーデータの照会
NRQL を使って、 NrAiAnomaly
イベントを使って、Proactive Detection のデータをクエリーしたり、チャートにしたりすることができます。たとえば、以下のようになります。
FROM NrAiAnomaly SELECT *.
重要
このデータは以前、 ProactiveDetection
イベントに添付されていました。このイベントは2021年4月7日に廃止されます。カスタムチャートで ProactiveDetection
を使用している場合は、これらのクエリを NrAiAnomaly
を使用するように変換する必要があります。
このイベントに付随する重要な属性は以下の通りです。
属性 | 説明 |
---|---|
| 異常が終了した時刻。例: |
| イベントを監視しているコンフィグレーションのタイプです。少なくとも1つの構成がエンティティを監視している場合、これは |
| エンティティが所属するNew RelicアカウントID。 |
| エンティティのドメイン(現在は |
| エンティティのGUID。NerdGraph でエンティティを識別し、そのデータを取得するために使用される。 |
| エンティティのGUID。NerdGraph を通じてエンティティを識別し、そのデータを取得するために使用される。 |
| データが異常であると判断されたエンティティの名前です。 |
| データが異常であると判断されたエンティティの名前。 |
| エンティティのタイプ(現在は、 |
| これは常に |
| 異常データの始まり( |
| 異常が発生した時間です。例: |
| 分析されたデータの種類。例えば、 |
| イベントが書き込まれた時間です。 |
| 異常現象の説明。例: |
インシデント・インテリジェンスで異常現象をソースとして追加
インシデント インテリジェンスとプロアクティブ ディテクションの異常を統合することで、コンテキストと相関関係を得ることができます。Incident Intelligenceでのこの操作については、 Configure sources を参照してください。
また、設定の中から Connect to Incident Intelligence を選択することもできます。
Webhookのペイロードと例
プロアクティブディテクションは、HTTPS POSTでイベントボディをJSON形式で送信します。システムは、エンドポイントが成功したHTTPコード(2xx)を返すことを期待しています。Webhookを使用してProactive Detectionを設定する場合は、WebhookのボディフォーマットとJSONスキーマの例を使用してください。
属性 | 説明 |
---|---|
| 分析対象となったデータのカテゴリー。 カテゴリーには、ウェブ・スループット、非ウェブ・スループット、ウェブ・トランザクション、非ウェブ・トランザクション、エラー・クラスがあります。 |
| 検知に至るまでの時系列データです。 |
| データポイントのタイムスタンプ(Unix エポックからの ミリ秒) 。例:1584366819000 |
| データポイントの値を表す単位。 データの単位は、 |
| データポイントの値です。例:1.52 |
| 分析されたデータの種類。種類には、 |
| 異常なデータを報告した企業。 |
| エンティティのアカウントのIDです。 |
| エンティティのドメインです。例APMです。 |
| ドメイン内のエンティティを一意に識別するためのID。 |
| すべての製品においてエンティティを一意に識別するために使用されるguidです。 |
| エンティティの名前です。例: |
| エンティティを表示するためのリンクです。例
|
|
|
| 提供されるデータを説明するために使用されるバージョン。 例:v1 |
| 異常データのチャートを示す画像。 |
| New Relic One で異常を分析するために開くことができる URL。 |
データ制限
要件 に加えて、データ制限があります。
- 監視対象のAPMアプリケーション:構成ごとに1,000個まで
- Slackの設定:1アカウントにつき200個まで
- Webhook構成:1アカウントにつき200個まで
- 通知のない設定:1アカウントにつき200件まで