banner
ニュース センター
包括的な経験と高度な方法論

Photobox は可観測性をより明確に把握します

Aug 29, 2023

Photobox は、Dynatrace 可観測性プラットフォームを使用して、すべてのシステム監視データを 1 つの画面に統合しています。 現在、albelli-Photobox グループの一員となっているこのパーソナライズ印刷会社は、2022 年後半の合併前にこのプラットフォームを導入しました。

同社は以前、システムの問題に対して積極的なアプローチをとることが難しいと感じていました。 同社の IT スタッフは、AWS EC2 上に構築された複雑なテクノロジー スタックと、Kubernetes および AWS Lambda 上で実行されるマイクロサービスを監視する必要がありました。

albelli-Photobox Group のエンジニアリング ディレクター、Alex Hibbitt 氏は次のように述べています。

複雑なスタックは一連の合併と買収によって作成されました。 このレベルの複雑さは、効果的に観察することが信じられないほど困難になります。 当社には少なくとも 5 つの異なる可観測性プラットフォームがあり、約 10 の異なるテクノロジーを使用していました。 可観測性は、本当に経験豊富な少数のエンジニアだけが持つスキルとなりました。

Hibbitt 氏は、IT の問題を特定するのに最大 4 時間かかる場合があると回想しています。 一方、可観測性の複雑な性質は、実行するのが困難なプロセスであることを意味しました。 彼は、効果的な可観測性の欠如により、スケーラビリティと応答性の課題が生じたと述べています。

問題に対応するのは本当に大変でした。 何かが起こった場合、私たちはトップのトラブルシューティング担当者を捕まえて、「ああ、ここのどこかにいるような気がする」と感じてもらう必要があります。 そのアプローチはあまり科学的ではありませんでした。

これは、複雑なスタック内の問題に対応する能力と、エンジニアリングの取り組みに重点を置いている場所に洞察を適用する能力の点で、私たちにとって状況を一変させました。

同社は、別の取り組みが必要であると認識しました。 最初の試みとして、この企業は独自の可観測性ツールを導入しました。 ただし、この特注テクノロジーは、価値を生み出すのではなく、さらに複雑さを追加しただけです。 その時点で、Photobox は問題の潜在的な解決策についてテクノロジー ベンダーと話し始めました。 ヒビットさんはこう言います。

私たちは、フロントエンドからバックエンドのデータベース サービスまですべてをカバーできる 1 つのツールで、欲しいもののリストを作成しました。 私たちは、プラットフォームへのアクセスを民主化して、どのエンジニアでもプロセスを理解して、何をしているのかを理解できるようにしたいと考えていました。 そして、どのアラートが本当に重要であるかを確認できるように、信号対雑音比を向上させる何かが必要でした。

Photobox はウィッシュ リストを使用して潜在的なソリューションを特定した後、いくつかのベンダーとの低レベルのトライアルを完了しました。 その後、Hibbitt のチームは、推奨ソリューションである Dynatrace を使用して長期にわたるパイロットを実行しました。 Photobox で実行されているシステムは複雑であるため、同社はプラットフォームをテストし、意味のあるデータを生成するために 2021 年後半に 6 か月間の有料トライアルを確立しました。

トライアルの成果として、すべての実稼働環境で稼働を開始しました。 この移行は単に、より長期的な実装に結び付けるためでした。 私たちの中心的なテスト ポイントの 1 つは、「古いプラットフォームをすべてオフにして、Dynatrace のみに依存する自信はありましたか?」ということでした。 答えは「はい」でした。これは現在、当社のテクノロジー スタックの中核部分となっています。

Hibbitt 氏は、Dynatrace の自動化と AIOps 機能の導入により、大きなメリットがいくつか得られたと述べています。 Photobox は、問題解決までの平均時間を 80% 短縮し、ショッピングのピーク時にサービスの可用性に影響を与える重大なインシデントの数を 60% 削減しました。 Dynatrace アプローチの主な利点の 1 つは、プラットフォームの問題カードです。

カードは、インシデントで問題が発生した可能性のあるさまざまな関連指標をすべてまとめて、全体的なビューとして表示します。 それは 2 つの本当に素晴らしいことを行います。 まず、問題の影響を受ける顧客の数がわかり、エンジニアが何かが本当に重要かどうかを定量化するのに役立ちます。 次に、根本原因分析を実行し、潜在的な問題を特定します。 そして、私たちのような分散型のマイクロサービスベースの組織では、これは非常に役立ちます。