Google アナリティクスのボットとスパイダーのフィルタリングについて

公開: 2022-09-20

デジタル マーケティングに携わるほとんどの人は、ボットが多くのインターネット トラフィックを占めていることを知っています。 しかし、そのパーセンテージがどれほど大きいか、また、ボット トラフィックが分析データを歪めないようにするために使用できるさまざまな手法に気付いていません。

Google アナリティクスでボット トラフィックを除外する方法 分析データに影響を与えていることさえ知らないスパムボットがたくさんあります。 ただし、優れたボットもあります。 つまり、私たちがウェブサイトにアクセスすることを好むボットです。

どのタイプのボットを避けるべきで、どのボットを許可するのが最適ですか? ここでは、Web サイトとトラフィック分析でボット トラフィックを特定して制御する方法について詳しく説明します。

Google アナリティクス データのボット トラフィックとは正確には何ですか?

ボット、スパイダー、その他のソフトウェア アプリは、インターネット上で自動化されたタスクを実行します。 あなたが想像するよりもはるかに多くのものがあります。 実際、統計によると、インターネット アクティビティの 40% 以上にボットが含まれています。

これはかなりの数であり、インターネットのほぼ半分がボットで埋め尽くされています。 もちろん、Reddit や Google のボットなど、有益なボットもありますが、機密情報を盗もうとするボットが多すぎます。

良くも悪くもボットは人間ではないため、Google アナリティクスでボット トラフィックを認識することが重要です。

ボット トラフィックを特定する

ボット トラフィックのソースと範囲を特定するのは難しい場合があります。これは、望ましくない注目や異常なヒットの名前と発信元が絶えず変化しているためです。 Google アナリティクスでボット トラフィックを除外する方法は次のとおりです。

  • 管理セクション内の設定を表示し、オプション「既知のボットとスパイダーからのすべてのヒットを除外する」をクリックします。 多くのマーケティング担当者は、このオプションによって収集したデータの側面が変更されることを懸念していますが、そうではないため、心配する必要はありません。
  • または、ボット設定のチェックを外し、HostName、SourceName などを使用してトラフィックを除外する新しいフィルターを追加する新しいビューを作成することで、既に特定したトラフィックを除外するフィルターを作成してみることができます。フィルターの使用を開始する前に、正しく機能するかどうかをテストしてから、マスター ビューを使用できます。
  • 紹介除外リストの使用を検討してください。 これは、トラッキング情報 < プロパティ列 < 管理セクションの下にあります。 これにより、すべてのドメインが Google アナリティクスのデータから除外されます。 次に、疑わしいドメインが見つかった場合は、それらを今後のリストから完全に削除できます。

良いボットと悪いボットとは?

良いボットと悪いボットを見分ける方法 ボット トラフィックとは、実在の人物以外からのトラフィックです。 優れたボットは、タスクの自動化を担当します。 例としては、Alexa、Cortana、Siri などの音声アシスタントがあります。 良いボットの最も一般的なタイプは次のとおりです。

  • ウェブサイトのヘルスチェック ボット
  • 商用クローラー
  • 検索エンジン (Google、Bing) からのボット
  • サイトをモバイル コンテンツに変換するボット

これらのタイプのボットはすべて、Web サイトを効果的に運営し続ける上で重要な役割を果たします。 善意のボットがサイトに侵入するのをブロックすると、トラフィックに悪影響を与える可能性があるため、注意してください。

次に、悪いボットがあります。 これらは、機密情報をスパムしたり盗んだりするボットです。 ほとんどの人は、Web サイトからデータをスクレイピングおよびクロールしてコンテンツを Web サイトにアップロードするためにボットを起動します。 最も一般的な悪質なボットのいくつかを以下に示します。

  • Web スクレイパー(倫理的なスクレイピング目的で使用されるものを除く)
  • スパムボット
  • ハッカーボット
  • 誰かになりすまそうとするボット

ホスト名でフィルタリング

特定のホスト名を使用して、Google アナリティクスでビュー フィルタを作成できます。 これを行うには、メディア ソース レポートにホスト名の 2 番目のディメンションを追加してボット トラフィックのホスト名を見つけ、それがボット トラフィックであることを確認してから、ホスト名のインクルード フィルターを作成する必要があります。

場合によっては、実際のスパムではなく、「ゴースト スパム」とも呼ばれるランダムな追跡コードによってサイトがヒットすることがあります。 ホスト名によるフィルタリングは、大量のスパム トラフィックを手動で介入することなく一度に削除する優れた方法です。

オールインワンのウェブサイト分析ツール

広告 – アフィリエイト販売が独立した出版をサポート

これを行うには、ビューのフィルターを作成し、次の操作を行います。

のみを含める > ホスト名 > 含む > yourdomain.com

ボットのトラフィックをどのように見つけますか?

では、誰があなたのサイトを訪れましたか? それは人間ですか、それともボットでしたか? 幸いなことに、これを判断する方法はいくつかあります。

  • 突然のスパイク:明らかな原因がない (新しいコンテンツや発表がない、ウォール ストリート ジャーナルで言及されていない) トラフィックの突然のスパイクが見られる場合は、ボット トラフィックである可能性が高いです。 ほとんどの専門家は、これがボットを特定するための標準的な方法であることに同意しています。あなたのサイトのアクセス数は昨日 500 回で、今日は 10,000 回でした。何か疑わしいものがあります。 何か素晴らしいことが起こったのかもしれませんが、ボットの活動である可能性が高いです。 Google アナリティクスのソースをスクロールすることで、ボット トラフィックを特定できます。 トラフィック ボットには、「Traffic Bot. 人生」または同様のもの。
  • 奇妙なレポート:少し時間をとって、キャンペーン レポートに飛び込んでください。 設定していないものがある場合、それはボットである可能性があります。 カスタム フィルタを使用してこれらを見つけ、他のトラフィック フォームを除外できます。
  • 奇妙な参照トラフィック:参照トラフィック ソースを常に監視することが重要です。 参照トラフィックは、「一方向のボット トラフィック」とも呼ばれます。 参照トラフィックに奇妙なボットが見られる場合は、それらが実際のトラフィックではないことがわかるため、参照除外リストを使用して除外できます。 あるいは、紹介スパムは通常、スパムボットによって送信されます。 紹介スパムのブラックリストを作成して、除外するスパムを特定できます。
  • ページ滞在時間が非常に短い:ボットを特定するもう 1 つの一般的な方法は、訪問者のサイト滞在時間が 1 秒以下であることです。 これを認識するために、Google アナリティクス アカウントでフィルター処理されていないビューを設定します。

データ品質に関するサイクルレビューはどのようにすべきですか?

データ品質を確認するときは、常にサイクルを実行する必要があります。 これは次のようになります。

  • Web サイト トラフィックのソースを分析します。
  • トラフィックの「異常な」動作や異常なパターンを特定します (例: 通常、訪問者が少ない日曜日にトラフィックが多いなど)。
  • さらに深く掘り下げて、問題の原因を特定します。
  • ビュー フィルターを編集して問題を解決します。
  • 問題と修正を文書化します。
  • 日次、週次、または月次でトラフィックを分析しながら、継続的なサイクルで繰り返します。

ボット トラフィックを除外する場合、どのような制限がありますか?

Google アナリティクスでボット トラフィックを除外する際の制限 Google アナリティクス アカウントからボットを除外するのは難しくありません。 しかし、検出されないボットがまだたくさんあります

ボットを手動で除外することはできますが、これはベスト プラクティスではなく、100% 信頼できるとは限りません。 さらに、多くのボット作成者はより洗練されており、人間の訪問者のように振る舞うコードを作成しています。 ボットのように見えないようにするために、ボットが住宅 IP を含むさまざまな IP アドレスにリクエストを分散させることがますます一般的になっています。

最後に、紹介除外リストがありますが、これは最も信頼できるオプションではない可能性があります。 参照元を除外すると、ヒットが参照情報から削除されるだけです。 それらは依然として直接のトラフィックと見なされる可能性があり、さらに大きな被害をもたらす可能性があります。 つまり、他の除外方法を使用することをお勧めします。

ボットを削除するだけでは不十分な場合がある

Google アナリティクス プラットフォームからボットを除外することは素晴らしいアイデアですが、アプリ、API、および Web サイトを攻撃するボット トラフィックを完全に排除することにはなりません。 ボット トラフィックが Web サイトのパフォーマンス データに表示されていなくても、ボットへのアクセスは Web サイトのパフォーマンスに永続的な影響を与え、速度を低下させ、全体的なユーザー エクスペリエンスを損なう可能性があります。

Google アナリティクスのデータは、マーケティングに関する意思決定をより適切に行うのに役立ちます。 ただし、オンライン詐欺対策を利用すれば、アカウントの乗っ取り (ATO)、コンテンツの盗難、クレデンシャル スタッフィング、DDoS のリスクに対抗できます。

つまり、Google アナリティクス データからボットを削除すると問題は解決しますが、プラットフォームを攻撃するボットの問題が完全に解決されるわけではありません。 要するに、最善の策は、悪意のあるボットをデータから除外するだけでなく、Web サイトやアプリから完全に禁止することです。

最後の言葉

Google アナリティクス プラットフォームからボットを特定して削除するのは楽しいことではありません。 しかし、トラフィックの大部分が大量のスパム ボット、クローラー、スパイダーからのものである場合、デジタル マーケティングの成功について歪んだ見方をすることになります。 そのため、それらを除外し、不審なアクティビティを継続的に監視してください。

ボットには良いものも悪いものもありますが、Google アナリティクスのデータを歪める前に、悪いボットを特定することが重要です。

トニー・アデミ Tony Ademiは、フリーランスの SEO コンテンツおよびコピーライターです。 彼は執筆業界に 3 年間携わっており、SEO に最適化された何百もの記事を執筆してきました。 さらに、彼は Google で 1 位にランクされた記事を書いています。 記事を書くときの Tony の主な関心事は、広範な調査を行い、読者が最後まで関心を持ってもらえるようにすることです。