概要

様々な開発では、検索エンジンを使って必要とする情報が書かれたWebページを探すことが多いと思います。

そのような検索で、たまにほとんど情報がないのに検索結果で上位に表示されていたり、英語を日本語訳にしたため、不自然な情報が記述されているようなサイトに出会うことがあります。

ここでは、そのような表示されてほしくない結果をスパムのようなサイトとして、結果へ表示されないようにする方法を紹介します。

スパムのようなサイト

最初に、スパムのようなサイトがどのようなサイトで、どのようなサイトを検索結果へ表示しないようにしたいのかを明確にします。

スパムのようなサイトを次のようなサイトとします。

  • ほしい情報は書かれているが、それ以外の情報も多くアクセスしても中々情報にたどり着けないサイト
  • あまり中身のないサイト
  • 日本語訳されたサイトで、その翻訳の質が悪いサイト

今回はこのようなサイトをブロックして、検索結果へ表示されないようにします。

ブロック方法

今回は、ブラウザの拡張機能を利用して検索結果のブロックを行います。

いくつかブロックをするためのプラグインはあるのですが、今回は「uBlacklist」というものを使います。

このプラグインの特徴として、自分で検索結果に表示させないサイトを追加できますが、そのほかにも外部で公開されているリストをWeb上からインポートすることができるので、とても楽にブロックするサイトを追加修正できます。

リストの追加

検索結果に表示しない、ブロックするサイトを追加していきます。

ひとつひとつそのようなサイトを見つけて、自分で追加していくのでもよいですが、それでは抜けがあるかもしれませんし、ミスもしそうです。

そこで私は、次のリストを登録することにしました。

GitHub - arosh/ublacklist-stackoverflow-translation: Exclude machine-translated sites of Stack Exchange from Google search results

GitHub - tats-u/tech-spam-filter: Google検索を邪魔する技術系スパムサイトのフィルタ

私が現在利用しているのは、Stackoverflowの翻訳サイト関係のリストや、あまりほしい情報が多くない技術系Webメディアのリストのふたつです。

リストは、GitHubで管理されているため、リポジトリの説明をみながらuBlacklistの「購読」に登録します。GitHubのリポジトリということで、今後更新されることもあるでしょうし、もし何かあったら私がプルリクエストなどを送るというのも考えています。

さいごに

今後使っていきながら、新しくリストを追加したりすることもあると思いますが、ブロックするサイトの傾向は変わらないと思います。

これで、快適な検索ができるようになりました。