検索履歴を全てクリアしました。

Anonyz ブログ

Anonyz の制作や開発に関すること、サービスに関すること、 技術に関すること、お知らせ、and so on.

Anonyz 検索の検索結果で、ある時までは検索結果の1位に表示されるサイトがなんだかおかしかったのに、ある日を境に直った、なんてことが発生します。この間に何が起きているのか・・・それを今回はご説明します。

Anonyz には開発を行っているコアメンバー以外に、実際に日常で使ってくれて不具合を報告しているコアメンバーの友人数人がいます。そしてそれらの友人たちから「◯◯◯ってキーワードで検索したら変なのが出てきた」などと報告を受けることがそれなりの頻度であること、これがまず実情であり事実です。

検索結果の順位操作、と呼べることを行っているのはここの間です。

例えば「ココイチ」って検索したのに一番上に「CoCo壱番屋」が出ないのはウェブ社会の通念的に考えるとおかしなものです。なので確認が取れている公式サイトのメインページが極端に下位になっているような場合、いくつかの作業(この作業=順位操作です)を行なっています。

まずは Anonyz スコアの計算ロジックの部分的な見直し。そしてそれでも対応ができないようであれば、ユーザーの皆さんが「調べたい!」と思った情報の公式とされるページが上位に来るように・・・くらいまでは、何をやっているのか、あまり詳細には書けませんがしています。

ただし例で出した「ココイチ」と言ったら「CoCo壱番屋」みたいにほぼ1対1で連想されるものがある場合はこの対応を行いますが、同姓同名の著名人であったりとかに関しては、基本的にこのような対応は行いません。そこはアルゴリズムに完全に委ねています。

最近、Anonyz 検索の検索結果に掲載されるの一部のウェブページに「このページは非常に低品質なコンテンツしか提供されていない可能性があります。」のラベルが表示されるようになったことにお気付きの方はどれくらいいるのでしょうか。

せっかくちょうどいいタイミングなので、なぜそのようなラベルが表示されるようになったのかを含めて Anonyz を作った理由のひとつを今回は取り上げてみることにします。

来年に齢90歳になる自身の祖母がここ数年、ウェブ検索を使うようになりました。

何年か前に自分は最新モデルに買い換えて使わなくなったのでと古い iPad mini をプレゼントしたら、昭和一桁代出身ながら見事にウェブの世界をさまようようになってしまいました。しかし例えば Google Earth で仮想旅行を楽しんでいたり、ウェブの世界を楽しむこと自体に問題は特にありませんでした。

しかしいくらか時間が経つと、大きな問題が少しずつ露わになってきました。

ウェブに書いてあることを全て鵜呑みにしてしまうようになったのです。

それがたとえ三流週刊誌と言われようとも、その文章の責任の所在がある程度明らかになっている雑誌などなら何も目くじらをたてる必要もありません。しかしまさに「アフィリエイト収入獲得のためだけに出典不明の下手したら捏造なだけな記事」を鵜呑みにしてしまうことが大きな問題でした。最初は冗談半分に受け取っているようでしたが、あまりにそれらの数が多く、いつの間にか7割〜8割はそれらの虚構を信じるようになってしまっていたのです。

もうすぐ90歳。さすがに今からリテラシ教育を受けるのはいささか遅すぎます。

そこでウェブ検索をするなら Anonyz を使って欲しいと思い、作り出し、実際に今稼働しています。

「このページは非常に低品質なコンテンツしか提供されていない可能性があります。」のラベルを表示するくらいなら検索結果に掲載しなければいいのではないのか、実はこれも考えました。しかしそうしてしまうと、実は Bing API で取れるウェブ検索結果の大半は(クエリによっては)スパム的なページとなってしまいます。

また、それらの警告文があったとしてもユーザーの皆さん自身が積極的に興味を持たれたならば、それらが有害な可能性が高いと認識した上ならば読むこと自体には問題はないとも考えています(これは時間の浪費とまた混乱する話題なのですが・・・)。

これが Anonyz 開発の裏話のひとつであり、また現実でもあるのです。

Anonyz 検索の結果順位に大きな影響を及ぼしている Anonyz ランク。実は非常に単純な現象だけで順位が一気に下がるようにチューニングされています。

それは「刺激的なキーワード」や「知的とは思えない文章」を含んでいること。

よくウェブ媒体では見出しでユーザーの皆さんを釣る手法が取られ、いかに過激な見出しであるか、刺激的な見出しであるか、そしてそんな見出しは、ちょっとした好奇心からクリックしてページを開いてしまいがちです。これらが検索結果上位に現れてしまうと、Anonyz のミッションである「ウェブで時間を無駄に浪費する生活からの解放」を達成することはできません。

このような見出しを含むページはかなり Anonyz ランクが落ちて、基本的にそれらが上位に現れることは稀になっています(ただしそれらの刺激的、過激なキーワードを直接検索した場合はまた違うのですが・・・)。

Anonyz はウェブ上における言論の自由を非常に重視しています。なのでカジュアルな文章・扇情的な文章=知的ではない文章とは考えていません。その一方、ユーザーの皆さんの貴重な時間を無駄にしてしまうようなコンテンツ(ただのまとめやコピペのようなコンテンツが特にそうですね)の取り扱いにも大きな注意を払っています。

商業ベースの大規模検索エンジンであっても、上述したようなコンテンツが検索結果の上位に現れてくることがよくあります。そして Anonyz はそのような低品質なコンテンツの大量生産は大きな問題と考えています。なので Anonyz は自身が提供するサービスで、そのような課題の解決に常に取り組んでいるわけでもあるのです。

Anonyz 検索は2018年3月の提供開始以来、その検索結果には Microsoft が提供する Bing Web Search API を活用したデータを利用してきました。90年代のウェブの世界ならともかく、現代のウェブの世界ではもう個人が持つ計算リソースだけでウェブ全体のデータをスクレーピング(取得)することはまず不可能です。

しかし Bing Web Search API で取得できる検索結果をそのままの形で提供すると、Anonyz 検索の上位の検索結果として提供するだけのクオリティを満たさない、非常に品質の悪いウェブページが検索結果の上位にも多く現れることが当初から確認されていました。

そのため、Anonyz 検索では Bing Web Search API が提供する検索結果を基に、そこに含まれるページに対してクローラーを走らせたりしてページの品質を分析し、それを検索結果の順位付けに用いています。検索クエリごとにこれらのスコアは計算されており、これを Anonyz ランクと呼びます。

また、現在は表示される検索結果とそのページに対して、ユーザーの皆さんのご意見(役に立った、または役に立たなかった)などを送信していただく仕組みも取り入れており、これもまた分析された上で Anonyz ランクに影響を及ぼす用に作られています。

アフィリエイト収入を得るためだけに作られたようなユーザーの皆さんにとって時間の浪費となるような品質の低いコンテンツは、できる限り検索結果の上位に現れないよう Anonyz は日々取り組んでいます。

もしあなたも検索結果に表示されたウェブページの品質が低かった場合、迷いなく低評価ボタンを押してください。その一方、検索結果の下位にもし品質の高いコンテンツが紛れていたら、そんな時は迷いなく高評価ボタンを押してみてください。

2018年3月のサービス開始以来、Anonyz は今まで公式な広報手段を持たずにサービスを続けてきました。しかし最近はおかげさまで、いくばくかのユーザーの皆さんに使っていただけるサービスとなってきています。

サービスを使っていただけるユーザーの皆さんが増えてきている一方で、Anonyz は今までサービスに関することなどのお知らせ等は一切発信せずに提供を続けてきました。

寡黙なオトナを貫いてきた・・・否、ただの筆不精です。

Anonyz は『Anonyz 運営委員会』と名前はつけたはいいものの、実際はただの一個人が自分のための実験の場、遊びの場として作っているサービスです。

それでも使ってくださっているユーザーの皆さんがいるわけで、これ以上何も公式に音沙汰がないのもいかがなものかと思えてきたので、もうすぐ平成が令和に変わる本日よりブログの形で少しずつお知らせをお届けしようかと思います。

気分が乗らないと生粋の筆不精でご迷惑などおかけしますが、何卒これからも Anonyz をよろしくお願いいたします。