fbpx
共著書籍「データ分析の進め方 及び AI・機械学習の導入の指南」が出版されました

人工知能はSEOをどのように変化させるのか

人工知能はSEOをどのようにして変化させるのか AI・機械学習・ディープラーニング
人工知能はSEOをどのようにして変化させるのか

(この記事は、許可を得た上「I, Search: How AI Will Transform the Landscape of SEO」を翻訳・適宜意訳したものです。著作権はオリジナル記事に帰属します)

人工知能は検索エンジン最適化1界隈でホットな話題になっていますが、間違った理解もされているようです。

AIについて広く信じられている事は、特許や検索エンジンの挙動からの推測に基づいています。不幸なことに、この推測が懸念を生み、そして懸念がその産業への忌諱を生んでいるのが現状です。実務家たちがSEOサービスの“AI証明”を達成するまでに、どれほどの時間がかかるでしょうか?

AIについて最も知っておかなければならない事柄に、AIは決して固定的な公式で動いているわけではない、ということです。最も適切であろう検索結果を短時間で特定し、整理して表示するには、常に進化するシステムを構築しなければなりません。それは検索エンジンには無数の変数が潜んでいるからなのです。

AIは既知のデータによって訓練されます。例えば以下のものがあります。

  • コンテンツ
  • リンク
  • ユーザーの挙動
  • 確信
  • 引用
  • パターン

そして、ユーザーが最も必要としているであろう検索結果を表示する要因をランキング付けするには、ユーザーの体験やビッグデータ、機械学習をもとにしたデータを分析することになります。

これまでの経緯

過去の検索アルゴリズムは、まるで洗練されていませんでした。タイトルや見出し、タグに検索ワードを当てはめ、コンテンツ内から最適であろう結果を提供しているだけでした。多くの競合他社も同様のことをしていましたが、つまり、どれだけ早く、どれだけ多くのページにキーワードを当てはめることが出来るのかという仮想競争に発展したのです。

SEOを利用し自身のページに誘導しようとする者達は、ページにキーワードを当てはめる方法に関して創造的な新しい手法を模索することになります。その手法は、検索エンジン以外にはまるで使いようのない馬鹿馬鹿しいものもありました。テキストを背景色に塗りつぶして画面から見えなくしたり、Z-indexを使ってスタック順序を変更したりと、殆どうわべだけの手法を使っていたのです。

幸運な事に、そのような初歩的な戦術を上回るような対抗的アルゴリズムが見つかるのにそれほど時間はかかりませんでした。グーグルのアルゴリズムがリンクを重要視するようになり、正規のリンクとスパム的なダミーリンクを区別することが可能になりました。

SEOへクラックを仕掛ける者や、悪意は無いが間違った情報を提供しようとするマーケッターとの闘いを経て、グーグルはPenguin 1.0をリリースし、焦土作戦を展開することになります。その過程において多くの正規ビジネスホームページが検索エンジン上で表示されなくなったのです。

現在において

過去数年において、アルゴリズムがゲーム的なランキング付けから脱却するにつれ、漁夫の利を狙う者たちは排他されることになりました。しかしながら、新しいアルゴリズムは、正規のデジタルビジネスにおいて、コンテンツ発達やリンク構築、技術的SEOへの理解を深めなければならなくなりました。効率的なSEOキャンペーンを行うには三つのルールに従わなくてはなりません。

SEOの技術はキーワード密度といった単純な方程式によって成り立っています。こういった方程式によってユーザーエクスペリエンスの向上や検索エンジンのための全体的な試みを行っているのです。ユーザーエクスペリエンスを示すような要因、例えば携帯での反応速度、ページスピード、引用までの時間は今日のSEO技術において重要な役割を占めます。

Penguinの登場によってリンクはもはや重要なものではありません。有用である正規の編集リンク(legitimate editorial links参照)のみが安全かつ長期的結果を残すようになりました。グーグルウェブマスターガイダンスの適用外にあるリンクが短期的結果を残すことはあるかもしれませんが、最終的にはペナルティーを受け、人の目に触れる事はなくなるでしょう。

「コンテンツ・イズ・キング(コンテンツこそが王様)」というよく使われたフレーズも依然として有効でありますが、より正確に語るのならば「かみ合うことこそが王様」と言えるかもしれません。キーワードが散りばめられた単純な文字の羅列はもう検索結果に表示されることはありません。検索アルゴリズムはユーザーにかみ合った高品質のコンテンツを提供するようになったのです。もし、ユーザーにとって有用でないのならば、有機的検索においてランク付けされることがなくなります(high-quality content that engages users参照)。

将来に向けて

人工知能は、検索エンジンの最適化に革命をもたらすことになるでしょう。固定的な方程式ではなく、ユーザーエクスペリエンスやビッグデータ、はたまた機械学習がユーザーに適した検索結果を提供し、同時に学習を続けることでしょう。

「さあ、シートベルトを締めて。これから面白い旅が始まるよ!」

キーワードフレーズの終焉
キーワードを中心としたコンテンツを追及する日々はもはや過去のものとなりましょう。グーグルの潜在的意義インデックスをもとにしたナレッジ・グラフがこの分野において最初の変化をもたらしましたが、ランクブレインが電撃的に参戦することになりました。

RankBrainは、検索結果プロセスを支援するグーグルの機械学習人工知能システムで、グレッグ・コラード氏によると全く新しいプロセスを経ています。

RankBrainは人工知能を用いて、無数の言語をベクトルと呼ばれる数学的エンティティーへと置き換え、コンピューターが理解できるようにします。ランクブレインが馴染みのない単語やフレーズに触れると、機械は同様の意味を持っていると推測される単語を推測し、以前になかった検索クエリーを効果的なものへとするのです。

グーグルによると、RankBrainはウェブページのランク付けアルゴリズムにおける第三の要素となりました。それまでのアルゴリズムとは違い、クエリーを分析し、検索ワードに使われていない関連するコンテンツを導きだす事に非常に優れているのです。

コンテンツに特定のキーワードを繰り返し押し付けるのではなく、自然にタイプされた単語やフレーズに集中できるようになったのです。グーグルはコンテンツに含まれる内容をもとにしてウェブページのランク付けを行うことができますが、正しい状況下においては、ページに含まれていない情報をもとにしてランク付けすることも可能です。これによって、自然体であっても、関連する用語やコンセプトに触れることができるのです。これはユーザーにより良い価値を与えるだけでなく、グーグルがランク付けの参考にすることもできます。

検索の意図

もし、競争優位に立ちたいのでしたら、検索の意図について理解し、計画を立てる必要があります。訪問者が“何を探しているのか”、ではなく、“なぜそれを探しているのか”、ということです。グーグルは、この“なぜ”に関して長らく理解を深めてきましたが、近年もてはやされてきた人工知能が当分野において重要になるであろうことはあなたも気がつくことでしょう。

検索用語のみならず、訪問者が解決しなければならない問題は何かを考えなければならないでしょう。

検索の意図に関連した4つの検索クエリーのタイプがあります。

  • ナビゲーション・クエリーは、特定URLの特定コンテンツをユーザーが探す時に行われます。
  • 情報クエリーは、広いトピックを内包し、情報を提供することが目的となります。クリックやページの査読といった行動が必要ではありません。
  • コマーシャル・クエリーは、購入意図を持ったユーザーや、購入にするにあたって情報を探るユーザーのためのクエリーになります。
  • 処理クエリーとは、時事通信や、アカウント作成、支払いにおけるサインアップ活動などを内包しています。

次に何がくるのか

ここまではまだまだ氷山の一角に過ぎません。

もとの検索の意図にユーザーが満足した後、訪問者が何を必要としていたのか推測しなければなりません。

“ソードフィッシュのFBIエージェント”と検索したら、2001年のアクション映画のDEAのダミー企業から4億ドルを盗み出そうとする対テロ隊員にまつわる情報を得る事でしょう。

Wikipediaは最大の地位を得ていますし、IMDBは2,3番手に位置しています。これらのリンクと内容の情報量と質は大変高いものですが、それだけで高いランク付けがなされるものでしょうか?

私はそう思いません。

あなたが一つのページから潜在的に見るかもしれないリンクの方向性を考えてみましょう。ここではIMDBの例を取ります。ソードフィッシュの内容については既に十分すぎるほどの情報を得ており、以下についての詳細リンクもあるでしょう。

  • 映画に関わる全ての俳優、監督などの情報
  • それらの人物が関わる、その他の映画やテレビ番組
  • 第三者による映画レビュー
  • 映画に関連した掲示板
  • 似たような映画やテレビ番組

これらすべての情報は相互連結しているという事を考慮すると、最初に思い浮かんだ疑問のほとんどはIMDBの外を出る事なく得る事ができるでしょう。これと全く同じ理由で、ウェブサイトを訪問した後はウサギの穴に入り込んだように私は感じるのです。

IMDBはコンテンツ発展において多大な労力を払っており、競争的市場で生き残るには努力は不可欠です。しかし、あなた自身のより小規模なウェブサイトにIMDBのモデルを適用できるでしょうか?

あなたのウェブサイトにおいても、AIの神様はきっと微笑んでくれるでしょう(ビットデータが笑うとどんな感じになるのでしょうか?)

このように考えてください。AIの目標はユーザーが欲しているようなコンテンツを提供することにありますよね。では、以下の場合どちらがより適しているでしょうか。

  1. 信用できるドメインより、特定のページをユーザーに送信
  2. 最初のクエリーの回答を見た“後に”検索したユーザーのクエリーに即したコンテンツを含んでいる特定ページを送信。

答えは簡単です。

戦略を有利に行うには、典型的な購買決定の段階に、あなたのコンテンツを区分けするのです。最初に始まり、それからプロセスを通して発生するような潜在的疑問に関してコンテンツを発展させるのです。

訪問者の購買決定の段階は以下になります。

1.)好奇心

この段階では、誰かのソーシャルメディアのシェアや検索結果によって出た広告に訪問者の目が留まった段階です。彼らはあなたの企業や製品、サービス、業界についてはまだ何も知りません。よって、彼らの疑問は、あなたの製品やサービスが一体なんであるのかという疑問になります。

2.)興味

訪問者はあなたが提供するものが何であるのか興味を持つでしょうが、それが自身に適しているものなのかはまだ分かりません。彼らの疑問は、彼らにとっての“特別な”用益になるのかということです。ここでは、固有の製品・サービス特徴を伝えるのが良いです。

3.)購入決定

この段階になると、訪問者はあなたの製品の価値を理解し、競合他社の製品の評価もするでしょうし、最終決定に繋がるような情報を探索することになるでしょう。この段階での良いアプローチの仕方は、競合他社との差異を示すことです。例えば、〇〇賞受賞だとか、保証期間、インセンティブをもたらすような価値などが相当します。

よりディープな検索興味の幅

検索クエリーは同様であっても、状況が異なれば彼らの興味は全くの別物になってしまうでしょう。

例えば、金曜の3時ごろにデスクトップPCから“タイ料理”と検索したとしましょう。その場合はその日のディナーの情報を探していると言えます。ですので、料理や店のインテリアの写真に興味を示すこととなるでしょう。一方で、火曜日の12時05分、ドライビング中にiPhoneで同様の検索をした場合はどうでしょうか。そうした場合はすぐに見られるお店のレビューやドライビングルートを示すのが適しているかもしれません。

多くの要因が検索興味に影響をもたらすのです。

時間、日にち、曜日など

AIによる検索の時間的要因の例を挙げましたが、もっと深く言えば第何週であるとか何月であるかとか、はたまた何年であるのかという事も要因になり得ます。

アルゴリズムは、現在の地点からみた周辺のイベントに重みづけを行うことが出来ます。9月から10月にかけて“私の周りの出来事”と検索すると、グーグルはユニバーサル・スタジオのハロウィーン・ホラー・ナイトと表示するはずです。

場所

携帯でガソリンスタンドを検索したのならば、ガソリンの量が少ないであろうことは容易く想像がつきます。よって、現在の位置から最も近いガソリンスタンドを表示するのが良いでしょう。

しかし、その他に場所に関係した検索興味の例はあるのでしょうか?

私はフロリダ州タンパ市で、デジタル・マーケティング・エージェンシーとして活躍しています。ですので、タンパ市で検索を掛けられた時は、他の都市で活躍する同業者と比較して私のことが検索結果に表示されやすいでしょう。

デバイス(iPhone, アンドロイド、アレクサ、グーグルホーム)

アレクサやグーグルホームに製品について尋ねると、それが欲しいものである、もしくは後に購入するための情報を集めているものだと推測されます。

ここでは、アルゴリズムは特定の目標を持っています。すなわち、訪問者が購入するであろう製品の情報を提供することにあります。

スクリーンに映った検索結果のページをデータ化することは簡単でありますが、音声での検索の場合は遥かに難しいものです。

PPCであっても、不満が多かったり、レビューが不足したり、はたまた記録の追跡に制限があるような企業は恐らく、音声検索に乗り出さないことでしょう。それは、論争の種になってしまうかもしれないからです。グーグルの主目的は顧客を満足させることにあり、そして真っ先に顧客が求めているものを提供することにあります。

音声検索

音声検索を備えた人工知能は、向こう10年以内において検索エンジンに劇的な変革をもたらすと考えられています。

過去のアルゴリズムとは違ってAIは結果から学習するというユニークな能力を有しており、音声検索によってより早く、そして正確になることでしょう。

人工知能検索に関連したユーザーエクスペリエンスは、様々な方法で測定することが出来ます。例えば…

  • ユーザーは検索結果に満足したのか、もしくは新たにクエリーを入れなおしたか?
  • もし、ユーザーが検索結果に満足していないのだったら、次に何を入れたのか、最初のクエリーのどこを修正したのか、もしくは全体を修正したのか?
  • ユーザーは音声検索から伝統的な検索に戻ったのか?その時ユーザーが求めていたものは見つかったのだろうか?
  • ユーザーの声は通常の会話で行われるような大きさであったか?もしくは興奮した様子だったのか?検索中に口調は変わったのか?

音声は複雑な要素を含んでいます。なぜならば、検索フレーズも多様だからです。例えば、私の運営するサービスをユーザーがテキスト検索しようとするならば“タンパ市 ウェブデザイン”と入力するでしょう。しかし、音声検索の場合となると、より会話口調に“タンパ市でウェブサイトのデザインを依頼できるところ”といった形になるでしょうか。

AIはいずれのクエリーも基本的には同じものだと理論的理解をする一方で、特に初期の段階では手を加えていくことが有効でしょう。これは適切なコピーライトという単純な問題です。

ウェブサイトの滅亡

私のウェブデザインの依頼を受けた方から、このような言葉が聞かれます。しかし、今日知る限りでは、ウェブサイトが滅ぶのは不可避でありましょう。

そんなことはあり得ない、と考えていませんか?しかしながら、携帯の通信トラフィックが馬鹿げた量になっているとみんなが考え始めたのはほんのつい最近であり、今や携帯はウェブトラフィックの半数以上を占めています。

ウェブサイトの滅亡とはいっても、デジタルの存在そのものが消え失せるというわけではありません。むしろ、今後一層重要となることでしょう。もちろん、伝統的な企業のウェブサイトにアクセスできなくなるというわけでもありません。私が言いたいのは、伝統的なウェブサイトの概念が覆るということです。

特定のURL内のコンテンツは、もっとデータ集中的なコンセプトになることでしょう。HTML/CSSのような形式が減り、図表やXMLといった新しい形になるであろう、ということです。AIの性能が向上し検索アルゴリズムにおいて重要な役割を果たすようになると、検索エンジンはユーザーのニーズをより反映したデータを抽出し、潜在的に適合したものを提供するというよりももっと直接的にデータを表示することになりましょう。

まだ納得がいかないようですか?グーグルはアンドロイドのアプリ開発において同様のコンセプトを試みようとしています。シンディー・クラム氏は携帯における音声の導入に関わった者達の一人で、近年のウェブコロジーの有意性をグーグルや市場、ユーザーに投げかけました。グーグルがすぐにウェブサイトやなどのデータ構造の整理を実施するであろうことは理論的であります。

ビッグデータ

人々はデータに突き動かされる市場に詰め掛けています。理由は純粋にそれが有用だからです。巨大なデータセットは、かつて特定できなかったパターンを特定できるようにします。グーグルやフェイスブックほど多くのデータを持っている企業はありません。

人工知能を利用すれば、検索アルゴリズムはビッグデータを分析し、トレンドの重みづけを果たし、そしてユーザー間の類似性を比較することができます。例えば類似性を比較するにあたって以下の基準などがあります。

・所在地
・職業や専門性
・学歴
・趣味や興味
・健康状態
・文化的信念
・過去の検索やウェブサイト訪問歴
・年齢
・支持する政党
・ソーシャルメディアの活動
・レビュー(グーグル、フェイスブック、アマゾン、イェルプなど)
・人種
・その他ユーザーとのつながり
・性指向性
・雇用主
・購入履歴
・性別
・時間や日にち
・宗教
・結婚の有無

ビッグデータはユーザー行動のパターン・傾向・検索に対する満足度を即座に特定し、リアルタイムで検索制度を向上させます。

自己創造的アルゴリズム

AIの持つ特徴で最も興味深い事は、機械学習は完全に自立したランク付けを行い改良するという点にあります。

グーグルによると、AIは自身のランク付けをブラックボックスの中で行います。では、エンジニアはAIが何を基準とし、どうやってガイダンスを作ったのかを説明が出来ないということなのでしょうか?もしくは、公式のガイダンス無しで、どうやってそれに従えばよいのでしょうか?

長期にわたってウェブコロジーを広めてきたSEOのデイブ・デイビス氏はこう考えます。

グーグルがAIを扱い、ランク付けの要因を自動で作るという点において、興味深い現象が確認されています。

ランク付けアルゴリズムを開発するグーグルと、それらを最適化する方法を理解しようとするSEOの間にはイタチごっこが過去に渡って行われています。このイタチごっこは、アルゴリズムそのものは知識ベースによって動いているという中核的信条から発生しています。非常に複雑で様々な変数に渡る重みづけの公式をリバース・エンジニアリングするためには、多大な時間が必要とされるのです。もちろん、アップデートの間に十分な時間はありませんが、中核的信条に従い、少なくとも基本的な変数やおおよその重みづけで理解することで最適化を達成しようとしているのです。

AIが活躍する環境において興味深い事に、AIエンジニアは機械がどのようにしてその特定の決断に至ったのかを完全に計算できないということが挙げられます。そして、エンジニアが計算できないという事は取引企業も計算が出来ません。しかしながら、人間にデザインされたAIが行う計算はほんのワンステップで完了します。アルゴリズムを理解し、リバース・エンジニアリングする能力があれば、以前SEOが行っていた仕事を確かに減らすことになるでしょう。重みづけの範囲を自動で変えるのみならず、新たに重みづけされた変数は人の手を借りる事なく追加されたり除外されたりします。つまり、以前には思いもよらなかった変数の検証が自動で行われるのです。

このことはSEO産業にとって完全な変革をもたらすことでしょう。グーグルとその他の消えていった産業との攻防を見るにあたり驚くことは何もありません。勃興する企業に取って代わられ、“どの因子がアルゴリズムに加えられ、素晴らしいコンテンツを作ったのか”に対する答えに似ているのですから。

SEOに対するクラッカーとの闘い

一般に考えられている事とは対照的に、SEOに挑戦するクラッカーは大勢います。クラッカー達は検索エンジン最適化の仕組みを高度に理解しており、他者には分からない綻びを見つけることができ、その綻びを悪用する能力を有しています。日々彼らは検索エンジンと知恵比べを繰り広げているのです。

しかしながら、長期的戦闘においてはAIに潜在的な分があると言えるでしょう。

MITのコンピューター科学・人工知能研究所は近年、特定状況下において人がどのように振舞うのかを予測するアルゴリズムを作りました。このアルゴリズムはYouTubeでクリップされたテレビ番組、例えばザ・オフィス、ビッグバン理論、やけっぱち主婦などを600時間“視聴”して訓練されたのです。

アルゴリズムの訓練が終えた後、研究者は新しいビデオシリーズを示し、行動が起こされる寸前でクリップを停止しました。すると、アルゴリズムは43%の精度で次に何が起きるのかを予測したのです。

これはBlue CRUSH2ではありませんが、グーグルがSEOクラッカーの戦術を見破るようなコンセプトの一端となるのは明らかでしょう。

AIはクラッカー達の過去の技術を学習し新しい技術を監視するよう訓練することができますが、潜在的な到達点はまだまだ先にあります。クラッカー達のパターンを特定し、将来行われるであろう人的技術を予測するようになるでしょう。最終的には、アルゴリズムはSEOクラッカーの人間的行動について学習し、部分的に排除することに成功するでしょう。

意図しない結果

AIが立派に機能することもあれば、怪しい挙動を示すこともあるでしょう。

結果が破滅をもたらすという可能性は存在します。AIについて、特にその技術について詳しいエロン・ムスク氏とステファン・ホーキング女史は、AIは“悪魔を召喚”するようなものであると語りました。グーグルのエンジニア達さえもシステムに緊急停止スイッチを備えるようにしています。

グーグルの研究者が進めるDeepMindチームは、スペースインベーダーやポンといったアタリのゲームを学習できるような人工知能を開発しました。学習効果を示すため、このAIにゲームのルールを教える必要はありません。結果はスコアの高得点と共に、予想しなかった成果をあげました。

例えば、シークエストというゲームにおいて、AIは酸素の枯渇から潜水艦を守る為、水面近くにずっと停滞することを学んでしまいました。

では、検索において意図しない結果が出るのはどういうときでしょうか。

既に知っている事から説明しましょう。検索エンジンは、ポジティブなユーザーエクスペリエンスに従ってユーザーに提供をしますが、ユーザーエクスペリエンスがポジティブであることを示す指標にウェブサイトの滞在時間の長さがあります。

この点において、誤った方向性に行ってしまう事態を想定するのは難しくはありません。良い情報を提供すれば訪問者のページ閲覧時間は長くなりますが、その他にも要因はあります。

  • ページ表示速度が遅い
  • 不適切なナビゲーション
  • 非動作的要素
  • テキストサイズや色の問題
  • 押しつけがましいポップアップ
  • バックボタンの故障

こういった場合において、AIは望ましくない事象をポジティブなランク要素として解釈してしまうことがあります。

その他にも、AIが最高のユーザーエクスペリエンスだと誤認してしまうであろうシナリオもあります。

素晴らしいコンテンツを見つけたとしましょう。そうするとグーグルのアルゴリズムはユーザーのニーズに沿っており、しばらくの間そのページは高ランクに位置付けることになります。その後、ユーザーはそのコンテンツにアクセスするためのオプトイン項目に記入する事を決定しました。

訪問率は急激に跳ね上がることになり、その他の要素とともに、AIは最良のコンテンツを提供するのに誤った判断を下してしまうのです。たとえ、そのページが検索エンジンには見えなくなったとしても、です。

そのコンテンツが特定の検索クエリーにおいて最適な結果を与えているとAIが判断するため、グーグルは既に古いページのキャッシュを保有しています。そして、検索者に自身のサーバー上に残っている古いキャッシュのバージョンのページを提供しています。彼らはクロームユーザーのためにURLをマスクすることができ、彼らのというよりあなたのためのウェブサイトのように提供するのです。

検閲

AIがひとたびガイドラインを作ってしまえば、正しい・誤っているという判断が必然的に作られます。そこから、次にどうなるかというと他のトピックも同様に正しい・誤っているという判断が形成される事になります。例えば、政治的見解や社会問題、製品・サービスのモラル性といった問題にも波及することでしょう。

ジョージア州のエンターテイメント・リサーチ研究所の研究は、人間によって選ばれた物語の正しい・誤っているという判断を下す訓練をAIに行っています。AIがストーリー内で示された行動がポジティブなものであると判断すると、ロボット金賞が与えられます。

今日の検索エンジンが賛同出来ない技術を使ったウェブサイトにペナルティーを課すのと同じように、将来の検索エンジンでは適切ではないようなアイデアを打ち出すウェブサイトにペナルティーを課してしまうかもしれません。

まとめ

人工知能はSEO産業界に破壊的な力をもたらすことになり、特に初期段階では予測していなかった成果が生まれることになるでしょう。しかし、長期的な視点からではユーザーや検索エンジン、果てはデジタル市場にも良い影響力をきっと与えることでしょう。

AIによる有機的な検索の成功は、究極的には良きユーザーエクスペリエンスをもたらすことでしょう。つまり、彼らのニーズに合った素晴らしいコンテンツを提供し、如何なるデバイスにおいても容易くアクセスすることが出来るようになっていくはずです。


  1. search engine optimization: SEO

  2. IBM’s Blue Crime Reduction Utilizing Statistical History

タイトルとURLをコピーしました