SEO

音声検索最適化(VOC)とは?傾向と対策

ユーザーがデバイスに話しかけることによって、デバイスがそれに音声や画面で応答するというのが音声検索です。AIの進展、AmazonのEcho(サービス名はAlexa)に代表されるようなスマートスピーカーの普及、そしてなによりスマートフォンで気軽に音声検索できるため、音声検索は急速な広がりを見せています。

実は私、音声認識技術とは深く関わった経歴があり、結構な知識を持ちます。

この記事では、そのあたりの知識も無駄に披露しつつ、音声検索の具体例と、音声検索で見つけてもらえるようにするための対策についてご紹介します。

音声検索(Voice Search)とは

インターネットで検索を行う際、検索窓に文字を入力するのが一般的ですが、デバイスに話しかけることによって検索することも可能です。ユーザーがデバイスに話しかけることによって、デバイスがそれに音声や画面で応答するというのが音声検索です。

SEO(Search Enging Optimization)が検索エンジン最適化の意味であるのに対して、音声検索最適化(Voice Search Optimization)とは、テキスト検索ではなく音声検索に対しての最適化を考えるという意味があります。

音声検索エンジンの種類

現在使われている音声検索エンジンについて、2019年のMicorsoftの調査による利用率と共に挙げると以下の通りです。

音声検索エンジン利用率
Googleアシスタント36%
AppleのSiri36%
AmazonのAlexa25%
MicrosoftのCortana19%

ただこれらというのは、スマートフォンのOSや、スマートスピーカーに搭載されているエンジンです。今後のSEOに関わるところとしては、Googleアプリや、Googleマップを利用するシーンではないでしょうか。Googleアプリの検索エンジンは、従来のGoogleの検索エンジンです。話した言葉をテキストに変えて、そのテキストで従来のGoogle検索で検索します。画面での検索結果と共に「武蔵野は今日は33度で快晴でしょう。」といった具合に、音声でも返してくれることがあります。Googleマップの音声検索エンジンは、それとは別だと思われます。

Googleアプリ
Googleマップ

音声検索の普及率

2016年のGoogle I/Oにおいて、GoogleはAndroid端末を用いたモバイル検索の20%が音声検索であることを明かしました。

2019年、Microsoftの調査によれば、米国においては72%の人が何かしらの音声検索を使っていて、52%の人がスマートフォンで音声検索を用いています。

2020年、Perficientの調査によれば、55%の人が調べものをするのに音声検索を利用する可能性が高いと回答しています。

一方で日本国内だと、2022年の株式会社イードの調査によれば半数近くの人が音声検索を一度も使ったことがないと回答。もちろん使っている人も多くいますが、海外に比べると日本はまだ普及率が低いと言われています。

上述のイード社調査によればAmazonのEchoやGoogleのHomeなどのスマートスピーカー所有率が日本ではまだ1割強です。

スマートスピーカーを利用しない理由として、誤認識、意図通りに反応しないといった理由を挙げる日本人が多いこともあります。ただ米国における音声検索を利用する際の端末の1位はスマートスピーカーではなくスマートフォンです。日本で音声検索がそれほど利用されてない理由は、スマートスピーカーの普及率の問題ではないように思います。

日本語は同音異義語があるなど、英語に比べて音声認識技術は難しいです。このことがもしかすると背景にあるかもしれません。

もうひとつには、デバイスに向かって話しかけるということに対して日本人は恥ずかしいと感じる傾向があるということもあります。

参考:日本人の7割が「人前で音声検索、恥ずかしい」

ただ、それでも音声検索の利用率は向上しており、まだ向上すると予想されています。

道端で突然話し始める人がいて(見てみるとスマホに対して話している)びっくりすることはありますが、次第に慣れていくものだとは思います。

音声検索の歴史

音声検索の歴史は、初期の音声認識システムの開発から始まります。1960年代、IBMとカーネギーメロン大学が初めて音声認識の技術を開発し、1962年に公開。米国の16種類の単語の認識と10進数の数字を計算する機能を備えていました。

音声検索の実用化という側面では、2000年ぐらいからカーナビでの普及が進みました。何故ならカーナビは、運転中に文字を入力することができません。多少なり認識率が悪くても、利用価値が高かったと言えるでしょう。

しかしその頃のカーナビの音声検索は、「行き先を探す」>「住所から」>「東京都」のように、徐々に絞り込んでいく必要がありました。理由は認識率です。待ち受ける言葉の種類が少ない方が認識率が高くなるので、そのようなインタフェースとなっていました。

2007年、マイクロソフト社はWindos Vistaに音声認識の技術を採用しました。しかしパソコンで用いられるWindowsにおいて、音声で入力しようとする人は少なかったのではないかと思います。

音声検索が急速に普及した契機は、スマートフォンだと言えます。2011年にAppleのSiriが登場し、2016年にGoogleアシスタントが登場しました。

2017年にAmazonのEcho(Alexa)が登場し、家電との連携なども行われるようになりました。

音声検索のメリット

音声検索のメリットとしては以下が挙げられます。

  • 文字を入力しなくて良いので、速い。
  • 画面を見なくても良い。
  • 両手を塞ぐことなく入力できる。

音声検索のデメリット

音声検索のデメリットとしては以下が挙げられます。

  • 話さなければならない。
  • 公共の場など、声を出してはいけない場では使えない。
  • 独り言と勘違いされるリスクがある。
  • 誤認識されることがある。
  • 認識しやすい声と認識しづらい声がある。

音声検索が使われやすいシーンと内容

音声検索の対策を考える上でも重要なのが、どのようなシーンで音声検索が使われやすいかです。

上述のメリットとデメリットを踏まえ考えると、外出先で、突然話し始めても周りが驚かないようなところ、例えば街中で近くのお店を探すとか、そういうシーンに適しているように思います。

パソコンを使っている場合だと、話すよりタイピングした方が早いと思う人も多いのではないでしょうか。しかしスマートフォンだと、話した方が早いと思う人が多いように思います。

例えば以下のような検索は、もちろんテキスト検索でも行われていますが、比較的音声検索で行われやすいのではないでしょうか。

「近くの居酒屋」

「ここから○○への行き方」

また、テキスト入力の場合だと単語で入力されることが多いのが、音声検索だと、スラっと言えることからも長文になりやすいという傾向も考えられます。
例えば、次のような違いが出るのではないでしょうか。

テキスト検索の場合:「頭痛 治し方」

音声検索の場合:「頭痛の治し方を教えて」

音声検索の更なる普及の鍵「自然言語処理技術」

音声検索は話し言葉になり、長文になりやすいので、自然言語処理技術が普及の鍵を担っているといえます。その自然言語処理技術が、OpenAI社のChatGPTにより一気に進歩しました。GoogleもBardやSGEで対抗しており、精度を急速に上げています。

そこで着目すべきは、Googleが現在試験を進めているSGE(Search Generative Experience)です。SGEは、検索結果画面の上部に生成AIによる回答と、その引用元リンクを表示するという内容で試験が進められています。

音声検索対策について

「Google Home」を使った1万件の音声検索の調査結果があり、上位に表示されるコンテンツの特徴が挙げられていますが、通常の検索と傾向としては同じです。音声検索のアルゴリズムの違いを考えるのではなく、シーンの違い、検索クエリの違いを考えるべきだと言えます。

以下に音声検索の対策を挙げます。

ローカルSEO

音声検索は、「近くのコンビニ」のような検索がしやすいと言えるので、そのような検索クエリに対する対策をすることが望まれます。

「近くのコンビニ」のような検索クエリに対してGoogleは、Googleマップと対象リストを示しますので、そこで表示されるようにGoogleビジネスプロフィールに登録し、口コミを集めるといったローカルSEOと言われる対策をしっかりしておくと良いでしょう。

会話形式の質問の回答に表示されるようにする

会話形式の質問の回答に表示されるようにするには、その質問に対して端的に、分かりやすい文章がコンテンツに含まれていることが望まれます。かつ、その質問に対してある程度網羅的に書かれている記事がSGEの引用元にも採用されやすい状況です。

FAQコンテンツがページに含まれていると、会話形式の質問とその回答が含まれやすくなると言えるでしょう。FAQの構造化マークアップまで実装しておくと、よりGoogleにFAQの内容が認識されやすくなります。

スマートフォン対応

音声検索に限った話ではありませんが、ユーザーはスマートフォンで検索している、ということを重視したウェブサイトづくりをしましょう。モバイルファーストインデックスと言って、GoogleはPC向けのページではなく、モバイルのページをインデックスし評価する仕組みに現在なっています。

まとめ

音声検索が増えたからと言って、特別な対応が増えるわけではありません。ただ、ユーザーは音声検索をしているということを念頭に、SEO対策を行っていきましょう。

著者のイメージ画像

株式会社BringFlower
稲田 高洋(Takahiro Inada)

2003年から大手総合電機メーカーでUXデザインプロセスの研究、実践。UXデザイン専門家の育成プログラム開発。SEOにおいても重要なW3Cが定めるWeb標準仕様策定にウェブアクセシビリティの専門家として関わる。2010~2018年に人間中心設計専門家を保有、数年間ウェブアクセシビリティ基盤委員も務める。その後、不動産会社向けにSaaSを提供する企業の事業開発部で複数サービスを企画、ローンチ。CMSを提供し1000以上のサイトを分析。顧客サポート、サイト運営にも関わる。
2022年3月に独立後、2024年4月に株式会社BringFlowerを設立。SEOコンサルを活動の軸に据えつつ、AIライティングツールの開発と運営を自ら行う。グッドデザイン賞4件、ドイツユニバーサルデザイン賞2件、米国IDEA賞1件の受賞歴あり。