2020年になって、SEO施策において「BERT」という単語を目にすることがより増えてきました。
「BERT」とは難解なSEO施策ではなく、Googleが検索エンジンに導入したある技術のことです。
では、「BERT」とはいったいどのようなものなのでしょう?
BERTとは?
「BERT」とは(Bidirectional Encoder Representations from Transformers)の頭文字をとったものであり、Googleが採用した自然言語処理技術のことです。
自然言語処理技術とは「人間の言語をコンピュータに理解させるための技術」のことです。
注目するキーワード前後両方の関連性をAI技術によって深く学習し、サイトに書かれた文章の文脈を理解するようになりました。
英語の検索エンジンには2019年10月に、日本語の検索エンジンは2019年12月に導入されています。
BERTが導入された理由
なぜ検索エンジンにBERTが導入されたのでしょう?
その理由は二つあります。
検索エンジンの表示結果の精度を上げるため
BERTは、検索クエリとサイト内のコンテンツ内容、その両方の文脈を深く理解するようになりました。ここでいう検索クエリとは、ユーザーがGoogleなどの検索エンジンを使って検索窓に入力した単語やフレーズ、複合の単語などを意味します。
BERTによって検索クエリとサイト内コンテンツの両方の文脈を理解できるようになったため、検索するユーザーの意図とのマッチング精度が高まるようになりました。
そのため、ユーザーのニーズに合った検索結果が高い精度で表示されるようになるのです。
ロングテールのクエリに対応するため
ロングテールとはSEOにおいて、特定キーワードの上位表示を狙うのみではなく、それらに関連する様々なキーワードを検索結果に表示させることで、より幅広いユーザーの流入と、購買意欲が高いユーザーの獲得を目的としたSEO施策のことです。
検索数が多い特定のキーワードよりもアクセス数が少なく、特定キーワードに関連する複数のキーワードのことを「ロングテールキーワード」といいます。
例えば、「サプリメント」という検索数が多い人気キーワードに対して、「サプリメント ダイエット 効果」のようなロングテールキーワードや「ダイエットサプリメントの効果は」のような文章型の検索クエリがどのような意図を持っているのか文脈を理解し、それらにマッチングしたコンテンツを持つサイトを検索結果に表示させることが可能になります。
このようにして、ロングテールの検索においてユーザーとのマッチングの精度を高める事が出来るのです。
これにより、ユーザーのニーズに幅広く対応することが可能となり、サイトとの乖離を回避することに繋がります。
以上の二点において、高度な言語処理が可能なBERTにおいて期待がされています。
BERTの導入によってどう変わる?
では、BERTの導入によって検索エンジンはそのように変わるのでしょうか。
<例>
検索クエリ | 検索結果 | |
---|---|---|
BERT導入前の検索エンジン | 「チェックのシャツとスーツの着こなし」 | チェックのシャツに合うスーツ |
BERT導入後の検索エンジン | 「チェックのシャツとスーツの着こなし」 | チェックのシャツとスーツを使ったコーディネート |
上記の例のように、検索クエリの文脈を認識することで、ニーズとのギャップを埋める事が可能になりました。
BERTの精度は?
スタンフォード大学が行った、人間とBERTどちらの方が文脈を正しく理解できるか?という実験(文章読解ベンチマーク「SQuAD 1.1」)では、なんとBERTの方が高いスコアを出しました。
文章読解ベンチマークに問題として出題された文章から、正答を完全一致と部分一致で抜き出したスコアはどちらも人間を上回り、BERTはAIとして初めて人間の平均的な読解力の精度を超えました。
GoogleがBERTをオープンソースとして公開したこともあって、世界のAI研究者の手によりBERTは次々と改良され、より複雑な言語問題に対しても理解の精度が高まってきています。
引用:The Stanford Question Answering Dataset
日本語におけるBERTの言語認識力
さらには、BERTの日本語版においても同様の実験結果が出ています。もともと日本語は英語に比べて文法が複雑で難しいため、BERTを実装をしたとしても影響が少ないのではないかと言われていました。
しかし、京都大学で行われた実験では、BERTの日本語版においても人間の読解力を上回るスコアを出しました。
このため、BERTの日本語版においても検索の意図を理解する精度が高まってきていると言っていいでしょう。
BERT導入の影響が少ない検索クエリもある
しかし、BERTはAI学習により精度が高められるため、検索クエリに対してユーザーの「サイト訪問」「離脱」「回遊」といったアクションがされないと精度が高まりません。
つまり現段階でクエリと検索結果に齟齬があるキーワードは、まだAI学習が十分ではないと考えられるため、上位表示を狙いやすいキーワードといえます。
BERTアップデートに対する対策
BERTとは検索エンジンの文脈理解がより高められるためにGoogleが採用した技術です。
そのため、BERTにおける具体的な対応策というよりも、今の段階でユーザーのニーズに添った質の高い記事が作られていれば、基本的にすることはりません。
Googleが提唱しているユーザーファースト(ユーザーのためのサイト作り)を意識していれば、自然と文脈も「意図的にSEO対策を狙っているキーワードだらけの読みにくい記事」にはならないはずです。
小手先のテクニックで上位表示を狙わずに、ユーザーに感謝される記事を作るように心がけましょう!