コンテンツの信頼性に言及する複数のガイドラインをあたれば、コンテンツでの主張の根拠となる出典を明記することが非常に重要であることがわかります。これはGoogleが重視するコンセプト「E-E-A-T」の向上にも欠かせません。本稿では、Wikipediaを例に、Googleの検索品質評価ガイドラインを含む各種のガイドラインを参照しながら、出典の明記がSEOに及ぼす影響について解説します。
目次
コンテンツの信頼性
世界の主要16カ国の検索データを元に、ランキングや検索ボリュームなどの要素を組み合わせて計算した検索露出ランキングであるSearchmetricsのSEO World Rankings 20201によれば、検索露出の年間世界チャンピオンは、それ以前の数年と同じく2019年もまたWikipediaだったそうです。
なぜWikipediaはそこまで検索エンジンに信頼されるのでしょうか? 圧倒的なコンテンツ量や内部リンクによる最適化など、その理由はいくつも挙げることができますが、ここでは「コンテンツの信頼性」に限って議論を進めます。Wikipdedia のコンテンツの信頼性には、Google が推奨する E-E-A-T向上のための重大なヒントがあるからです。
出典の明記と信頼性
Wikipediaの執筆や編集は誰でも行うことができますが、その内容には「検証可能性」が求められます。閲覧者や他の編集・執筆者が内容を検証できるように、信頼できる情報源を参照しておく必要があるのです。この方針について説明したページには、次のような説明があります。
- 記事に新しい内容を加筆するときは、信頼できる情報源 ―出典(参考文献)― を明らかにすべきです。出典が明示されていない編集は、誰でも取り除くことができます(出典のない記述は除去されても文句は言えません)。
Wikipedia:検証可能性 – Wikipedia2
上記が示しているのは「信頼できる出典が明示されていない記述は削除される」ということです。2023年4月現在、Wikipedia全体で1億人を超える登録者がおり(うち日本語版は192万人)、活動中の登録者は30万人(うち日本語版は1万5千人)です3。これらの人々による監視が、Wikipediaの信頼性を担保しています。
Wikipediaを使ったことのある人なら、出典が足りておらず、したがって真偽不明とみなされた記事に貼られている下記のようなテンプレート4を見たことがあるでしょう。これは協力要請であるだけでなく、閲覧者への注意喚起としても機能しています。出典が不足しており信頼性が不十分な記事はそれとわかるようになっているのです。
上記の画像にあるように、参考にした情報源を出典として記事内に明記することで、記事の信頼性を向上させることができます5。信頼できる情報源を参照することは、記事の信頼性を担保するとともに、それを読者に伝える意味も持ちます。またそれは読者だけでなくGoogleにも伝わり、検索結果での露出を増やします。
出典の信頼性
出典に使用する情報源は、どこの誰がどんな意図のもとに書いたかわからず、出処も真偽も不明なものでは不適切です。情報源は信頼できるものである必要があります。Wikipedia はこの点について複数のページを使って繰り返し丁寧に説明していますが、中でも特に端的にまとまっている箇所を以下に示します。
「信頼できる」という語に明確な定義はありませんが、大部分の人は直感的に判断できます。一般的に、最も信頼できる資料は、査読制度のある定期刊行物、大学の出版部によって出版されている書籍や学術誌、主流の新聞、著名な出版社によって出版されている雑誌や学術誌です。
常識的な判断として、事実の確認、法的問題の確認、文章の推敲などに多くの人が関わっていればいるほど、公表された内容は信頼できます。自己出版されたものは、紙媒体であれオンラインのものであれ、一般的には信頼できるとはみなされません。
Wikipedia:独自研究は載せない – Wikipedia6
出典が示されないまま執筆された記事は、読者がその信憑性を評価することができません。その一方で、信頼できる情報源を複数にわたって参照しながら丁寧な記事制作を行っていれば、内容の信憑性は自然に高まります。これはWikipediaに限ったことではありません。あなたが書く記事も同様です。
盗用・剽窃の防止
盗用・剽窃とは「他人の文章やアイデアを自分で考えたこととして書くこと」をいいます。コンテンツで表現される知識のほとんどはその書き手が自分で最初から考えたことではなく、どこかで見聞きした情報やアイデアが含まれているものです。そうした他人の情報やアイデアをあたかも自分のものであるかのように書けば、それは盗用・剽窃です。
重要なアイディアを他人の文章に頼ったりした場合は、その文章の出所を(つまり、だれがどこに書いた文章であるかを)、引用や参照のルールにのっとって示し、その部分は自分の書いた文章(あるいは自分で考えたアイディア)ではなくて、誰かから借りたものであることを明らかにする必要があるのです。この要件を満たせば、適切な「引用」といえます。他人から借りた文章やアイディアの出所を示さずに、自分の書いたものとして提出すると、不正な「盗用」または「剽窃」となるのです。
レポート・論文における盗用・剽窃行為について – 早稲田大学7
盗用・剽窃は重大な不正行為ですが、残念ながらウェブ上の日本語コンテンツでは、さも当然であるかのように横行しています。しかし、盗用・剽窃をする書き手は信頼できません。これはGoogleから見ても同じです。自分のアイデアでない部分についてきちんと出典を明記することは、盗用・剽窃を防ぐという重要な意味もあります。
ガイドラインに見る出典の重要性
Wikipediaに限らず、コンテンツの品質や信頼性を高めるための各種のガイドラインには、ほとんどと言っていいほど出典についての注意があります。ここでは、米スタンフォード大学、Google検索セントラル、Google検索品質評価ガイドライン、CRAAPテストの4つを例に、出典の重要性について見ていきます。
スタンフォード大学によるガイドライン
米スタンフォード大学は、Webサイトの信頼性を高めるための10項目のガイドラインをまとめ、公表しています。いまから20年以上も前、2002年のことです。このガイドラインは、4,500人以上を対象とした3年間の調査に基づいているそうです。その最初の項目は以下のもので、出典の明記がウェブサイトの信頼性を高めるというものです。
第三者による裏付けとなる根拠(引用、参照、出典)へのリンクを提示することで、ウェブサイトの信頼性を高めることができます。たとえ人々がこれらのリンクをたどらなかったとしても、あなたは自分の資料に対する自信を示すことができます。
The Web Credibility Project: Guidelines – Stanford University8
以下、このガイドラインの10項目の抄訳を紹介します。詳細について知りたい方は原文を当たってください。なおこのガイドラインについて筆者の率直な感想は「1を除けば常識的な内容だ」というものです。となれば「1」もまた他の項目と同じ程度に常識として、当然のものとして実施していくべきものなのでしょう。
- 裏付けとなる出典へのリンクを提示する。
- サイトの運営者情報を掲載する。
- 所有資格や他の機関との連携など専門性を強調する。
- サイトを運営する人々の人間性を強調する。
- 連絡先情報(電話番号、住所、メールアドレス)を明示する。
- 目的に合ったプロフェッショナルな視覚的デザインを採用する。
- サイトを使いやすく便利にする。
- サイトのコンテンツを頻繁に更新する。
- できれば広告の表示を避け、掲載する場合はコンテンツと明確に区別する。
- 誤字脱字やリンク切れなどの間違いをなくす。
Google 検索セントラル
この記事を読んでいる人であれば全員が目を通しているだろう記事、Google検索セントラルの「有用で信頼性の高い、ユーザーを第一に考えたコンテンツの作成」には、作成しているコンテンツが有用で信頼できるものであるかどうかを自己評価するための質問として、次の記述があります。
- コンテンツは、明確な情報源、掲載されている専門知識の証左、著者またはコンテンツを公開しているサイトの背景情報(例: 著者のページへのリンク、サイトの概要ページ)を示すなど、掲載内容が信頼性の高いものであることを示すための情報を提供していますか。
有用で信頼性の高い、ユーザーを第一に考えたコンテンツの作成9
しかし残念ながら、この翻訳された日本語には多少の違和感があり、本来の意図が十分に伝わるものとは言えません。このようなときには英語版にあたることで、意図を十分に汲み取ることができることが多くあります。実際に英語版10をあたってみると、前掲と同じ部分の記述は次のようになっています。
Google はコンテンツの信頼性を高めるために掲出すべきものとして「明確な出典」と「専門性の根拠」と「著者やサイトの詳細情報」の3点を挙げています。ここでもまた、最初に挙げられているのは「出典の明記」です。Googleもまたコンテンツの信頼性評価において出典が明記されていることを重要視していることがわかります。
Google 検索品質評価ガイドライン
E-E-A-T(経験、専門性、権威性、信頼)の概念で知られる「Google検索品質評価ガイドライン11」にも、出典に言及している箇所が複数あります。下の画像は2022年版の65ページにあるもので、高品質ページの例として挙げられており、当該ページはWIkipediaのアメリカ南北戦争の記事12です。
画像中央のセルには高品質と評価した理由が書かれており、右のセルにはその説明が書かれています。右のセルに書かれている「複数の出典が記事のE-E-A-Tを後押ししている(The citations support the E-E-A-T of this article.)」という記述は印象的です。この説明を元にまとめると、このページを高品質と評価した理由は次の通りです。
- 複数の出典が記事のE-E-A-Tを後押ししている。
- 労力をかけて正確に深く掘り下げた独自のコンテンツが大量にあり、満足度が高く、ページの目的を確実に達成している。
- このウェブサイトは良い情報源として好評を得ている。
次に、下の画像はGoogle検索品質評価ガイドライン2022年版の116ページにあるもので、クエリ(キーワード)との適合性が高いページの例として挙げられているものです。このときのクエリは「STEM教育」で、表示されたページはFOXニュースの記事13となっています。
右のセルの説明によれば、このクエリは話題の範囲が広く、ユーザーによって探しているものが異なる可能性があるクエリですが、いずれにしても正確性と信頼性が重要であるといいます。このFOXニュースの記事をクエリに対する適合性が高いと評価した理由をまとめると次の通りです。
- 著名なニュースサイトに掲載されたニュース記事である。
- 米国におけるSTEM教育改革への最新の取り組みを網羅している。
- 専門機関を情報源とした複数の出典を含んでいる。
この記事では、専門機関によるデータとして国立数理科学イニシアチブによる統計と米国ガールスカウト連盟による調査結果にリンクしているほか、専門家による意見として複数の教育NPOの談話が掲載されています。こうした専門性の高い裏付けがあることで、正確性、信頼性が達成され、クエリに対する高い適合性が評価されています。
ここで挙げた2例からは、Googleが「コンテンツの正確性や多視点性」や「出典の明記」や「サイトの評判」などを重視していることがわかります。E-E-A-Tとは具体的には、こうしたことが実現されている状態と考えてよいでしょう。また、出典を明記することがE-E-A-Tを後押しするという見解は重要です。
CRAAP テスト
カリフォルニア州立大学チコ校の図書館司書サラ・ブレイクスリー氏らが2004年に開発したCRAAPテスト14は、出典の信頼性を評価するテストとして、世界中で、学問分野を超えて幅広く使われています。このエッセンスを抜き出して司書のアメ・マロニー氏が簡略化したもの15が次の画像で、その下が筆者による和訳です。
不適切 | 要注意 | 適切 | |
---|---|---|---|
Currency 適時性 | 情報が最新でないが、古すぎる | 最新の進歩やアイデアを反映していない | 情報は最近のもので、最新情報を含む |
Relevance 関連性 | 無関係な主題を扱っている | 主題に関する情報が少量ある | 主題と直接関連していて裏付けに使える |
Authority 権威性 | 著者が不明か、その分野の専門家ではない | 著者は有名だが、その分野の専門家ではない | 著者が有名であり、その分野の専門家である |
Accuracy 正確性 | 内容が誤っているか、引用や出典で裏付けられていない | 内容は正しそうだが、引用や出典で裏付けられていない | 内容が正しく、引用や出典で裏付けられている |
Purpose 目的性 | ソースが何かを売るためのものであるか、または偏っている | 情報提供が目的で、複数の視点で論じている | 情報提供が目的で、複数の視点で論じるか、多くの出典で裏付けられている |
CRAAPテストは学生向けに作られており、CRAAPはCrap(たわごと、ゴミ)に引っかけた頭字語です。発声すれば「ガラクタを見分けるテスト」といった語感で、非常に親しみがあります。この頭字語という事情から、内容の各項目は優先順にはなっていませんが、文献の信頼性を評価するために出典の有無が特に重要だろうことは明白です。
なおこのCRAAPテストはSEOの見地からも「参照リンク先として適切かどうかを見分けるテスト」としてそのまま利用可能です。ハブ・オーソリティモデルに照らせば、信頼性の高い外部ページにリンクすることはハブスコアを高めますが、ゴミにリンクすればハブスコアもオーソリティスコアも失うからです。
あるサイトでの実験結果
以下の画像はGA4のスクリーンショットで、非常に小規模なサイトに出典を追加する実験を行った結果です。各コンテンツに出典を示すリンクを追加してから2ヵ月ほどで効果が現れ始め、そこから5ヵ月程度の小康状態を経て、実験開始から7ヵ月目以降に大きく伸長しました。実験期間の14ヶ月程度の間に、検索流入は約11倍になっています。
実験は非常に小規模なサイトですので誤差が大きいですし、もともとのサイトの状態にも結果は左右されますから、すべてのサイトでこのような目覚ましい結果が得られるとは限りません。しかし情報提供を目的とし、インフォメーショナルクエリに対応するコンテンツでは、出典の明示はかなり強力な施策となることでしょう。
まとめ
E-E-A-Tの向上は、コンテンツ、コンテンツの著者、サイトそのものという3者が対象です。このうち著者とサイトについては第三者からの評判が欠かせないため、一朝一夕に向上させることは不可能です。しかし個々のコンテンツのE-E-A-T向上はすぐに始めることができ、結果も比較的早期に得られます。「出典の明記」はこの鍵になるでしょう。
サイトによっては、リンクジュースやトラフィックの流出を危惧するあまり、外部への参照リンクを追加できないかもしれません。これは個人や中小企業のサイトにとって大きなチャンスです。フットワーク軽く方針を転換して出典の明記を徹底することで信頼を獲得し、流出するよりも多くのリンクジュースと検索トラフィックを得ることができます。
この施策の唯一の問題は労力が大きいことです。出典として適切なリソースを見つけるには専門知識を要しますし、何より手間と時間がかかります。だからこそE-E-A-Tの向上やその見返りが期待できるのです。以下の言葉を脳裏に焼き付け、常に意識しながら、コンテンツの改善や制作にあたりましょう。
脚注
- SEO World Rankings 2020 ↩︎
- Wikipedia:検証可能性 – Wikipedia ↩︎
- Wikipedia:全言語版の統計 – Wikipedia ↩︎
- 要出典 – Wikipedia ↩︎
- Wikipedia:出典を明記する – Wikipedia ↩︎
- Wikipedia:独自研究は載せない – Wikipedia ↩︎
- レポート・論文における盗用・剽窃行為について – 早稲田大学(PDF) ↩︎
- The Web Credibility Project: Guidelines – Stanford University ↩︎
- 有用で信頼性の高い、ユーザーを第一に考えたコンテンツの作成 | Google 検索セントラル ↩︎
- Creating Helpful, Reliable, People-First Content | Google Search Central ↩︎
- Google Search Quality Valuator Guidelines(PDF) ↩︎
- American Civil War – Wikipedia ↩︎
- Educators, advocates see increased importance in US STEM education | Fox News ↩︎
- Evaluating Information – Applying the CRAAP Test(PDF) ↩︎
- Ame Maloney | Media Bias Handout | OER Commons ↩︎