10年前のWebページの38%が消失──Pew Research Center調べ

2024年5月20日(月)9時1分 ITmedia NEWS

2013年から2023年の消滅Webページ数推移(画像:Pew Research Center)

写真を拡大

 非営利調査機関の米Pew Research Centerは5月17日(現地時間)、「When Online Content Disappears」(オンラインコンテンツが消滅するとき)と題する調査レポートを公開した。「2013年に存在したWebページの38%が10年後にはアクセス不能に」というサブタイトルがついている。
 この調査では、非営利プロジェクト「Common Crawl」のリポジトリから2013年から2023年までの毎年の約9万ページ、合わせて約100万のWebページをサンプリングした。調査結果は、この期間の全ページの25%が現在アクセス不能であることを示している。このうち、16%はルートドメインはアクティブだがアクセスできず、残り9%はルートドメインが廃止されたものだ。
 政府の公的サイトでは、サンプリングした約50万ページのうち、21%に少なくとも1つのリンク切れが含まれていた。地方自治体レベルのページで特に顕著だった。
 ニュースメディアのWebサイトでは、約50万ページの23%に少なくとも1つのリンク切れが含まれていた。サンプルは、comScoreによって「ニュース/情報」として分類された2063ドメインのリストに基づいて収集した。
 英語版Wikipediaでサンプリングした5万ページでは、54%に少なくとも1つのリンク切れが含まれていた。
 米X(旧Twitter)については、2023年3月8日から4月28日に投稿された約500万件のツイートを追跡した。これらのツイートのうち18%(約5件に1件)は2023年6月15日までに非公開になった。そのうち60%はアカウントの非公開化、停止、削除によるもので、残り50%はアカウントはアクティブだが削除されている。なお、調査が行われた期間はTwitterは既にイーロン・マスク氏による買収は完了しているが、まだサービス名はTwitterで、ポストはツイートと呼ばれていた。
 詳しい調査方法についてはレポートを参照されたい。

ITmedia NEWS

「オンライン」をもっと詳しく

「オンライン」のニュース

「オンライン」のニュース

トピックス

x
BIGLOBE
トップへ