Четверть существовавших с 2013 по 2023 год веб-страниц пропала из Интернета

Май 26, 2024 11:00

ДУШАНБЕ, 26.05.2024 /НИАТ «Ховар»/. Интернет потерял почти четверть всего контента, созданного с 2013 года по 2023 год, 38 процентов сайтов и веб-страниц, которые существовали на момент начала исследования в 2013 году. Что касается более позднего периода, то с прошлого года по настоящее время стали недоступны или радикально изменились уже 8 процентов от общего числа страниц в Интернете.

Как передает АЗЕРТАДЖ, об этом свидетельствуют результаты опубликованного исследования аналитиков Pew Research Center в Вашингтоне, которое они провели, чтобы наглядно продемонстрировать, насколько недолговечен контент в Интернете и как человечество легко может потерять информацию, если доверит ее хранение исключительно веб-сайтам.

Изучение данных экспертами исследовательского центра Pew Research Center показало, что весной текущего года значительная часть ссылок на государственных и новостных сайтах, а также в секции «Ссылки» на страницах Википедии оказались недействительными. Например, 23 процента новостных интернет-страниц и 21 процент страниц государственных сайтов содержали хотя бы одну неработающую ссылку. Особенно пострадали от этой проблемы сайты местных властей. Кроме того, в Википедии более половины страниц – 54 процента – включали как минимум одну устаревшую ссылку.

Исследователи также изучили динамику доступности страниц в социальных сетях. Они проанализировали твиты, опубликованные на платформе X весной 2023 года, и выяснили, что примерно 20 процентов постов становятся недоступными через несколько месяцев. В 60 процентах случаев это связано с изменением статуса аккаунта на приватный, его блокировкой или удалением, в оставшихся 40 процентах случаев твиты удаляются самими пользователями.

По итогам отдельного исследования социальной сети X, в рамках которого были рассмотрены 5 миллионов твитов, опубликованных с 8 марта по 27 апреля 2023 года, было выявлено, что 18 процентов твитов стали недоступны к 15 июня. Большинство из них исчезли из-за блокировки или удаления аккаунтов их авторов. Отмечается, что большая часть твитов удаляется в течение месяца, причем половина из них становится недоступной в первые шесть дней после публикации, а 90 процентов – в течение 46 дней.

При анализе веб-страниц за последнее десятилетие было обнаружено, что 25 процентов страниц, собранных в октябре 2023 года из архивов Common Crawl, уже недоступны, из которых 16 процентов недоступны на активных сайтах, а 9 процентов страниц недоступны из-за закрытия сайтов.

Анализ правительственных сайтов показал, что из примерно 500 тысяч страниц, содержащих 42 миллиона ссылок, 21 процент содержал хотя бы одну неработающую ссылку. В категории новостных порталов из 500 тысяч страниц с 14 миллионами ссылок 23 процента содержали хотя бы одну неработающую ссылку и 5 процентов всех ссылок в выборке уже не функционировали. Среди 20 самых посещаемых новостных сайтов около 25 процентов страниц имели неработающие ссылки.

В секции «Ссылки» на англоязычных страницах Википедии, изученных аналитиками, 82 процента содержали хотя бы одну неработающую внешнюю ссылку. В целом из более миллиона ссылок 11 процентов были недоступны.

ФОТО: АЗЕРТАДЖ

Май 26, 2024 11:00

Другие новости этой рубрики