Um novo
estudo da Pew Research Center sugere que grandes quantidades de conteúdos e
informações da internet estão desaparecendo gradualmente, desafiando a
percepção comum da web como um repositório permanente de informações.
A investigação, publicada pela Pew Research na sexta-feira passada (17), indica
que faixas significativas de páginas de web e conteúdo online foram perdidas na
última década.
Segundo o estudo, 38% das páginas da Web que existiam em 2013 não estão mais
disponíveis. Mesmo conteúdos mais recentes tendem a desaparecer; 8% das páginas
de 2023 já estão inacessíveis. Essa tendência ocorre principalmente quando as
páginas são excluídas ou movidas dentro de sites operacionais de outra forma,
em vez de quando sites inteiros ficam offline.
A perda de conteúdo afetou vários setores, incluindo notícias e sites
governamentais. Notavelmente, 23% das páginas de notícias analisadas contêm
pelo menos um link quebrado, e 21% dos domínios governamentais mostram
problemas semelhantes.
A Wikipedia, por exemplo, também sofre com esse problema, com 54% de suas
páginas tendo pelo menos um link morto em suas seções de referência.
O sumiço do conteúdo não se limita apenas às páginas da web. As plataformas de
rede social também são afetadas. O estudo descobriu que aproximadamente 20% dos
tweets desaparecem do X (Twitter) dentro de alguns meses após ser postado.
Os pesquisadores compilaram suas descobertas examinando quase um milhão de
páginas da web usando o Common Crawl, um serviço que arquiva partes
significativas da Internet. Eles então rastrearam a disponibilidade dessas
páginas de 2013 a 2023.
A análise revelou que 25% das páginas arquivadas dentro desse período não estão
mais acessíveis. Destes, 16% se originaram de sites existentes, enquanto 9%
vieram de sites que agora estão extintos.