- 25% das páginas da web publicadas entre 2013 e 2023 não existem mais.
- O Internet Archive é crucial para guardar páginas da web e evitar a amnésia digital.
- A maioria dos links na Wikipédia está quebrada, refletindo a desintegração das informações online.
- O Internet Archive enfrenta desafios legais e ataques cibernéticos que ameaçam seu trabalho.
- Não há clareza sobre quem deve ser responsável por arquivar a internet, mas todos deveriam apoiar esse esforço.
A Importância do Internet Archive na Preservação Digital
Quando se fala sobre a preservação da internet, um dado intrigante chama a atenção: cerca de 25% das páginas web publicadas entre 2013 e 2023 simplesmente deixaram de existir. Isso levanta uma pergunta crucial: quem está cuidando da nossa história digital?
A Função do Internet Archive
O Internet Archive, uma organização sem fins lucrativos localizada em São Francisco, Califórnia, se tornou um dos principais guardiões da internet. Com uma coleção que se estende por três décadas, acumulam uma quantidade impressionante de páginas web — centenas de bilhões. Essa iniciativa é, sem dúvida, uma das mais ambiciosas no campo da preservação digital.
Com servidores espalhados pelo mundo, o Internet Archive e outras organizações estão fazendo um trabalho vital para evitar a amnésia digital. Sem um esforço formal para documentar a web, essas iniciativas se tornaram essenciais.
O Desaparecimento de Páginas
O problema do desaparecimento de páginas web não afeta apenas os sites mais antigos. Um estudo revelou que, ao tentar acessar páginas de 2013, 38% não estavam mais disponíveis. Em um cenário alarmante, cerca de 8% das páginas publicadas em 2023 já tinham sumido até outubro do mesmo ano.
Além disso, o Pew Research Center descobriu que mais da metade dos artigos da Wikipédia apresenta links quebrados, indicando que as fontes que sustentam as informações estão se desintegrando.
A Máquina do Tempo da Internet
O projeto Wayback Machine, uma das ferramentas mais conhecidas do Internet Archive, utiliza robôs para percorrer a internet por décadas. Essa ferramenta captura cópias de websites à medida que mudam com o tempo, registrando a mesma página várias vezes em um único dia e oferecendo essas informações gratuitamente ao público.
Surpreendentemente, ao analisar as URLs registradas pelo Wayback Machine, percebe-se que dois terços estão disponíveis de alguma forma, mostrando que o Internet Archive cumpre seu papel de guardar registros da sociedade online para o futuro.
Iniciativas Globais de Preservação
Não é apenas o Internet Archive que se esforça para preservar a internet. O UK Web Archive, gerenciado pela Biblioteca Britânica, também desempenha um papel importante, rastreando anualmente websites com domínio .uk, garantindo que uma cópia da internet britânica seja preservada pelo menos uma vez por ano.
Embora a preservação total da internet seja praticamente impossível, as iniciativas existentes criaram uma rede abrangente. A coleção do Internet Archive pode parecer um registro quase completo da World Wide Web.
O Papel do Internet Archive na Nossa Vida Digital
O Internet Archive se propôs a ser a principal biblioteca da nossa vida digital. Com a web se aproximando de sua quarta década, essa iniciativa se tornou um pilar fundamental da internet, mas enfrenta uma série de desafios.
Parcerias e Desafios Legais
Recentemente, o Internet Archive anunciou uma parceria significativa com o Google, que incluirá links para a Wayback Machine em seus resultados. Essa colaboração é um passo importante, mas também traz à tona as ameaças que o projeto enfrenta.
Em 2023, um tribunal americano considerou ilegais algumas das práticas do Internet Archive, resultando em um golpe duro para a organização. Eles concordaram em pagar um valor não revelado a um grupo de editoras, levantando questões sobre os limites da preservação digital e direitos autorais.
Ameaças Técnicas à Preservação
As batalhas legais não são os únicos riscos para a preservação digital. O UK Web Archive sofreu um ciberataque em outubro de 2023, que derrubou seus sistemas digitais. Em maio de 2024, o Internet Archive também enfrentou um grande ataque DDoS. Essas ameaças destacam a vulnerabilidade de iniciativas que buscam preservar a internet.
Se o trabalho do Internet Archive fosse interrompido, uma parte significativa do que está disponível na web pública ficaria em risco, considerando a quantidade de informações compartilhadas diariamente.
A Descentralização da Preservação
Sem um esforço formal para organizar a preservação da internet, essa tarefa recai sobre amadores e voluntários. A historiadora de tecnologia Mar Hicks, da Universidade da Virgínia, observa que a descentralização do arquivamento é uma abordagem lógica, mas pode ser problemática.
Com muitas vozes tentando preservar a internet, as prioridades podem divergir. Hicks explica que algumas pessoas querem coletar tudo, enquanto outras se concentram em áreas específicas, resultando em uma abordagem fragmentada.
A Responsabilidade Coletiva
Hicks levanta uma questão importante: quem é responsável por arquivar a internet? Embora haja um vácuo na responsabilidade, todos devemos contribuir para apoiar a preservação digital, garantindo que as informações sejam mantidas para o futuro.
Esse senso de responsabilidade cívica que existiu no passado não se estendeu à internet, possivelmente devido aos interesses comerciais que permeiam o mundo digital ou às dificuldades técnicas envolvidas. Além disso, muitos podem não perceber a necessidade urgente de preservar a web.
A Disponibilidade da Informação
A internet é um vasto repositório de informações, e muitos acreditam que tudo está sempre disponível. No entanto, essa percepção pode ser enganosa. O que está acessível hoje pode não estar amanhã. À medida que mais páginas desaparecem, a importância de iniciativas como o Internet Archive se torna cada vez mais evidente.