Lar Áudio Em domínios mortos e links em falta: por que a Web é tão frágil

Em domínios mortos e links em falta: por que a Web é tão frágil

Anonim

Durante toda a conversa sobre quanta informação é produzida a cada ano e como cada pedacinho de nossas vidas está sendo compartilhado e tornado instantaneamente detectável, é surpreendente o quão difícil pode ser encontrar informações na Web, em seu estado original, apenas cinco anos atrás, muito menos 10 ou 15.


Enquanto já fomos regalados com histórias de como a Internet poderia resistir à guerra nuclear, graças a uma estrutura complicada de redundância e backups geográficos, erros humanos simples, conflitantes com um ato ocasional de malícia, reduziram nossa expectativa de que os dados, uma vez publicados, seja sempre estável.


Acredito firmemente no conceito de nuvem e transferi praticamente todos os meus dados para ele, contando com um laptop centrado na nuvem todos os dias e salvando meus arquivos na nuvem. Mas nem todo mundo é tão cuidadoso ao selecionar provedores e manter plataformas e domínios como eu tenho sido, e não é incomum que sites e favoritos inteiros desapareçam da Web, apenas com o Archive.org e outros cachers inteligentes para contar a história.


Antes que isso pareça uma história sórdida ou uma régua anti-Web de alguém incorporado na Web, deixe-me dar um exemplo específico. Imagine, se desejar, um URL exclusivo apontando para o boom das pontocom original - um simples como .com.com. Não, não o digitei duas vezes. O domínio com.com é de propriedade da CNET, parte da CBS Interactive. Embora a CNET tenha sofrido vários proprietários ao longo das décadas desde o seu lançamento, também é observada uma variação extrema na forma como eles comercializam seu site principal e URLs. Para aqueles de nós que apenas queriam as notícias, era o News.com. Mais tarde, o News.com seria redirecionado para o News.Cnet.com, como acontece hoje.


Archive.org mostra News.com.com em um estado anterior conhecido


Mas, a certa altura, o News.com foi redirecionado para o News.com.com e, por qualquer motivo, esse é o marcador que me acompanha de navegador para navegador há anos. De repente, alguns meses atrás, esse marcador parou de funcionar, mostrando-me um diretório de links, que parecia que um invasor havia apreendido a URL e a assumido. Archive.org mostra o mesmo. O News.com.com funcionou e, em julho, parou de redirecionar. Então isso é chato. Embora seja simples o suficiente para eu atualizar meu marcador, e sem dúvida estou na pequena minoria de usuários que mantinham esse URL, ter um URL potencialmente de alto perfil como .com.com não faz absolutamente nada … parece tolice.


Mas agora o URL antigo do News.com.com é lixo puro


Chega de .com.com. O que é tão frustrante às vezes é a curta vida útil de links e imagens de anos anteriores. Meu blog existe há pouco mais de sete anos, e nos 3.000 posts que fiz desde o início, cada um tinha muitos links. À medida que as empresas vão e vêm, seus sites e os links para suas subpáginas desaparecem. Sites de mídia de notícias, que se esperaria que apresentassem um arquivo atemporal, uma longa cauda de informações para os que buscam a verdade por aí, são frequentemente os piores criminosos, já que artigos de uma certa data ficam para trás de um paywall, ou as plataformas de sites mudam, seqüestrando para sempre estrutura de links e tornar inoperantes os links anteriores.


Um dos maiores arrependimentos que tenho em relação à Web é o que Ryan Tate (agora com WIRED) e eu compartilhamos. Nos tempos mais pré-históricos da Web, no final dos anos 90, ele e eu trabalhamos no jornal estudantil Daily California da UC Berkeley. Nós dois escrevemos centenas de notícias, cobrindo tudo, desde eleições para estudantes até loucos no campus e homicídios ocasionais. Mas, a certa altura, depois que saí do jornal, nosso site foi invadido / corrompido e todo o conteúdo existente foi perdido - chocantemente sem backup. Portanto, mais de 99% desses dados foram retirados definitivamente, e um deles terá que viajar para o campus de Berkeley e pegar um documento de capa dura para ver nosso trabalho, ou acabou de sair. Embora algumas das minhas histórias valam a pena ler cerca de 15 anos depois, elas fazem parte da minha própria história pessoal (e de trabalho), que tem poucos registros.


Desde escrever sobre a morte real até vincular a morte … embora o lapso da CNET com .com seja uma surpresa, isso pode ser devido a uma venda, a ser usada por um adquirente desconhecido ou a uma simples negligência. Pior é quando se vê links encurtados automaticamente, apenas para o encurtador de URL desaparecer ou para o serviço de hospedagem invalidar outros links curtos. Embora eu tenha defendido que os URLs parecem bons e intuitivos, nos acostumamos a ver URLs menores, melhor exemplificados pelo t.co do Twitter, úteis no serviço deles, além de goo.gl do Google, pouco .ly e outros. Porém, ao comprar um serviço de URL curto, é necessário que ele seja mantido pelos proprietários originais e todas as tabelas intactas. Portanto, para aqueles que compartilham há muito tempo com o ff.im do FriendFeed, é pela graça do Facebook que essas coisas antigas ainda estão por aí e praticamente ninguém ficaria surpreso se seguissem o caminho do dodô nos próximos dois anos.


Meu argumento é que a Web deve ser construída para permanência. Um link que eu postar hoje deve ser um link que funcione mais tarde. Um link permanente para uma página dedicada com conteúdo deve produzir o mesmo conteúdo, mesmo que o quadro ao redor tenha sido atualizado no futuro. E links curtos e domínios devem se comportar de maneira confiável e amigável. Seria uma tragédia menor se a página inicial que você usa diariamente de repente se tornasse outra coisa, e maior se o domínio no qual você hospeda suas histórias pessoais simplesmente fechou a loja porque o host não achou mais financeiramente viável continuar seguindo em frente. . Portanto, enquanto a magia da Web é real e, às vezes, parece que você pode encontrar praticamente tudo lá fora e obtê-lo instantaneamente (assumindo banda larga rápida), as lacunas me fazem pensar que podemos fazer melhor.


E sim, CNET. E aí?


Republicado com permissão de http://blog.louisgray.com/Artigo original pode ser encontrado aqui: http://blog.louisgray.com/2013/09/deadlinksarelame.html.

Em domínios mortos e links em falta: por que a Web é tão frágil