Máquina Wayback - Wayback Machine

Da Wikipédia, A Enciclopédia Livre

Pin
Send
Share
Send

Máquina Wayback
Texto estilizado dizendo:
Captura de tela
20151221 Internet Archive Wayback Machine.png
Visualização de arquivos wikipedia.org na Wayback Machine (dezembro de 2015)
Tipo de site
Arquivo
Área servidaNo mundo todo (exceto China e Rússia)
ProprietárioArquivo da Internet
URLrede.arquivo.org Edite isso no Wikidata
CadastroOpcional
Lançado24 de outubro de 2001; 19 anos atras (2001-10-24)[1][2]
Status atualAtivo
Escrito emJava, Pitão

o Máquina Wayback é um digital arquivo do Rede mundial de computadores, fundada por Arquivo da Internet, uma biblioteca sem fins lucrativos com sede em São Francisco. Ele permite que o usuário “volte no tempo” e veja como eram os sites no passado. Seus fundadores, Brewster Kahle e Bruce Gilliat, desenvolveu a Wayback Machine com a intenção de fornecer "acesso universal a todo o conhecimento", preservando cópias arquivadas de páginas da web extintas.

Desde seu lançamento em 2001, mais de 463 bilhões de páginas foram adicionadas ao arquivo. O serviço também gerou polêmica sobre se a criação de páginas arquivadas sem a permissão do proprietário constitui violação de direitos autorais em certas jurisdições.

História

Arquivo da Internet fundadores Brewster Kahle e Bruce Gilliat lançou a Wayback Machine em 2001 para resolver o problema do desaparecimento do conteúdo do site sempre que ele é alterado ou encerrado.[3] O serviço permite que os usuários vejam versões arquivadas de paginas web através do tempo, que o arquivo chama de "índice tridimensional".[4] Kahle e Gilliat criaram a máquina na esperança de arquivar toda a Internet e fornecer "acesso universal a todo o conhecimento".[5]

O nome Máquina Wayback foi escolhido como uma referência a um fictício viagem no tempo dispositivo, o "Máquina Wayback" (pronunciado caminho de volta), usado pelos personagens Senhor Peabody e Sherman no desenho animado The Rocky and Bullwinkle Show da década de 1960.[6][7] Em um dos segmentos componentes do desenho animado, História improvável de Peabody, os personagens usavam rotineiramente a máquina para testemunhar, participar e, muitas vezes, alterar eventos famosos da história.

A Wayback Machine começou a arquivar em cache páginas da web em maio de 1996,[8][9] com o objetivo de tornar o serviço público cinco anos depois.[10] De 1996 a 2001, a informação foi mantida em fita digital, com Kahle ocasionalmente permitindo que pesquisadores e cientistas explorassem o desajeitado base de dados.[11] Quando o arquivo completou quinto aniversário em 2001, foi inaugurado e aberto ao público em uma cerimônia no Universidade da California, Berkeley.[12] Quando a Wayback Machine foi lançada, ela já continha mais de 10 bilhões de páginas arquivadas.[13]

Hoje, os dados são armazenados no grande cluster do Internet Archive de Linux nós.[5] Ele revisita e arquiva novas versões de sites na ocasião (consulte os detalhes técnicos abaixo).[14] Os sites também podem ser capturados manualmente inserindo o URL na caixa de pesquisa, desde que o site permita que a Wayback Machine o "rastreie" e salve os dados.[10]Em 30 de outubro de 2020, a Wayback Machine começou a verificar o conteúdo dos fatos.[15]

Detalhes técnicos

O software foi desenvolvido para "rastejar" a web e baixe todas as páginas da World Wide Web acessíveis ao público, o Gopher hierarquia, o Netnews Sistema de boletim informativo (Usenet) e software para download.[16] As informações coletadas por esses “crawlers” não incluem todas as informações disponíveis na Internet, uma vez que muitos dos dados são restritos pelo editor ou armazenados em bancos de dados que não são acessíveis. Para superar inconsistências em sites parcialmente armazenados em cache, o Archive-It.org foi desenvolvido em 2005 pelo Internet Archive como um meio de permitir que instituições e criadores de conteúdo coletassem e preservassem voluntariamente coleções de conteúdo digital e criassem arquivos digitais.[17]

Os rastreamentos são fornecidos por várias fontes, alguns importados de terceiros e outros gerados internamente pelo Arquivo.[14] Por exemplo, rastreamentos são contribuídos pelo Fundação Sloan e Alexa, rastreamentos executados por IA em nome de NARA e a Internet Memory Foundation, espelhos de Crawl comum.[14] Os "Worldwide Web Crawls" estão em execução desde 2010 e capturam a Web global.[14][18]

A frequência de capturas instantâneas varia de acordo com o site.[14] Os sites em "Worldwide Web Crawls" são incluídos em uma "lista de rastreamento", com o site arquivado uma vez por rastreamento.[14] Um rastreamento pode levar meses ou até anos para ser concluído, dependendo do tamanho.[14] Por exemplo, "Wide Crawl Number 13" começou em 9 de janeiro de 2015 e foi concluído em 11 de julho de 2016.[19] No entanto, pode haver vários rastreamentos em andamento ao mesmo tempo e um site pode ser incluído em mais de uma lista de rastreamento, portanto, a frequência com que um site é rastreado varia amplamente.[14]

Desde outubro de 2019, os usuários são limitado para 5 solicitações de arquivamento e recuperações por minuto.[porque?]

Capacidade de armazenamento e crescimento

Conforme a tecnologia se desenvolveu ao longo dos anos, a capacidade de armazenamento da Wayback Machine cresceu. Em 2003, após apenas dois anos de acesso público, a Wayback Machine crescia a uma taxa de 12 terabytes / mês. Os dados são armazenados em PetaBox sistemas de rack personalizados projetados pela equipe do Internet Archive. O primeiro rack de 100 TB tornou-se totalmente operacional em junho de 2004, embora logo tenha ficado claro que eles precisariam de muito mais armazenamento do que isso.[20][21]

O Internet Archive migrou sua arquitetura de armazenamento personalizada para Sun Open Storage em 2009, e hospeda um novo data center em um Sun Modular Datacenter em Sun Microsystems'Campus da Califórnia.[22] A partir de 2009, a Wayback Machine continha aproximadamente três petabytes de dados e estava crescendo a uma taxa de 100 terabytes cada mês.[23]

Uma nova versão aprimorada da Wayback Machine, com uma interface atualizada e um índice mais recente de conteúdo arquivado, foi disponibilizada para teste público em 2011.[24] Em março daquele ano, foi dito no fórum do Wayback Machine que "o Beta do novo Wayback Machine tem um índice mais completo e atualizado de todos os materiais rastreados em 2010 e continuará a ser atualizado regularmente. O índice dirigir o Wayback Machine clássico tem apenas um pouco de material depois de 2008, e nenhuma atualização de índice adicional está planejada, pois ele será eliminado gradualmente este ano. "[25] Também em 2011, o Internet Archive instalou seu sexto par de racks PetaBox que aumentaram a capacidade de armazenamento da Wayback Machine em 700 terabytes.[26]

Em janeiro de 2013, a empresa anunciou um marco inovador de 240 bilhões de URLs.[27]

Em outubro de 2013, a empresa lançou o recurso "Salvar uma página"[28][29] que permite a qualquer usuário da Internet arquivar o conteúdo de uma URL e gerar rapidamente um link permanente ao contrário do anterior liveweb característica.

Tornou-se uma ameaça de abuso por parte do serviço para hospedagem de binários maliciosos.[30][31]

Em dezembro de 2014, a Wayback Machine continha 435 bilhão páginas da web - quase nove petabytes de dados, e cresciam cerca de 20 terabytes por semana.[13][32][33]

Em julho de 2016, a Wayback Machine supostamente continha cerca de 15 petabytes de dados.[34]

Em setembro de 2018, a Wayback Machine continha mais de 25 petabytes de dados.[35][36]

Wayback Machine Growth[37][38]
Máquina Wayback por anoPáginas arquivadas (bilhões)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452

Política de exclusão de site

Historicamente, a Wayback Machine tem respeitado o padrão de exclusão de robôs (robots.txt) para determinar se um site seria rastreado; ou se já rastreado, se seus arquivos podem ser visualizados publicamente. Os proprietários de sites tinham a opção de cancelar o Wayback Machine por meio do uso de robots.txt. Ele aplicou as regras do robots.txt retroativamente; se um site bloquear o Internet Archive, todas as páginas do domínio arquivadas anteriormente também serão imediatamente tornadas indisponíveis. Além disso, o Internet Archive declarou que "Às vezes, o proprietário de um site entra em contato conosco diretamente e nos pede para parar de rastrear ou arquivar um site. Nós atendemos a essas solicitações."[39] Além disso, o site diz: "O Internet Archive não está interessado em preservar ou oferecer acesso a sites ou outros documentos da Internet de pessoas que não desejam seus materiais na coleção."[40][41]

Em 17 de abril de 2017, surgiram relatórios de sites que haviam expirado e se tornaram domínios estacionados que estavam usando o arquivo robots.txt para se excluir dos mecanismos de pesquisa, resultando na exclusão inadvertida da Wayback Machine.[42] O arquivo da Internet mudou a política para agora exigir uma solicitação de exclusão explícita para removê-lo da Wayback Machine.[43]

Política de Arquivo Oakland

A política de exclusão retroativa de Wayback é baseada em parte em Recomendações para gerenciar solicitações de remoção e preservar a integridade do arquivo publicado pela Escola de Gestão e Sistemas de Informação em Universidade da California, Berkeley em 2002, que dá ao proprietário do site o direito de bloquear o acesso aos arquivos do site.[44] Wayback cumpriu esta política para ajudar a evitar litígios caros.[45]

A política de exclusão retroativa do Wayback começou a relaxar em 2017, quando parou de honrar o arquivo robots.txt em sites militares e do governo dos EUA, tanto para rastreamento quanto para exibição de páginas da web. Desde abril de 2017, Wayback está ignorando o arquivo robots.txt de forma mais ampla, não apenas para sites do governo dos EUA.[46][47][48][49]

Usos

Desde o seu lançamento público em 2001, a Wayback Machine tem sido estudada por acadêmicos, tanto pela forma como armazena e coleta dados, quanto pelas páginas reais contidas em seu arquivo. Em 2013, os acadêmicos escreveram cerca de 350 artigos sobre a Wayback Machine, principalmente nas áreas de tecnologia da informação, biblioteconomia e ciências sociais. Estudiosos das ciências sociais têm usado a Wayback Machine para analisar como o desenvolvimento de sites da década de 1990 até o presente afetou o crescimento da empresa.[13]

Quando a Wayback Machine arquiva uma página, geralmente inclui a maioria dos hiperlinks, mantendo-os ativos quando eles poderiam ter sido quebrados com a mesma facilidade pela instabilidade da Internet. Pesquisadores na Índia estudaram a eficácia da capacidade da Wayback Machine de salvar hiperlinks em publicações acadêmicas on-line e descobriram que salvou um pouco mais da metade deles.[50]

"Jornalistas usam a Wayback Machine para ver sites mortos, notícias desatualizadas e mudanças no conteúdo do site. Seu conteúdo tem sido usado para responsabilizar os políticos e expor mentiras no campo de batalha."[51] Em 2014, uma página de mídia social arquivada de Igor Girkin, um líder rebelde separatista na Ucrânia, mostrou-o se gabando de suas tropas terem abatido um suposto avião militar ucraniano antes de se saber que o avião era na verdade um jato civil da Malaysian Airlines (Malaysia Airlines voo 17), após o que ele excluiu a postagem e culpou os militares da Ucrânia pela derrubada do avião.[51][52] Em 2017, o Marcha pela Ciência originado de uma discussão sobre reddit que indicou que alguém visitou o Archive.org e descobriu que todas as referências a das Alterações Climáticas foi excluído do site da Casa Branca. Em resposta, um usuário comentou: "É preciso haver uma marcha dos cientistas em Washington".[53][54][55]

Além disso, o site é muito usado para verificação, fornecendo acesso a referências e criação de conteúdo por Editores da Wikipedia.[56]

Em setembro de 2020, foi anunciada uma parceria com Cloudflare arquivar automaticamente os sites servidos por meio de seu serviço "Always Online", que também permitirá direcionar os usuários à sua cópia do site, caso não consiga acessar o host original.[57]

Limitações

Em 2014, houve um lapso de seis meses entre o momento em que um site foi rastreado e o momento em que ele foi disponibilizado para visualização na Wayback Machine.[58] Atualmente, o tempo de espera é de 3 a 10 horas.[59] A Wayback Machine oferece apenas recursos de pesquisa limitados. Seu recurso de "Pesquisa de sites" permite que os usuários encontrem um site com base nas palavras que o descrevem, em vez de palavras encontradas nas próprias páginas da web.[60]

O Wayback Machine não inclui todas as páginas da web já criadas devido às limitações de seu rastreador da web. O Wayback Machine não pode arquivar completamente páginas da web que contenham recursos interativos, como plataformas Flash e formulários escritos em JavaScript e aplicações web progressivas, porque essas funções requerem interação com o site host. Isso significa que, desde junho de 2013, o Wayback Machine não consegue mais exibir comentários do YouTube ao salvar páginas do YouTube, pois, de acordo com a Equipe de Arquivo, os comentários não são mais "carregados dentro da própria página".[61] O rastreador da Web do Wayback Machine tem dificuldade em extrair qualquer coisa que não esteja codificada em HTML ou em uma de suas variantes, o que muitas vezes pode resultar em hiperlinks corrompidos e imagens ausentes. Devido a isso, o rastreador da web não pode arquivar "páginas órfãs" que não contenham links para outras páginas.[60][62] O rastreador do Wayback Machine segue apenas um número predeterminado de hiperlinks com base em um limite de profundidade predefinido, portanto, não pode arquivar todos os hiperlinks em todas as páginas.[18]

A partir de abril de 2018, membros da equipe administrativa da equipe de arquivo da Wayback Machine aplicaram a regra do trimestre, excluindo ocasionalmente intervalos de tempo de 23 dias ou 39 dias (3/4 e 5/4 de um mês, respectivamente), a fim de reduza o tamanho da fila.[citação necessária]

Em provas legais

Contencioso civil

Netbula LLC v. Chordiant Software Inc.

Em um caso de 2009, Netbula, LLC v. Chordiant Software Inc., o réu Chordiant apresentou uma moção para obrigar a Netbula a desativar o robots.txt arquivo em seu site que estava fazendo com que a Wayback Machine remova retroativamente o acesso a versões anteriores de páginas que ele havia arquivado do site da Netbula, páginas que a Chordiant acreditava que apoiariam seu caso.[63]

O Netbula se opôs à moção alegando que os réus estavam pedindo para alterar o site do Netbula e que deveriam ter intimado o Internet Archive para as páginas diretamente.[64] Um funcionário do Internet Archive apresentou uma declaração juramentada apoiando a moção da Chordiant, no entanto, afirmando que ela não poderia produzir as páginas da web por qualquer outro meio "sem encargo, despesa e interrupção de suas operações consideráveis."[63]

O juiz Howard Lloyd, do Distrito Norte da Califórnia, Divisão de San Jose, rejeitou os argumentos de Netbula e ordenou que desabilitassem o bloqueio do robots.txt temporariamente para permitir que a Chordiant recuperasse as páginas arquivadas que buscavam.[63]

Telewizja Polska

Em um caso de outubro de 2004, Telewizja Polska USA, Inc. v. Satélite Echostar, No. 02 C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. 15 de outubro de 2004), um litigante tentou usar os arquivos da Wayback Machine como fonte de evidência admissível, talvez pela primeira vez. Telewizja Polska é fornecedora de TVP Polonia e EchoStar opera o Dish Network. Antes dos procedimentos do julgamento, a EchoStar indicou que pretendia oferecer instantâneos da Wayback Machine como prova do conteúdo anterior do site da Telewizja Polska. Telewizja Polska apresentou uma moção em limine para suprimir os instantâneos com base em boato e fonte não autenticada, mas o juiz do magistrado Arlander Keys rejeitou a afirmação de Telewizja Polska de boato e negou a moção do TVP em limine para excluir a evidência no julgamento.[65][66] No julgamento, no entanto, o juiz distrital Ronald Guzman, o juiz de primeira instância, rejeitou as conclusões da Magistrate Keys e considerou que nem a declaração do funcionário do Internet Archive nem as páginas subjacentes (ou seja, o site da Telewizja Polska) eram admissíveis como prova. O juiz Guzman argumentou que a declaração do funcionário continha boatos e declarações de apoio inconclusivas e, na suposta página da web, as impressões não eram autoautorizadas.[67][68]

Lei de patentes

Contanto que alguns requisitos adicionais sejam atendidos (por exemplo, fornecer uma declaração oficial do arquivista), o Escritório de patentes dos Estados Unidos e a Escritório Europeu de Patentes aceitará carimbos de data do Internet Archive como evidência de quando uma determinada página da Web estava acessível ao público. Essas datas são usadas para determinar se uma página da Web está disponível como arte anterior por exemplo, ao examinar um pedido de patente.[69]

Limitações de utilidade

Existem limitações técnicas para arquivar um site e, como consequência, é possível que as partes oponentes em litígio usem indevidamente os resultados fornecidos pelos arquivos do site. Esse problema pode ser agravado pela prática de enviar capturas de tela de páginas da web em reclamações, respostas ou relatórios de especialistas quando os links subjacentes não são expostos e, portanto, podem conter erros. Por exemplo, arquivos como o Wayback Machine não preenchem formulários e, portanto, não incluem o conteúdo deRepousante bancos de dados de comércio eletrônico em seus arquivos.[70]

Status legal

Na Europa, a Wayback Machine pode ser interpretada como uma violação direito autoral leis. Apenas o criador do conteúdo pode decidir onde seu conteúdo é publicado ou duplicado, então o Arquivo teria que deletar páginas de seu sistema a pedido do criador.[71] As políticas de exclusão para o Wayback Machine podem ser encontradas na seção FAQ do site.[72]

Questões jurídicas de conteúdo arquivado

Vários casos foram movidos contra o Internet Archive, especificamente por seus esforços de arquivamento do Wayback Machine.

Cientologia

No final de 2002, o Internet Archive removeu vários sites que criticavam Cientologia da Wayback Machine.[73] Uma mensagem de erro afirmou que isso foi em resposta a uma "solicitação do proprietário do site".[74] Posteriormente, foi esclarecido que os advogados da Igreja da Cientologia exigiu a remoção e que os proprietários do site não queriam que seu material fosse removido.[75]

Healthcare Advocates, Inc.

Em 2003, Harding Earley Follmer & Frailey defendeu um cliente em uma disputa de marca registrada usando o Archive's Wayback Machine. Os advogados foram capazes de demonstrar que as reivindicações feitas pelo autor eram inválidas, com base no conteúdo de seu site de vários anos antes. O demandante, Healthcare Advocates, em seguida, alterou sua reclamação para incluir o Internet Archive, acusando a organização de violação de direitos autorais, bem como violações do DMCA e a Lei de fraude e abuso de computador. Os defensores dos cuidados de saúde alegaram que, uma vez que instalaram um robots.txt arquivo em seu site, mesmo que após o processo inicial ter sido aberto, o Arquivo deveria ter removido todas as cópias anteriores do site do reclamante da Máquina Wayback, no entanto, algum material continuou a ser publicamente visível no Wayback.[76] O processo foi resolvido fora do tribunal, depois que Wayback resolveu o problema.[77]

Suzanne Shell

Ativista Suzanne Shell entrou com uma ação em dezembro de 2005, exigindo que o Internet Archive pagasse a ela US $ 100.000 pelo arquivamento de seu site profane-justice.org entre 1999 e 2004.[78][79] Arquivo da Internet apresentou um julgamento declaratório ação no Tribunal Distrital dos Estados Unidos para o Distrito Norte da Califórnia em 20 de janeiro de 2006, buscando uma determinação judicial de que o Internet Archive não violou as regras da Shell direito autoral. Shell respondeu e trouxe um contra-traje contra Internet Archive por arquivar seu site, que ela alega violar seu termos de serviço.[80] Em 13 de fevereiro de 2007, um juiz da Tribunal Distrital dos Estados Unidos para o Distrito de Colorado rejeitou todas as contra-reivindicações, exceto quebra de contrato.[79] O Internet Archive não mudou para dispensar violação de direitos autorais afirma a Shell decorrente de suas atividades de cópia, que também seguiria em frente.[81]

Em 25 de abril de 2007, o Internet Archive e a Suzanne Shell anunciaram em conjunto o acordo de seu processo.[78] O Internet Archive disse que "... não tem interesse em incluir materiais na Wayback Machine de pessoas que não desejam ter seu conteúdo da Web arquivado. Reconhecemos que a Sra. Shell possui direitos autorais válidos e aplicáveis ​​em seu site e lamentamos que a inclusão de seu site na Wayback Machine resultou neste litígio. " Shell disse: "Eu respeito o valor histórico da meta do Internet Archive. Nunca tive a intenção de interferir com essa meta nem causar qualquer dano."[82]

Daniel Davydiuk

Entre 2013 e 2016, um ator pornográfico chamado Daniel Davydiuk tentou remover imagens arquivadas de si mesmo do arquivo da Wayback Machine, primeiro enviando vários Pedidos DMCA para o arquivo e, em seguida, apelando para o Tribunal Federal do Canadá.[83][84][85]

Censura e outras ameaças

Archive.org está atualmente bloqueado na China.[86][87] Depois que a organização terrorista do Estado Islâmico foi banida, o Internet Archive foi totalmente bloqueado na Rússia como apresentador de um vídeo de divulgação dessa organização, por um curto período em 2015–16.[51][88][89][precisa de atualização] Desde 2016, o site está de volta, disponível em sua totalidade, embora lobistas comerciais locais estejam processando o Internet Archive em um tribunal local para proibi-lo por motivos de direitos autorais.[90]

Alison Macrina, diretor do Library Freedom Project, observa que "embora os bibliotecários valorizem profundamente a privacidade individual, também nos opomos fortemente à censura".[51]

São raros os casos conhecidos em que o acesso online a conteúdos que "por nada" colocou as pessoas em perigo foi desativado pelo site.[51]

Outras ameaças incluem desastres naturais,[91] destruição (remota ou física),[92] manipulação do conteúdo do arquivo (ver também: ataque cibernético, cópia de segurança), leis de direitos autorais problemáticas[93] e vigilância dos usuários do site.[94]

Kevin Vaughan suspeita que no longo prazo de várias gerações "quase nada" sobreviverá de uma forma útil, afirmando: "Se tivermos continuidade em nossa civilização tecnológica" pela qual "muitos dos dados básicos permanecerão localizáveis ​​e pesquisáveis "[95]

Em um artigo que reflete sobre a preservação do conhecimento humano, O Atlantico comentou que o Internet Archive, que se descreve como sendo construído para o longo prazo,[96] "está trabalhando furiosamente para capturar dados antes que desapareçam, sem nenhuma infraestrutura de longo prazo."[97]

Veja também

Referências

  1. ^ "WayBackMachine.org WHOIS, DNS e Domain Info - DomainTools". QUEM É. Recuperado 13 de março, 2016.
  2. ^ "InternetArchive.org WHOIS, DNS e Domain Info - DomainTools". QUEM É. Recuperado 13 de março, 2016.
  3. ^ Notess, Greg R. (março-abril de 2002). "The Wayback Machine: The Web's Archive". Conectados. 26: 59–61 - via EBSCOhost.
  4. ^ "The Wayback Machine", perguntas frequentes, arquivado do original em 18 de setembro de 2018, recuperado 18 de setembro 2018
  5. ^ uma b "20.000 discos rígidos em uma missão | Blogs de arquivo da Internet". blog.archive.org. 25 de outubro de 2016. Arquivado do original em 20 de outubro de 2018. Recuperado 15 de outubro 2018.
  6. ^ Green, Heather (28 de fevereiro de 2002). "Uma biblioteca tão grande quanto o mundo". Semana de negócios. Arquivado de o original em 20 de dezembro de 2011.
  7. ^ Tong, Judy (8 de setembro de 2002). "Parte responsável - Brewster Kahle; uma biblioteca da web, na web". New York Times. Arquivado do original em 20 de fevereiro de 2011. Recuperado 15 de agosto, 2011.
  8. ^ "MTV Online: Página Principal - Máquina de Wayback". Máquina Wayback. 12 de maio de 1996. Arquivado em o original em 12 de maio de 1996. Recuperado 17 de julho 2020.
  9. ^ "Guia Infoseek - Máquina Wayback". Máquina Wayback. 12 de maio de 1996. Arquivado em o original em 12 de maio de 1996. Recuperado 16 de dezembro 2016.
  10. ^ uma b "Internet Archive: Wayback Machine". archive.org. Arquivado do original em 3 de janeiro de 2014. Recuperado 15 de outubro 2018.
  11. ^ Cook, John (1 de novembro de 2001). "O site leva você de volta à história da Internet". Seattle Post-Intelligencer. Arquivado do original em 12 de agosto de 2014. Recuperado 15 de agosto, 2011.
  12. ^ Mayfield, Kendra (28 de outubro de 2001). "Wayback Goes Back on Web". Com fio. Arquivado do original em 16 de outubro de 2017. Recuperado 16 de outubro 2017.
  13. ^ uma b c Arora, Sanjay K .; Li, Yin; Youtie, Jan; Shapira, Philip (5 de maio de 2015). "Usando a máquina de retorno para minerar sites nas ciências sociais: um recurso metodológico". Jornal da Associação de Ciência e Tecnologia da Informação. 67 (8): 1904–1915. doi:10.1002 / asi.23503. ISSN 2330-1635.
  14. ^ uma b c d e f g h Kalev Leetaru (28 de janeiro de 2016). "The Internet Archive faz 20 anos: uma análise dos bastidores do arquivamento da web". Forbes. Arquivado do original em 16 de outubro de 2017. Recuperado 16 de outubro 2017.
  15. ^ http://blog.archive.org/2020/10/30/fact-checks-and-context-for-wayback-machine-pages/
  16. ^ Kahle, Brewster. "Arquivando a Internet". Scientific American - Edição de março de 1997. Arquivado do original em 3 de abril de 2012. Recuperado 19 de agosto 2011.
  17. ^ Jeff Kaplan (27 de outubro de 2014). "Archive-It: Crawling the Web Together". Blogs de arquivo da Internet. Arquivado do original em 12 de outubro de 2017. Recuperado 16 de outubro 2017.
  18. ^ uma b "Worldwide Web Crawls". Arquivo da Internet. Arquivado do original em 19 de outubro de 2017. Recuperado 16 de outubro 2017.
  19. ^ "Wide Crawl Número 13". Arquivo da Internet. Arquivado do original em 19 de outubro de 2017. Recuperado 16 de outubro 2017.
  20. ^ "Arquivo da Internet: Petabox". archive.org. Recuperado 25 de outubro 2018.
  21. ^ Kanellos, Michael (29 de julho de 2005). "Grande armazenamento barato". CNET News.com. Arquivado de o original em 3 de abril de 2007. Recuperado 29 de julho 2007.
  22. ^ "Arquivo da Internet e microsistemas da Sun criam história viva da Internet". Sun Microsystems. 25 de março de 2009. Arquivado do original em 26 de março de 2009. Recuperado 27 de março 2009.
  23. ^ Mearian, Lucas (19 de março de 2009). "Internet Archive para revelar o enorme data center da Wayback Machine". Computerworld.com. Arquivado de o original em 23 de março de 2009. Recuperado 22 de Março, 2009.
  24. ^ "Máquina Wayback atualizada em teste beta". Arquivado de o original em 23 de agosto de 2011. Recuperado 19 de agosto 2011.
  25. ^ "Beta Wayback Machine, no fórum". Arquivado do original em 17 de abril de 2014. Recuperado 16 de abril 2014.
  26. ^ "Internet Archive Forums: 6º par de racks entram em serviço: mais de 2 PB de espaço de dados usado". archive.org. Arquivado do original em 24 de outubro de 2016. Recuperado 25 de outubro 2018.
  27. ^ "Wayback Machine: Agora com 240.000.000.000 URLs | Internet Archive Blogs". 9 de janeiro de 2013. Arquivado do original em 14 de abril de 2014. Recuperado 16 de abril 2014.
  28. ^ Rossi, Alexis (25 de outubro de 2013). "Consertando Links Quebrados na Internet". archive.org. San Francisco, CA, US: Collections Team, the Internet Archive. Arquivado do original em 7 de novembro de 2014. Recuperado 25 de março, 2015. Adicionamos a capacidade de arquivar uma página instantaneamente e obter de volta um URL permanente para essa página na máquina de retorno. Este serviço permite que qualquer pessoa - editores da Wikipédia, acadêmicos, profissionais do direito, estudantes ou cozinheiros domésticos como eu - crie um URL estável para citar, compartilhar ou marcar qualquer informação que deseja ter acesso no futuro.
  29. ^ "A nova Internet Archive Wayback Machine agora online". www.digitaljournal.com. 23 de outubro de 2013.
  30. ^ Equipe do VirusTotal (25 de março de 2015). "207.241.226.190 informações de endereço IP". virustotal.com. Dublin 2, Irlanda: VirusTotal. Arquivado do original em 14 de julho de 2014. Recuperado 25 de março, 2015. 25/03/2015: URLs mais recentes hospedados neste endereço IP detectados por pelo menos um scanner de URL ou conjunto de dados de URL malicioso. ... 2/62 2015-03-25 16:14:12 [URL completo redigido] /Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [URL completo redigido] /CBLightSetup.exeCS1 maint: location (ligação)
  31. ^ Consultoria fornecida pelo Google (25 de março de 2015). "Página de diagnóstico de navegação segura para archive.org". google.com/safebrowsing. Mountain View, CA, EUA. Arquivado do original em 6 de abril de 2015. Recuperado 25 de março, 2015. 25-03-2015: Parte deste site foi listada por atividades suspeitas 138 vez (es) nos últimos 90 dias. ... O que aconteceu quando o Google visitou este site? ... Das 42410 páginas testadas no site durante os últimos 90 dias, 450 página (s) resultaram no download e na instalação de software malicioso sem o consentimento do usuário. A última vez que o Google visitou este site foi em 25/03/2015, e a última vez que conteúdo suspeito foi encontrado neste site foi em 25/03/2015. ... O software malicioso inclui 169 trojan (s), 126 virus, 43 backdoor (s).
  32. ^ "Perguntas mais frequentes sobre o Internet Archive". Arquivado do original em 21 de outubro de 2009. Recuperado 17 de janeiro 2015.
  33. ^ "Perguntas mais frequentes sobre o Internet Archive". 18 de dezembro de 2014. Arquivado em o original em 18 de dezembro de 2014. Recuperado 13 de dezembro 2018.
  34. ^ "A manipulação de big data pode mudar a maneira como o mundo pensa?". O Nacional. Arquivado do original em 12 de janeiro de 2017. Recuperado 14 de maio, 2017.
  35. ^ Crockett, Zachary (28 de setembro de 2018). "Inside Wayback Machine, a cápsula do tempo da Internet". The Hustle. Arquivado do original em 2 de outubro de 2018. Recuperado 26 de outubro 2018.
  36. ^ Heffernan, Virginia (18 de setembro de 2018). "Coisas quebram e decaem na Internet - isso é uma coisa boa". WIRED. Arquivado do original em 25 de setembro de 2018. Recuperado 26 de outubro 2018.
  37. ^ Michelle (9 de maio de 2014). "Wayback Machine atinge 400.000.000.000!". Arquivo da Internet. Arquivado do original em 26 de agosto de 2014. Recuperado 25 de março, 2015.
  38. ^ "Internet Archive Wayback Machine". Arquivo da Internet. Arquivado de o original em 13 de fevereiro de 2015. Recuperado 25 de março, 2015.
  39. ^ "Alguns sites não estão disponíveis devido a Robots.txt ou outras exclusões". Arquivado de o original em 15 de abril de 2011.
  40. ^ "Perguntas mais frequentes sobre o Internet Archive". Arquivado de o original em 17 de abril de 2014.
  41. ^ Cox, Joseph (22 de maio de 2018). "The Wayback Machine está excluindo evidências de malware vendido a stalkers". Arquivado do original em 23 de maio de 2018. Recuperado 23 de maio 2018.
  42. ^ "Robots.txt destinado a mecanismos de pesquisa não funciona bem para arquivos da web". Arquivo da Internet. 17 de abril de 2017. Recuperado 29 de junho 2019.
  43. ^ https://help.archive.org/hc/en-us/articles/360004651732-Using-The-Wayback-Machine
  44. ^ "Recomendações para gerenciar solicitações de remoção e preservar a integridade arquivística". Universidade da Califórnia. 14 de dezembro de 2002. Arquivado do original em 18 de setembro de 2017. Recuperado 14 de setembro 2017.
  45. ^ "Remoção retroativa de robots.txt de rastreamentos anteriores, também conhecida como Política de Arquivo de Oakland". Arquivo da Internet. 7 de julho de 2014. Arquivado do original em 10 de outubro de 2017. Recuperado 14 de setembro 2017.
  46. ^ Mark Graham (17 de abril de 2017). "Robots.txt destinado a mecanismos de pesquisa não funciona bem para arquivos da web". Blogs de arquivo da Internet. Arquivado do original em 17 de abril de 2017. Recuperado 16 de abril 2017.
  47. ^ "Archivierung des Internets: Internet Archive ignoriert künftig robots.txt" (em alemão). heise online. Arquivado do original em 27 de abril de 2017. Recuperado 14 de maio, 2017.
  48. ^ "Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren - Golem.de" (em alemão). Arquivado do original em 19 de junho de 2017. Recuperado 14 de maio, 2017.
  49. ^ "O Internet Archive irá ignorar os arquivos robots.txt para manter o registro histórico preciso". Tendências digitais. 24 de abril de 2017. Arquivado do original em 16 de maio de 2017. Recuperado 14 de maio, 2017.
  50. ^ Sampath Kumar, B.T .; Prithviraj, K.R. (21 de outubro de 2014). "Trazendo vida para a morte: Papel da Wayback Machine na recuperação de URLs desaparecidos". Journal of Information Science. 41 (1): 71–81. doi:10.1177/0165551514552752. ISSN 0165-5515. S2CID 28320982.
  51. ^ uma b c d e "A Wayback Machine não censura o arquivo pelo gosto, diz o diretor após a revisão do artigo das Olimpíadas". Arquivado do original em 6 de janeiro de 2017. Recuperado 14 de maio, 2017.
  52. ^ Lepore, Jill (26 de janeiro de 2015). "O que a web disse ontem". O Nova-iorquino. Arquivado do original em 25 de janeiro de 2015. Recuperado 14 de maio, 2017.
  53. ^ "A Marcha pela Ciência começou com a 'linha descartável' desta pessoa no Reddit". Washington Post. Arquivado do original em 23 de abril de 2017. Recuperado 23 de abril 2017.
  54. ^ "Os cientistas vão marchar sobre Washington?". The Washington Post. Arquivado do original em 31 de janeiro de 2017. Recuperado 31 de janeiro 2017.
  55. ^ Foley, Katherine Ellen. "A marcha global pela ciência começou com um único tópico do Reddit". Quartzo. Arquivado do original em 24 de abril de 2017. Recuperado 23 de abril 2017.
  56. ^ http://blog.archive.org/2018/10/01/more-than-9-million-broken-links-on-wikipedia-are-now-rescued
  57. ^ Graham, Mark (17 de setembro de 2020). "Cloudflare e a Wayback Machine, unindo forças para uma Web mais confiável". Blogs de arquivo da Internet. Recuperado 17 de setembro 2020.
  58. ^ "Perguntas mais frequentes sobre o Internet Archive". Arquivo da Internet. 2 de abril de 2014. Arquivado em o original em 2 de abril de 2014. Recuperado 23 de novembro 2018.
  59. ^ "Perguntas mais frequentes sobre o Internet Archive". archive.org. Recuperado 23 de novembro 2018.
  60. ^ uma b Bates, Mary Ellen (2002). "A Máquina Wayback". Conectados. 26: 80 - via EBSCOhost.
  61. ^ "YouTube - Archiveteam". archiveteam.org. Recuperado 6 de agosto, 2020.
  62. ^ "Perguntas mais frequentes sobre o Internet Archive". archive.org. Arquivado do original em 20 de abril de 2013. Recuperado 18 de outubro 2018.
  63. ^ uma b c Lloyd, Howard (outubro de 2009). "Order to Disable Robots.txt" (PDF). Arquivado de o original (PDF) em 8 de agosto de 2019. Recuperado 15 de outubro 2009.
  64. ^ Cortes, Antonio (outubro de 2009). "Remoção de oposição de movimento de robôs.txt". Arquivado de o original em 27 de outubro de 2010. Recuperado 15 de outubro 2009.
  65. ^ Gelman, Lauren (17 de novembro de 2004). "Instantâneos da página da Web do Internet Archive admitidos como prova". Pacotes. 2 (3). Arquivado de o original em 30 de abril de 2011. Recuperado 4 de janeiro, 2007.
  66. ^ Howell, Beryl A. (fevereiro de 2006). "Provando o histórico da web: como usar o arquivo da Internet" (PDF). Journal of Internet Law: 3-9. Arquivado de o original (PDF) em 5 de julho de 2010. Recuperado 6 de agosto, 2008.
  67. ^ "Procurando Provas em Lugares Virtuais Admissibilidade de Provas na Internet". Arquivado do original em 1º de julho de 2019. Recuperado 14 de junho 2020.
  68. ^ Levitt, Carole A .; Rosch, Mark E. (2010). Encontre informações como um profissional: explorando os recursos publicamente disponíveis para pesquisa investigativa, Tom 1. American Bar Association. pp. 194–196. ISBN 978-1-60442-890-2. Recuperado 14 de junho 2020.
  69. ^ Wynn W. Coggins (outono de 2002). "Arte anterior no campo de patentes de método comercial - quando um documento eletrônico é uma publicação impressa para fins da técnica anterior?". USPTO. Arquivado de o original em 21 de setembro de 2012. Recuperado 15 de agosto, 2012.
  70. ^ "Desmascarando a Máquina Wayback". Arquivado de o original em 29 de junho de 2010.
  71. ^ Bahr, Martin (2002). "The Wayback Machine und Google Cache - eine Verletzung deutschen Urheberrechts?". JurPC (em alemão): 9. doi:10.7328 / jurpcb / 20021719. Arquivado do original em 23 de agosto de 2009.
  72. ^ "FAQ do Arquivo da Internet". Arquivado do original em 17 de abril de 2014. Recuperado 16 de abril 2014.
  73. ^ Bowman, Lisa M (24 de setembro de 2002). "Arquivo da Internet silencia o crítico da Cientologia". CNET News.com. Arquivado de o original em 15 de maio de 2012. Recuperado 4 de janeiro, 2007.
  74. ^ Jeff (23 de setembro de 2002). "exclusões da Wayback Machine" (Blog). Fórum Wayback Machine. Arquivo da Internet. Arquivado do original em 11 de fevereiro de 2007. Recuperado 4 de janeiro, 2007. Autor e Data indicam o início do tópico do fórum.
  75. ^ Miller, Ernest. "Sherman, defina a máquina do caminho de volta para a Cientologia". LawMeme. Escola de Direito de Yale. Arquivado de o original (Blog) em 16 de novembro de 2012. Recuperado 4 de janeiro, 2007.
  76. ^ Dye, Jessica (2005). "Site processado por viagem controversa ao passado da Internet". EContent. 28. 11: 8–9.
  77. ^ Bangeman, Eric (31 de agosto de 2006). "Arquivo da Internet decide sobre máquina de retorno". Ars Technica. Arquivado do original em 5 de novembro de 2007. Recuperado 29 de novembro 2007.
  78. ^ uma b Arquivo da Internet v. Shell, 505 F.Supp.2d 755 em justia.com, 1: 2006cv01726 (Tribunal Distrital do Colorado 31 de agosto de 2006) ("'Acordo de Acordo de 25 de abril de 2007 anunciado.' Arquivamento 65, 30/04/2007: '... portanto, ORDENADO que este assunto seja DISMISSÍDO COM PRECONCEITO ...'").
  79. ^ uma b Babcock, Lewis T., Juiz Chefe (13 de fevereiro de 2007). "Arquivo da Internet v. Shell Ação Civil nº 06cv01726LTBCBS " (PDF). Arquivado (PDF) do original em 25 de janeiro de 2014. Recuperado 25 de março, 2015. 1) A moção do Internet Archive para indeferir a reconvenção da Shell por conversão e roubo civil (Segunda Causa de Ação) é CONCEDIDA; 2) A moção do Internet Archive para rejeitar a reconvenção da Shell por violação de contrato (Terceira Causa de Ação) é NEGADA; 3) A moção do Internet Archive para rejeitar a reconvenção da Shell por extorsão sob RICO e COCCA (Quarta Causa de Ação) é OUTORGADA.
  80. ^ Claburn, Thomas (16 de março de 2007). "Mulher do Colorado processa contratos de rastreadores da web". Nova York, NY, EUA: InformationWeek, UBM Tech, UBM LLC. Arquivado do original em 4 de setembro de 2014. Recuperado 25 de março, 2015. Os computadores podem celebrar contratos em nome de pessoas. A Lei de Transações Eletrônicas Uniformes (UETA) diz que um 'contrato pode ser formado pela interação de agentes eletrônicos das partes, mesmo que nenhum indivíduo tenha conhecimento ou revise as ações dos agentes eletrônicos ou os termos e acordos resultantes.'
  81. ^ Samson, Martin H., Phillips Nizer LLP (2007). "Internet Archive v. Suzanne Shell". internetlibrary.com. Biblioteca de Leis e Decisões Judiciais da Internet. Arquivado do original em 3 de agosto de 2014. Recuperado 25 de março, 2015. Mais importante, sustentou o tribunal, a mera cópia do site da Shell pelo Internet Archive, e sua exibição em seu banco de dados, não constituía o exercício necessário de domínio e controle sobre a propriedade do réu. O mais importante, observou o tribunal, é que o réu sempre foi proprietário e operou seu próprio site. Disse o Tribunal: 'A Shell não alegou fatos que mostrem que o Internet Archive exerceu domínio ou controle sobre seu site, uma vez que a reclamação da Shell afirma explicitamente que ela continuou a possuir e operar o site enquanto ele estava arquivado na máquina Wayback. A Shell não identifica nenhuma autoridade que apóie a noção de que copiar documentos é, por si só, uma privação de uso suficiente para dar suporte à conversão. Por outro lado, vários circuitos determinaram que não. '
  82. ^ cervejaria (25 de abril de 2007). "Internet Archive e Suzanne Shell Settle Lawsuit". archive.org. Denver, CO, EUA: Arquivo da Internet. Arquivado do original em 5 de dezembro de 2010. Recuperado 25 de março, 2015. Ambas as partes lamentam sinceramente qualquer turbulência que o processo possa ter causado à outra. Nem o Internet Archive nem a Sra. Shell toleram qualquer conduta que possa ter causado danos a qualquer uma das partes decorrente da atenção pública a este processo. As partes não se envolveram em tal conduta e solicitam que a resposta pública à resolução amigável deste litígio seja consistente com seus desejos de que nenhum outro dano ou turbulência seja causado a qualquer uma das partes.
  83. ^ Stobbe, Richard (5 de dezembro de 2014). "Implicações de direitos autorais de um" direito de ser esquecido "? Ou como derrubar o arquivo da Internet". Mondaq. Recuperado 8 de março, 2019.
  84. ^ McVeigh, Glennys (16 de outubro de 2014). Philpott, James; Weissman, Adam; Bucholz, Ren; Kettles, Brent; Pearl, Aaron (eds.). "Davydiuk v. Internet Archive Canada, 2014 FC 944". CanLII. Federação das Sociedades Jurídicas do Canadá. Recuperado 8 de março, 2019.
  85. ^ Southcott, Richard F. (30 de novembro de 2016). Philpott, John; Alton, Alex; Bucholz, Ren (eds.). "Davydiuk v. Internet Archive Canada e Internet Archive, 2016 FC 1313 (CanLII)". CanLII. Ottawa, Ontário: Federação das Sociedades Jurídicas do Canadá. Recuperado 8 de março, 2019.
  86. ^ Conger, Kate. "Fazendo backup da história da Internet no Canadá para salvá-la de Trump". TechCrunch. Arquivado do original em 27 de dezembro de 2016. Recuperado 14 de maio, 2017.
  87. ^ "Onde encontrar o que desapareceu online e muito mais: o Internet Archive". Public Radio International. Arquivado do original em 28 de março de 2017. Recuperado 14 de maio, 2017.
  88. ^ Chirgwin, Richard. "Não há caminho de volta na Rússia: Putin bloqueia o Archive.org". Arquivado do original em 7 de outubro de 2016. Recuperado 14 de maio, 2017.
  89. ^ "A Rússia não retrocede, bloqueia o Internet Archive". Tendências digitais. 26 de junho de 2015. Arquivado do original em 17 de abril de 2016. Recuperado 14 de maio, 2017.
  90. ^ "В России разблокирован крупнейший интернет-архив". Российская газета (em russo). Recuperado 18 de outubro 2020.
  91. ^ "Ajude-nos a manter o arquivo livre, acessível e privado do leitor | Blogs de arquivo da Internet". 29 de novembro de 2016. Arquivado do original em 21 de maio de 2017. Recuperado 14 de maio, 2017.
  92. ^ https://www.engadget.com/2013-11-07-wayback-machine-internet-archive-fire.html
  93. ^ "Arquivo da Internet: alterações propostas ao DMCA nos tornariam" censor na web"". Consumista. 7 de junho de 2016. Arquivado do original em 11 de novembro de 2016. Recuperado 14 de maio, 2017.
  94. ^ Herb, Ulrich. "Die Trump-Angst grassiert" (em alemão). heise online. Arquivado do original em 7 de dezembro de 2016. Recuperado 14 de maio, 2017.
  95. ^ LaFrance, Adrienne. "A Idade das Trevas da Internet". O Atlantico. Arquivado do original em 7 de maio de 2017. Recuperado 14 de maio, 2017.
  96. ^ "Toda a Internet será arquivada no Canadá para protegê-la de Trump". Placa-mãe. 29 de novembro de 2016. Arquivado do original em 16 de maio de 2017. Recuperado 14 de maio, 2017.
  97. ^ LaFrance, Adrienne (3 de junho de 2016). "O medo humano do conhecimento total". O Atlantico. Arquivado do original em 2 de dezembro de 2016. Recuperado 14 de maio, 2017.

links externos

Pin
Send
Share
Send