Povratni stroj

Iz Wikipedije, proste enciklopedije
Pojdi na navigacijo Pojdi na iskanje
Povratni stroj
Povratni stroj
Slika logotipa
URL archive.org/web/ (angl.)
Vrsta mesta arhiv
jeziki) angleščina
Programski jezik Java , Python
Lastnik Internetni arhiv
Začetek dela 24. oktober 2001
Alexa uvrstitev 205[1]

Wayback Machine (iz angleščine. - "Time Machine") - brezplačen spletni arhiv neprofitnih knjižnic ' Internetni arhiv . " Wayback Machine s pomočjo iskalnih robotov ali spletnih pajkov arhivira in javno objavi večino »odprtega« interneta[2] . Storitev je bila uvedena leta 1996, javnosti pa je postala dostopna šele leta 2001. V svojih prvih 20 letih obstoja je Wayback Machine katalogiziral in ohranil zbirko več kot 286 milijard spletnih strani. Arhivirani posnetki so prikazani v formatu HTML , JavaScript in CSS[3] . Zahvaljujoč dokumentom, shranjenim v Wayback Machine, lahko uporabniki spremljajo spremembe, ki se dogajajo na spletnih mestih, in primerjajo različne različice popravkov [4] . Od julija 2021 je Wayback Machine omogočil dostop do več kot 591 milijard shranjenih spletnih strani [5] .

Ustvarjanje

Internetni arhivski strežniki, 2008
Brewster Cale leta 2009

Leta 1989 je angleški znanstvenik Tim Berners-Lee ustvaril svetovni splet , sistem, ki omogoča prenos podatkov prek računalnikov, povezanih z internetom. Vendar pa sta bila s širjenjem svetovnega spleta ugotovljena dva glavna problema. Prvi je bil, da ni bilo dovolj prostora za shranjevanje vseh podatkov, zaradi česar je bilo veliko dokumentov in spletnih strani izbrisanih. Druga težava je bila, da uporabniki po urejanju spletne strani (na primer iz pravnih razlogov) niso mogli videti njene prvotne različice. Za odpravo teh pomanjkljivosti je poskušala ameriška digitalna knjižnica " Internet Archive " - neprofitna organizacija, ki sta jo leta 1996 ustanovila programerja Brewster Kahle in Bruce Galliate [en] . V sodelovanju z Alexa Internet , hčerinsko družbo Amazona za spletno indeksiranje, je Arhiv začel ustvarjati in shranjevati kopije obstoječih spletnih mest, da bi razvil "univerzalni dostop do znanja". Organizacija je zagotovila brezplačen javni dostop do digitaliziranega gradiva, kot so spletne strani, knjige, zvočni posnetki, vključno s koncerti v živo, videoposnetki, slike in programska oprema. Za leto 2021 se sedež internetnega arhiva nahaja v San Franciscu , v nekdanji krščanski cerkvi, ki se nahaja na območju Richmonda . Novinar lokalne radijske postaje Kawl [en] je leta 2019 primerjal arhiv arhiva z rimskim templjem [6][7] [8] . Cilj organizacije je rešiti internet pred izumrtjem[9] .

Wayback Machine je postal najbolj znan projekt Arhiva. Spletna storitev je dobila ime po časovnem stroju iz animirane serije The Rocky and Bullwinkle Show iz šestdesetih let prejšnjega stoletja. Omogoča dostop do digitalne zbirke približno 562 milijard spletnih strani [4] [10] [11] . Projekt Wayback Machine je bil zasnovan kot rešitev za napako 404 , kar pomeni, da strežnik ne more najti podatkov na zahtevanem naslovu. To je posledica tako imenovanega izumrtja povezav – vse večje nedostopnosti enkrat objavljenih podatkov. Na primer, leta 1997 je bila povprečna življenjska doba spletne strani 44 dni. Leta 2003 je ta številka znašala 100 dni. Analiza povezav do 2700 digitalnih virov iz leta 2008, od katerih večina ni imela tiskanega ekvivalenta, je pokazala, da je približno 8 odstotkov povezav prenehalo delovati po enem letu. Do leta 2011, po treh letih, je bilo 30 odstotkov povezav v zbirki mrtvih [12] . Zahvaljujoč integraciji Alexa lahko uporabnik, ki se sooči s sporočilom o napaki, dostopa do arhivirane različice strani prek vdelane orodne vrstice brskalnika. Če bi bila kopija nedostopne strani prisotna v bazi podatkov Wayback Machine, bi zasvetil poseben gumb. V tem primeru bi lahko uporabniki brskalniku dali dovoljenje za ogled in registracijo dejavnosti – v tem primeru so bila vsa obiskana spletna mesta arhivirana na portalu [13] .

Wayback Machine je bil lansiran maja 1996, javnosti pa je postal dostopen šele leta 2001 – pred tem so bile vse informacije, posnete na digitalnih magnetnih trakovih, dostopne le omejenemu številu znanstvenikov in raziskovalcev [14] . Do "odpiranja" je arhiv vseboval več kot 10 milijard arhiviranih strani [4] . Do decembra 2014 je Wayback Machine poročal, da je shranil 435 milijard spletnih strani po vsem svetu[2] . Tehnično gledano programska oprema Wayback Machine ni arhiv, temveč javni vmesnik za omejeno podmnožico vseh skladišč [15] . Tako Wayback Machine ni mogoče šteti za iskalnik zbirke organizacije, saj ne išče baze podatkov druge velike virtualne knjižnice - Open Library , ki uporabnikom omogoča dostop do brezplačnih digitalnih izvodov knjig, ki so naložene in arhivirane kot del projekt [16] [17 ] .

Značilnost

Internetni arhiv je z uvedbo Wayback Machine postal eden najbolj priljubljenih in prepoznavnih spletnih portalov ter glavna storitev spletnega arhiviranja [4][9] . Leta 1999 je Arhiv začel širiti zbirko izven arhivske spletne vsebine, da bi zagotovil status tako digitaliziranim kot izvorno digitalnim virom, vključno s knjigami, zvokom, filmi, slikami, dokumenti, programsko opremo in video igrami[7]. Nekatere preglede izvajajo pajki iskalnikov samega arhiva, druge pa partnerske organizacije. Posamezne zbirke podatkov je mogoče pridobiti z donacijami uporabnikov in ciljnimi pridobitvami [17] . Sami ustanovitelji organizacije so svojo zbirko primerjali z Aleksandrijsko knjižnico[7] . Od leta 2021 je Wayback Machine vseboval več kot 424 milijard spletnih strani [15] – več kot dokumenti v Kongresni knjižnici [18][7] [17] .

Načelo delovanja

Platforma Wayback Machine deluje na dveh glavnih elementih - iskalnih robotih (ali spletnih pajkih ) in vmesniku. Spletni pajki obiščejo, izvlečejo, prenesejo in arhivirajo spletne strani. Po drugi strani pa uporabniki prek vmesnika pridobijo dostop do spletnih zbirk[3] .

Iskalni roboti

Rast zbirke Wayback Machine [19]
Zbirka Wayback Machine po letih Arhivirane strani (v milijardah)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452
2020
514
2021
581

Sprva je bila arhivska zbirka dopolnjena z vtičnikom brskalnika Alexa Internet, ki samodejno zajame in shrani vsako spletno stran, ko je obiskana, nato pa vse zbrane podatke prenese v "Internet Archive". Uporabniki so lahko namestili tudi brezplačno orodno vrstico za preverjanje stanja arhiviranja izbrane spletne strani [17] .

Leta 2002 je Arhiv lansiral lastnega robota iskalnika - Heritrix [en] open source. Kode pajka so napisane s kombinacijo programskih jezikov C in Perl . Poleg tega Internetni arhiv sprejema tudi skenirane podatke drugih donatorjev[7] . Skenirane kopije spletnih mest se samodejno pretvorijo v datoteke velikosti približno 100 MB, ki se nato shranijo na strežnike. Splošna stopnja dopolnjevanja arhiva je približno 10 terabajtov na mesec [20] .

Spletni pajki zajamejo različico spletnega mesta, kot je bila shranjena v času, ko je bil do nje dostopen prek URL-ja. Roboti redno plazijo po velikem številu spletnih strani, rekurzivno nalagajo, razčlenjujejo in prikazujejo strani HTML , JavaScript in CSS[3] . Mehanizem dela pajkov je podoben delu iskalnikov - roboti samostojno iščejo portale za arhiviranje prek iskalnika poti, skenirajo strani in sorodna spletna mesta ter tako tvorijo mrežo portalov. V času, ko je bil arhiv ustvarjen, je bil svetovni splet tako majhen, da so spletni pajki lahko preiskali vsa spletna mesta v eni seji. Vendar pa sta sčasoma zaradi nenehne rasti spletnih portalov in njihove nestanovitnosti skoraj nemogoče v celoti prečkati celotno omrežje. Tako niso vse spremembe na straneh zabeležene v Wayback Machine[9] . Vodstvo Arhiva ne navaja, kako roboti najdejo in izberejo strani za pajkanje, navaja pa, da so pajki največkrat usmerjeni na tista spletna mesta, ki so navzkrižno povezana z drugimi portali in so v javni domeni. Pajek se začne na spletni strani in nato sledi vsaki hiperpovezavi na tej spletni strani, da se pomakne na nova spletna mesta. Na vsaki od novih spletnih strani pajek ponovi postopek [15] . Nadaljevalo se bo, dokler se arhiviranje ne ustavi ali ne doseže meje, ki jo nastavi skript [21] . Poleg tega lahko vsak uporabnik na portalu uporabi poseben obrazec in pokliče pajka, ki bo stran shranil v trenutnem stanju[3] . Wayback Machine skenira samo javne spletne strani in ne more dostopati do vsebine, ki je zaščitena z geslom ali gostuje na zasebnem strežniku [11] [15] [4] .

vmesnik

Vmesnik Wayback Machine omogoča uporabnikom, da izvedejo dve glavni dejanji - dostop do zgodovine sprememb na spletnem mestu in ogled vseh sprememb, opravljenih na portalih. Na voljo je tudi funkcija primerjave različnih različic spletnih mest [13] [22] [18] [23] . To naredite tako, da v posebno iskalno polje vnesete URL portala, ki vas zanima, po katerem Wayback Machine prikaže seznam arhiviranih datumov. Zvezdica za nekaterimi datumi se uporablja za označevanje sprememb, najdenih na strani. URL za arhivirano stran se začne na web.archive.org [24] [15] .

Vsakdo lahko shrani URL-je za arhiviranje, z brezplačnim arhivskim računom pa lahko ustvarite in arhivirate vse odhodne ali zunanje povezave na izvirni strani in dobite pregledno poročilo [25] [25] .

Skladiščenje

Od leta 2018 je zbirka internetnega arhiva obsegala več kot 40 petabajtov ali 40 milijonov gigabajtov podatkov, Wayback Machine pa je omogočil dostop do približno 63 % vsega razpoložljivega gradiva [26] . Od februarja 2020 je Wayback Machine arhiviral več kot 900 milijard URL-jev in več kot 400 milijard spletnih strani [27] Od junija 2021 je Wayback Machine omogočil dostop do več kot 581 milijard shranjenih spletnih strani [5] .

Uporaba

Portal Wayback Machine se pogosto uporablja na pravnem področju – odvetniki storitev uporabljajo za iskanje informacij o civilnih tožbah, kazenskih zadevah, upravnih in patentnih postopkih. Arhivirane različice spletnih mest, pridobljene s pomočjo Wayback Machine, se lahko uporabljajo za reševanje vprašanj patentnega prava ali za nalaganje kazni za objavo gradiva, ki je bilo pozneje odstranjeno iz omrežja[3] [13] . Kljub obsežni uporabi zbirke internetnega arhiva za zagotavljanje dokazov so nekatera ameriška sodišča zavrnila sprejem posnetkov zaslona spletnih strani, navajajoč pravne težave pri identifikaciji izvirnega dokumenta z arhivirano različico [28] . Leta 2018 je ameriško pritožbeno sodišče odločilo, da so bili posnetki zaslona z arhiviranih spletnih strani Wayback Machine pravni dokaz, ki se lahko uporabi v sodnih postopkih [29] [30]

Članki, arhivirani na Wayback Machine, omogočajo avtorjem, da vzpostavijo pravice do odprtja ali objave [31] . Za sociologe in zgodovinarje Wayback Machine ponuja dragocen vir velikega obsega podatkov za analizo vedenja podjetja, prodajnih strategij, družbenih praks[2] [32] . Wayback Machine vam omogoča tudi dostop do revij z odprtim dostopom . Tako je od začetka 2000-ih z interneta izginilo 84 revij OA s področja naravoslovja in še približno 100 iz družbenih in humanitarnih [33] [34] [35] .

Aktivisti in raziskovalci portal uporabljajo za boj proti dezinformacijam , ki so se še posebej okrepile po izvolitvi predsednika Donalda Trumpa v ZDA . V odgovor na vse večjo polemiko predsedniške administracije je Arhiv ustvaril ločeno zbirko, imenovano Trumpov arhiv, ki vsebuje predsednikove televizijske nastope in tvite . Arhiv upa, da bo njegovo skladišče pomagalo drugim prepoznati napačne podatke in preveriti sumljivo vsebino [36] [37] . Vendar pa so v nekaterih primerih posamezni aktivisti trdili, da so arhivirani viri Wayback Machinea, nasprotno, prispevali k širjenju dezinformacij. Tako so ob začetku pandemije koronavirusa zagovorniki teorij zarote uporabili posnetke zaslona, ​​ki jih je shranil portal, za širjenje napačnih informacij o koronavirusu [38] . Kot protiukrep je Arhiv novembra 2020 uvedel orodja za potrjevanje v Wayback Machine. V ta namen je neprofitna organizacija sodelovala z različnimi podjetji za preverjanje dejstev, da bi uporabnikom zagotovila razloge za odstranitev strani iz zbirke. Ko odprete arhivirano različico spletnega mesta, Wayback Machine uporabnikom posreduje informacije o razlogu za njeno odstranitev v obliki rumene pasice na vrhu zaslona. Če obstaja sum, da je spletna stran vpletena v kampanjo dezinformiranja, Wayback Machine zagotovi podrobnosti o organizaciji, ki je preverila veljavnost, in povezavo do njenega poročila [39].

V nekaterih primerih so se informacije, prejete prek Wayback Machine, pojavile v velikih škandalih. Tako je bilo s pomočjo portala ugotovljeno, da je uradni predstavnik ameriškega ministrstva za zdravje in človeške storitve Michael Caputo [en] v seriji že izbrisanih tvitov objavil rasistične in ponižujoče komentarje o Kitajskem [40] . Poleg tega Wayback Machine hrani kopijo pozneje izbrisanega sporočila, da je vodja ukrajinskih separatistov Igor Strelkov prevzel odgovornost za nesrečo Boeinga 777 v regiji Doneck [41] [42] . Maja 2021 je Bellingcat ugotovil, da ameriška vojska, nameščena v Evropi, uporablja otroške mobilne aplikacije za shranjevanje informacij za shranjevanje tajnih podatkov. Zaradi napačno nastavljenih nastavitev zasebnosti so drugi uporabniki pridobili dostop do tajnih podatkov. Po odkritju uhajanja informacij je vojska odstranila vse karte, a so ostale v Wayback Machine [43] .

Pravni status

Internetni arhiv ne zahteva dovoljenja za kopiranje spletnih mest, preden zbere podatke na daljavo, ampak na zahtevo izbriše ali omeji dostop do arhivskega gradiva. Lastniki spletnih mest imajo na primer možnost, da se »onemogočijo« arhiviranja prek standardne datoteke robots.txt, ki izključuje spletna mesta s seznama portalov spletnih pajkov[9] [44] . Vendar je internetni arhiv zaradi hrambe drugih podatkov v ranljivem pravnem položaju [45] . Na primer, leta 2005 se je Wayback Machine zapletel v spor glede blagovne znamke med Healthcare Advocates in Health Advocate. Slednji je uporabil Wayback Machine za dostop do spletnih strani Healthcare Advocates iz leta 1999, da bi našel informacije, ki bi podprle primer. V odgovor so Healthcare Advocates tožili tako Health Advocatt kot Arhiv, češ da je arhiv kršil Zakon o avtorskih pravicah digitalnega tisočletja . Kasneje je bila zadeva rešena izvensodno [46] .

Leta 2002 je Arhiv odstranil iz svojega sistema povezave do arhiviranih kopij portala Xenu.net v lasti cerkvenega kritika Andreasa Heldal-Lunda. Odstranitev je potekala na zahtevo odvetnikov scientološke cerkve, ki so povedali, da so lastniki izvlečkov iz cerkvenih dokumentov, objavljenih na spletni strani [47] [48] .

Omejitve

Raziskovalci in aktivisti so kritizirali Wayback Machine in internetni arhiv, ker poskušata ohraniti celotno spletno gradivo, od katerih je veliko malo vrednega. Po mnenju nekaterih raziskovalcev je to posledica zastarele politike internetnega arhiva, ki je bil ustanovljen v poznih devetdesetih letih prejšnjega stoletja – takrat, ob zori nastanka internetnih arhivov, je veljalo, da je treba internetne podatke ohraniti v celoti. Z nastankom številnih enodnevnih spletnih mest pa so si številni raziskovalci in aktivisti premislili [49] . Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам [50] . Сканеры захватывают только статистический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо́льшая часть функциональных возможностей исходной веб-страницы теряется[9] .

Блокировки

В 2015 году Роскомнадзор принял решение заблокировать Wayback Machine за копию страницы текста «Одиночный джихад в России», содержащего информацию о «теории и практике партизанского сопротивления». Соответствующая страница в Архиве Интернета была добавлена в официальный реестр запрещенных веб-сайтов в России 23 июня 2015 года, из-за чего некоторые российские интернет-провайдеры были вынуждены полностью заблокировать сайт Архива Интернета [51] [52] [53] . В 2019 году представители Ассоциации по защите авторских прав в интернете (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили Мосгорсуд вынести решение о вечной блокировке портала на территории России, однако на август 2020 года Архив Интернета по-прежнему продолжал свою работу [54] [55] [56] [57] .

В 2017 году портал был заблокирован в Индии и Киргизии за содержание «экстремистских материалов» [58] [59] [60] . По данным на 2021 год сайт заблокирован в Китае [61] .

Примечания

  1. https://www.alexa.com/siteinfo/archive.org
  2. 1 2 3 Arora, 2015 .
  3. 1 2 3 4 5 Lerner, 2017 , с. 1741—1755.
  4. 1 2 3 4 5 Michael Bryant. What is the Wayback Machine and Why is it Useful? . Groovy Post (22 апреля 2021). Дата обращения: 29 мая 2021.
  5. 1 2 Wayback Machine . Wayback Machine. Дата обращения: 7 июня 2021.
  6. Dominic Cummings: how the internet knows when you've updated your blog . The Conversation (28 мая 2020). Дата обращения: 3 июня 2021.
  7. 1 2 3 4 5 Odgen, 2017 .
  8. In An Old Church, The Internet Archive Stores Our Digital History . Kalw. San Francisco local public radio (11 сентября 2019). Дата обращения: 3 июня 2021.
  9. 1 2 3 4 5 Price, 2011 .
  10. Jack Schofield. The Time Machine . The Guardian (19 ноября 2007). Дата обращения: 1 июня 2021.
  11. 1 2 Jenni McKinnon. Using the Wayback Machine to Archive (and Backup) WordPress . WPMudev (25 мая 2017). Дата обращения: 29 мая 2021.
  12. Adrienne LaFrance. Raiders of the Lost Web . The Atlantic (14 октября 2015). Дата обращения: 7 июня 2021.
  13. 1 2 3 Rogers, 2017 , с. 160—172.
  14. Hartelius, 2020 , с. 378.
  15. 1 2 3 4 5 Bowyer, 2021 , с. 43—57.
  16. Aja Romano. A lawsuit is threatening the Internet Archive — but it's not as dire as you may have heard . Vox (23 января 2020). Дата обращения: 29 мая 2021.
  17. 1 2 3 4 Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web . Forbes (18 января 2016). Дата обращения: 5 июня 2021.
  18. 1 2 O'Connor, 2008 , с. 64.
  19. michelle. Wayback Machine Hits 400,000,000,000! . Internet Archive (May 9, 2014). Дата обращения: 25 марта 2015. Архивировано 26 августа 2014 года.
  20. Richard Koman. How the Wayback Machine Works . Xml.com (21 января 2002). Дата обращения: 5 июня 2021.
  21. A. Rossi. Worldwide Web Crawls . Internet Archive (5 октября 2010). Дата обращения: 5 июня 2021.
  22. Laura Bohannon. Wayback Machine archives websites for over 20 years . Spartan News Room (7 декабря 2017). Дата обращения: 5 июня 2021.
  23. Maemura, 2018 .
  24. Notess, 2002 .
  25. 1 2 Mark Graham. Tips for Using the Internet Archive's Wayback Machine in Your Next Investigation . Global Investigative Journalism Network (5 мая 2021). Дата обращения: 29 мая 2021.
  26. Zachary Crockett. Inside Wayback Machine, the internet's time capsule . The Hustle (28 сентября 2018). Дата обращения: 29 мая 2021.
  27. Евгений Делюкин. Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц . VcRu (26 февраля 2020). Дата обращения: 1 июня 2021.
  28. Eltgroth, 2009 .
  29. Kieren McCarthy. Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule . The Register (4 сентября 2018). Дата обращения: 4 июня 2021.
  30. Маргарита Сазонова. Электронные доказательства в спорах в сфере интеллектуальной собственности . Гарант (26 октября 2020). Дата обращения: 5 июня 2021.
  31. Pearce, 2009 , с. 875.
  32. Milligan, 2016 .
  33. Jeffrey Brainard. Dozens of scientific journals have vanished from the internet, and no one preserved them . Science (8 сентября 2020). Дата обращения: 1 июня 2021.
  34. Diana Kwon. More than 100 scientific journals have disappeared from the Internet . Nature (10 сентября 2020). Дата обращения: 1 июня 2021.
  35. avouner. Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил . Хабр (10 сентября 2020). Дата обращения: 5 июня 2021.
  36. Camilla Hodgson. How the Internet Archive is waging war on misinformation . Financial Times (17 сентября 2019). Дата обращения: 3 июня 2021.
  37. Mary Kay Magistad. Where to find what's disappeared online, and a whole lot more: the Internet Archive . The World (23 февраля 2017). Дата обращения: 7 июня 2021.
  38. Acker, 2020 .
  39. Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц . Trash Box (2 ноября 2020). Дата обращения: 5 июня 2021.
  40. Журналисты припомнили расистские высказывания пресс-секретаря Минздрава США . Красная весна (24 апреля 2020). Дата обращения: 5 июня 2021.
  41. Did the Wayback Machine Catch Russian-Backed Rebels Claiming Responsibility for Malaysian Airlines Flight MH17? . Open Culture (19 июля 2014). Дата обращения: 3 июня 2021.
  42. Jil Lepore. The Cobweb . New Yorker (19 января 2015). Дата обращения: 7 июня 2021.
  43. Дамир Камалетдинов. В сеть попали секретные данные об американском ядерном оружии — военные записывали их в школьных приложениях . T Journal (30 мая 2021). Дата обращения: 5 июня 2021.
  44. Carolyn Wimbly Martin. Internet Archive's Open Library and Copyright Law . Lutzker (15 мая 2020). Дата обращения: 4 июня 2021.
  45. Nate Anderson. Copy some webpages, owe more than the national debt . Ars Technica (1 мая 2011). Дата обращения: 5 июня 2021.
  46. Eric Bangeman. Internet Archive settles suit over Wayback Machine . Ars Technica (31 августа 2006). Дата обращения: 7 июня 2021.
  47. Lisa M. Bowman. Net archive silences Scientology critic . C Net (24 сентября 2002). Дата обращения: 10 июня 2021.
  48. Ernest Miller. Features: Sherman, Set the Wayback Machine for Scientology . LawMeme (24 сентября 2002). Дата обращения: 10 июня 2021.
  49. Nora Caplan-Bricker. Preservation Acts . Harper's Magazine (декабрь 2018). Дата обращения: 2 июня 2021.
  50. Crudo, 2014 .
  51. Mike Masnick. Russia Blocks The Internet Archive's Wayback Machine Over A Single Page . Tech dirt (26 июня 2015). Дата обращения: 3 июня 2021.
  52. Роскомнадзор заблокировал архив интернета из-за "Одиночного джихада" . Московский комсомолец (25 июня 2015). Дата обращения: 5 июня 2021.
  53. Роскомнадзор заблокировал страницу «архива интернета» за экстремизм . Lenta (25 июня 2015). Дата обращения: 5 июня 2021.
  54. АЗАПИ хочет навечно заблокировать «Архив интернета» . Роскомсвобода (22 августа 2019). Дата обращения: 5 июня 2021.
  55. «Архив интернета» могут навечно заблокировать в России . C News (23 августа 2019). Дата обращения: 7 июня 2021.
  56. Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru . C News (19 августа 2020). Дата обращения: 7 июня 2021.
  57. Американские издатели книг подали в суд на Internet Archive . Ведомости (2 июня 2020). Дата обращения: 5 июня 2021.
  58. Access to Internet Archive's Wayback Machine Blocked in India . The Wire (8 августа 2017). Дата обращения: 3 июня 2021.
  59. Wayback Machine has been blocked in India . The Verge (9 августа 2017). Дата обращения: 5 июня 2021.
  60. Kyrgyzstan Blocks Archive.org on 'Extremism' Grounds . Global Voices. Дата обращения: 5 июня 2021.
  61. Anna Kramer. The internet is splitting apart. The Internet Archive wants to save it all forever . Protocol (10 марта 2021). Дата обращения: 9 июня 2021.

Литература

  • Acker, A., & Chaiet, M. The weaponization of web archives: Data craft and COVID-19 publics. // Harvard Kennedy School (HKS) Misinformation Review. — 2020. — doi : 10.37016/mr-2020-41 .
  • Anat Ben-David, Adam Amram. The Internet Archive and the socio-technical construction of historical facts // Internet Histories. — 2018. — doi : 10.1080/24701475.2018.1455412 .
  • Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource. — 2015. — Т. 67 , вып. 8 . — С. 1904—1915 . — doi : 10.1002/asi.23503 .
  • Bowyer S. The Wayback Machine: notes on a re‑enchantment // Archival Science. — 2021. — Т. 21 . — С. 43—57 .
  • Deborah R. Eltgroth. Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence // Fordham L. Rev.. — 2009. — Т. 78 , вып. 181 .
  • Greg R. Notess. The Wayback Machine: The Web's Archive // Online. — 2002. — Т. 26 , вып. 2 .
  • Hartelius J. The anxious flâneur: Digital archiving and the Wayback Machine // Quarterly Journal of Speech. — 2020. — Т. 106 , вып. 4 . — С. 377—398 .
  • James L. Quarles III and Richard A. Crudo. [Way]Back to the Future: Using the Wayback Machine in Patent Litigation // Landslide. — 2014. — Т. 6 , вып. 3 .
  • Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present // Association for Computing Machinery. — 2017. — doi : 10.1145/3133956.3134042 .
  • Maemura E., Worby N., Milligan I., Becker C. If These Crawls Could Talk: Studying and Documenting Web Archives Provenance // Journal of the association for information science and technology. — 2018. — Т. 69 , вып. 10 . — С. 1223—1233 .
  • Milligan I. Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives // International Journal of Humanities and Arts Computing. — 2016.
  • Murphy J., Hashim N., O'Connor P. Take Me Back: Validating the Wayback Machine // Journal of Computer-Mediated Communication. — 2008. — Вып. 13 . — С. 60—75 .
  • Odgen J., Halford S., Carr L. Observing Web Archives // WebSci. — 2017. — С. 299—308 .
  • Pearce D., Charlton B. Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org) // Medical Hypothesis. — 2009. — С. 875 .
  • Price. Internet Archiving – The Wayback machine // MLA Commons. — 2011.
  • Phyllis Holman Weisbard. Oldies but Goodies: Archiving WebBased Information // Feminist Collections. — 2011. — Т. 32 , вып. 2 .
  • Rogers R. Doing Web history with the Internet Archive: screencast documentaries // Internet Histories. — 2017. — Т. 1 , вып. 1—2 . — С. 160—172 . — doi : 10.1080/24701475.2017.1307542 .