Wayback Machine

Матеріал з Вікіпедії – вільної енциклопедії
Перейти до навігації Перейти до пошуку
Wayback Machine
Wayback Machine
Зображення логотипу
URL archive.org/web/ (англ.)
Тип сайту архів
Мова(-и) англійська
Мова програмування Java , Python
Власник Архів Інтернету
Початок роботи 24 жовтня 2001
Рейтинг Alexa 205[1]

Wayback Machineангл. - "Машина часу") - безкоштовний онлайн-архів некомерційної бібліотеки " Архів Інтернету ". За допомогою пошукових роботів або веб-краулерів Wayback Machine архівує та робить загальнодоступною більшість «відкритого» інтернету[2] . Сервіс був запущений у 1996 році, проте став доступним для громадськості лише 2001-го. За перші 20 років існування Wayback Machine каталогізував та зберіг колекцію з більш ніж 286 млрд веб-сторінок. Архівні знімки відображаються у форматі HTML , JavaScript та CSS[3] . Завдяки збереженим у Wayback Machine документам користувачі можуть відстежувати зміни, що відбуваються на сайтах, і порівнювати різні версії правок [4] . На липень 2021 року Wayback Machine надавав доступ до більш ніж 591 млрд. збережених веб-сторінок [5] .

створення

Сервера Архіву Інтернету, 2008 рік
Брюстер Кейл у 2009 році

У 1989 році англійський вчений Тім Бернерс-Лі створив всесвітню павутину - систему, що дозволяє передавати дані через підключені до Інтернету комп'ютери. Однак із поширенням всесвітньої павутини було виявлено дві основні проблеми. Перша полягала в нестачі місць для зберігання всіх даних, через що багато документів і веб-сторінок видалялися. Інша проблема полягала в тому, що після редагування веб-сторінки (наприклад, з юридичних причин) користувачі не могли переглянути її початкову версію. Вирішити ці недоліки прагнула американська цифрова бібліотека « Архів Інтернету » - некомерційна організація, створена програмістами Брюстером Кейлом і Брюсом Галліате [en] в 1996 році. При співпраці з Alexa Internet ( дочірньою компанією Amazon , що займається веб-індексуванням), Архів ініціював створення та зберігання копій існуючих сайтів для розвитку «універсального доступу до знання». Організація надавала безкоштовний публічний доступ до оцифрованих матеріалів, таких як веб-сторінки, книги, аудіозаписи, включаючи живі концерти, відео, зображення та програмне забезпечення. На 2021 штаб-квартира Архіву Інтернету знаходиться в Сан-Франциско , в будівлі колишньої християнської церкви, розташованої в районі Річмонд . Журналіст місцевої радіостанції Kawl [en] у 2019 році порівнював офіс Архіву з римським храмом [6][7] [8] . Організація ставить собі за мету врятувати інтернет від зникнення[9] .

Wayback Machine став найвідомішим проектом Архіву. Онлайн-сервіс був названий на честь машини часу з мультсеріалу 1960-х років « Шоу Роккі та Булвінкля ». Він надає доступ до цифрової колекції з приблизно 562 млрд веб-сторінок [4] [10] [11] . Проект Wayback Machine був задуманий як розв'язання проблеми помилки 404 , що означає, що сервер не може знайти дані за адресою. Це з так званим вимиранням посилань — наростаючою недоступністю колись опублікованих даних. Так, 1997 року середня тривалість життя веб-сторінки становила 44 дні. У 2003 році цей показник становив 100 днів. Проведений у 2008 році аналіз посилань на 2700 цифрових ресурсів, більшість з яких не мають друкованих аналогів, показав, що близько 8% посилань переставали працювати через рік. До 2011 року, через три роки, 30 відсотків посилань у колекції були мертві [12] . Завдяки інтеграції з Alexa, користувач, що зіткнувся з повідомленням про помилку, міг отримати доступ до заархівованої версії сторінки через впроваджену в браузер панель інструментів. Якщо копія недоступної сторінки була у базі даних Wayback Machine, то спалахувала спеціальна кнопка. При цьому користувачі могли надати браузеру дозвіл на перегляд та реєстрацію активності - у такому випадку всі відвідувані сайти архівувалися на порталі [13] .

Wayback Machine був запущений у травні 1996 року, проте став доступним для громадськості лише в 2001-му — до цього вся записана на цифрових магнітних стрічках інформація була відкрита лише для обмеженої кількості вчених та дослідників [14] . На момент «відкриття» архів містив понад 10 млрд заархівованих сторінок [4] . До грудня 2014 року керівництво Wayback Machine повідомило, що зберегло 435 млрд веб-сторінок по всьому світу[2] . З технічного погляду програмне забезпечення Wayback Machine не є архівом, а скоріше загальнодоступним інтерфейсом до обмеженого підмножини всіх сховищ [15] . Так, Wayback Machine не можна вважати пошуковою системою колекції організації, оскільки вона не здійснює пошук за базою даних іншої великої віртуальної бібліотеки — Open Library , що дозволяє користувачам безкоштовно отримувати доступ до цифрових копій книг, які завантажуються та архівуються в рамках проекту [16] [17] ] .

Характеристика

З запуском Wayback Machine «Архів Інтернету» став одним з найпопулярніших і найвідоміших онлайн-порталів і головним сервісом веб-архівування [4][9] . У 1999 році Архів почав розширювати колекцію за межі архівного веб-контенту, щоб забезпечити статус як до оцифрованих так і цифрових ресурсів, у тому числі книг, аудіо, фільмів, зображень, документів, програмного забезпечення і відеоігор[7] . Деякі сканування виконуються пошуковими роботами самого архіву, інші — партнерськими організаціями. Окремі бази даних можуть купуватися за рахунок пожертв користувачів та цільових придбань [17] . Самі автори організації порівнювали свою колекцію з Олександрійською бібліотекою[7] . На 2021 рік Wayback Machine містив понад 424 млрд веб-сторінок [15] — більше, ніж документів у Бібліотеці Конгресу [18][7] [17] .

Принцип роботи

Платформа Wayback Machine функціонує за рахунок двох основних елементів - пошукових роботів (або веб-краулерів ) та інтерфейсу. Веб-краулери займаються відвідуванням, вилученням, завантаженням та архівацією веб-сторінок. У свою чергу через інтерфейс користувачі отримують доступ до онлайн-колекцій[3] .

Пошукові роботи

Зростання колекції Wayback Machine [19]
Колекція Wayback Machine за роками Архівовані сторінки (у мільярдах)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452
2020
514
2021
581

Спочатку колекція архіву поповнювалася рахунок браузерного плагіна від Alexa Internet, який автоматично фіксував і зберігав кожну веб-сторінку в міру її відвідування, потім передаючи всю зібрану інформацію в «Архів Інтернету». Користувачі також могли встановити безкоштовну панель інструментів, що дозволяла перевіряти статус архівування вибраного веб-сайту [17] .

2002 року Архів запустив власний пошуковий роботHeritrix [en] з відкритим вихідним кодом. Коди краулерів записані за допомогою комбінації програмних мов Cі та Perl . Крім цього, Архів Інтернету також приймає дані сканування від інших донорів[7] . Відскановані копії веб-сайтів автоматично конвертуються у файли розміром близько 100 МБ, які потім зберігаються на серверах. Загальна швидкість поповнення архіву становить близько 10 терабайт на місяць [20] .

Веб-краулери відображають версію сайту такою, якою вона була збережена на момент доступу до неї через URL-адресу. Роботи регулярно сканують велику кількість веб-сторінок, рекурсивно завантажуючи, аналізуючи та відображаючи HTML , JavaScript та CSS сторінки[3] . Механізм роботи краулерів схожий на роботу пошукових систем - роботи самостійно шукають портали для архівування через систему пошуку шляхів, скануючи сторінки та пов'язані з ними сайти, таким чином формуючи мережу порталів. На момент створення Архіву всесвітня мережа була настільки маленькою, що веб-краулери могли здійснити обхід всіх сайтів за один сеанс. Однак згодом постійне зростання онлайн-порталів та їх мінливість зробили повний обхід усієї мережі практично неможливим. Таким чином, не всі зміни на сайтах зафіксовані у Wayback Machine[9] . Керівництво Архіву не уточнює те, як роботи знаходять та обирають сторінки для сканування, проте заявляє, що найчастіше краулери прямують на ті сайти, які мають перехресні посилання з інших порталів та знаходяться у відкритому доступі. Сканер починає з веб-сторінки, а потім слідує за кожним гіперпосиланням на цій веб-сторінці, щоб перейти на нові сайти. На кожній із нових веб-сторінок пошуковий робот повторює процес [15] . Він продовжуватиметься до того моменту, поки архівація не буде зупинена або не досягне встановленого скриптом ліміту [21] . Крім цього, кожен користувач може використовувати спеціальну форму на порталі та викликати краулер, який збереже сторінку у поточному стані[3] . Wayback Machine сканує лише загальнодоступні веб-сторінки і не може отримати доступ до контенту, захищеного паролем або розташованого на приватному сервері [11] [15] [4] .

Інтерфейс

Інтерфейс Wayback Machine дозволяє користувачам здійснити дві основні дії – отримати доступ до історії змін сайту та переглянути всі зроблені на порталах редагування. Також доступна функція порівняння різних версій сайтів [13] [22] [18] [23] . Для цього в спеціальне вікно пошуку вводиться URL порталу, що цікавить, після чого Wayback Machine видає список дат архівації. Зірочка після деяких дат використовується для позначення виявлених на сторінці змін. URL-адреса заархівованої сторінки починається з web.archive.org [24] [15] .

Будь-який користувач може зберегти URL-адресу для архівування, а з безкоштовним обліковим записом в архіві можна створити та заархівувати будь-які вихідні або зовнішні посилання на вихідній сторінці та отримати оглядовий звіт [25] [25] .

Зберігання

На 2018 рік колекція Архіву Інтернету складала понад 40 петабайт або 40 млн гігабайт даних, Wayback Machine надавав доступ до приблизно 63% всіх наявних матеріалів [26] . На лютий 2020 року в архіві Wayback Machine вважалося понад 900 млрд URL-адрес і понад 400 млрд веб-сторінок [27] . На червень 2021 року Wayback Machine надавав доступ до більш ніж 581 млрд. збережених веб-сторінок [5] .

Використання

Портал Wayback Machine найчастіше застосовують у правовій сфері — юристи використовують сервіс для пошуку інформації з цивільних позовів, кримінальних справ, адміністративного діловодства та патентних процесів. Отримані через Wayback Machine архівні версії сайтів можуть використовуватися для вирішення питань про патентне право або встановлення покарання за публікацію матеріалів, які були видалені з мережі[3] [13] . Незважаючи на широке використання колекції Архіву Інтернету для надання доказів, деякі суди США відмовлялися приймати скріншоти веб-сторінок, посилаючись на юридичну складність ототожнення оригіналу документа та його заархівованої версії [28] . У 2018 році апеляційний суд США ухвалив, що скрини з архіву веб-сторінок Wayback Machine належать до законних доказів, які можуть бути використані в судових розглядах [29] [30] .

Завдяки архівованим у Wayback Machine статтям автори можуть встановлювати право на відкриття або публікацію [31] . Для соціологів та істориків Wayback Machine пропонує цінне великомасштабне джерело даних для аналізу поведінки компаній, стратегій продажів, соціальних практик[2] [32] . Також Wayback Machine дозволяє отримувати доступ до журналів відкритого доступу . Так, з початку 2000-х років з інтернету зникло 84 журнали ОД з природничих наук і ще близько 100 - з соціальних і гуманітарних [33] [34] [35] .

Активісти та дослідники використовують портал для боротьби з дезінформацією , що особливо посилилася після обрання президента Дональда Трампа в США . У відповідь на суперечливі заяви з боку адміністрації президента , що почастішали, Архів створив окрему колекцію під назвою «Архів Трампа», що містить виступи президента на телебаченні і твіти . Архів сподівається, що його сховище допоможе іншим виявляти неправдиву інформацію та перевіряти підозрілий контент [36] [37] . Однак у деяких випадках окремі активісти стверджували, що заархівовані Wayback Machine ресурси, навпаки, сприяли поширенню дезінформації. Так, з початком пандемії коронавірусу , прихильники конспіративних теорій використовували збережені порталом скріншоти для поширення хибної інформації про коронавірус [38] . Як контрзаходи у листопаді 2020 року Архів впровадив у Wayback Machine інструменти перевірки інформації на достовірність. Для цього некомерційна організація почала співпрацювати з різними компаніями, які перевіряють факти, щоб надавати користувачам причини видалення тієї чи іншої сторінки з колекції. При відкритті заархівованої версії сайту Wayback Machine надає користувачам відомості про причину видалення у вигляді жовтого банера вгорі екрана. При підозрі на причетність веб-сторінки до кампанії з дезінформації Wayback Machine надає дані про організацію, яка проводила перевірку на достовірність, та посилання на її звіт [39] .

В окремих випадках отримана через Wayback Machine інформація фігурувала у великих скандалах. Так, за допомогою порталу було з'ясовано, що офіційний представник Міністерства охорони здоров'я та соціальних служб США Майкл Капуто [en] у серії вже віддалених твітів публікував расистські та принизливі коментарі про китайський народ [40] . Крім цього, Wayback Machine зберігає копію пізніше віддаленого повідомлення про те, що лідер українських сепаратистів Ігор Стрєлков взяв відповідальність за катастрофу Boeing 777 у Донецькій області [41] [42] . У травні 2021 року видання Bellingcat з'ясувало, що американські військові, що знаходяться в Європі, використовували для зберігання засекречених даних дитячі мобільні додатки для запам'ятовування інформації. Через неправильно встановлені налаштування приватності інші користувачі отримали доступ до секретної інформації. Після виявлення витоку інформації військові видалили всі картки, але вони залишилися у сервісі Wayback Machine [43] .

Правовий статус

«Архів Інтернету» не вимагає дозволу на копіювання веб-сайтів перед віддаленим збором даних, однак видаляє або обмежує доступ до архівних матеріалів на запит. Наприклад, власникам веб-сайтів надається можливість «відмовитися» від архівування через стандартний файл robots.txt , який виключає веб-сайти зі списку порталів для веб-краулерів[9] [44] . Проте через збереження інших даних «Архів Інтернету» перебуває у вразливому юридичному становищі [45] . Так, у 2005 році Wayback Machine виявився втягнутим у суперечку про товарні знаки між компаніями Healthcare Advocates та Health Advocate. Остання використовувала Wayback Machine для доступу до веб-сторінок Healthcare Advocates, датованого 1999 роком, у спробі знайти інформацію, яка б підтримала справу. У відповідь Healthcare Advocates подала до суду як на Health Advocatt, так і на Архів, стверджуючи, що архів порушив Закон про авторське право у цифрову епоху . Згодом справа була врегульована в досудовому порядку [46] .

2002 року Архів видалив зі своєї системи посилання на архівні копії порталу Xenu.net, що належить критику церкви Андреасу Хельдал-Лунду. Вилучення відбулося на вимогу юристів Церкви Саєнтології , які заявили, що володіють правом власності на витяги з документів Церкви, опубліковані на сайті [47] [48] .

Обмеження

Дослідники та активісти критикують Wayback Machine та діяльність Архіву Інтернету за спробу зберегти всі онлайн-матеріали, багато з яких не мають належної цінності. На думку окремих дослідників, це пов'язано із застарілою політикою Архіву Інтернету, який був заснований наприкінці 1990-х років — тоді, на зорі створення інтернет-архівів, вважалося, що дані інтернету мають зберігатися у повному обсязі. Однак зі створенням безлічі одноденних сайтів багато дослідників та активістів змінили свою думку [49] . Інші критичні зауваження стосуються технічних обмежень сервісу — Wayback Machine не дозволяє зберігати та обробляти певні елементи JavaScript, а також може створювати заархівовані сторінки, які містять непрацюючі посилання, відсутню графіку або є неповними з інших причин [50] . Сканери захоплюють лише статистичний знімок сайту — функції порталів на основі Java або Flash не працюватимуть. Це означає, що більшість функціональних можливостей вихідної веб-сторінки втрачається[9] .

Блокування

У 2015 році Роскомнагляд ухвалив рішення заблокувати Wayback Machine за копію сторінки тексту «Одинковий джихад у Росії», що містить інформацію про «теорію та практику партизанського опору». Відповідну сторінку в Архіві Інтернету було додано до офіційного реєстру заборонених веб-сайтів у Росії 23 червня 2015 року, через що деякі російські інтернет-провайдери були змушені повністю заблокувати сайт Архіву Інтернету [51] [52] [53] . У 2019 році представники Асоціації захисту авторських прав в інтернеті (АЗАПІ) подали серію позовів проти сервісу Wayback Machine за порушення авторських прав. Представители АЗАПИ запросили Мосгорсуд вынести решение о вечной блокировке портала на территории России, однако на август 2020 года Архив Интернета по-прежнему продолжал свою работу [54] [55] [56] [57] .

В 2017 году портал был заблокирован в Индии и Киргизии за содержание «экстремистских материалов» [58] [59] [60] . По данным на 2021 год сайт заблокирован в Китае [61] .

Примітки

  1. https://www.alexa.com/siteinfo/archive.org
  2. 1 2 3 Arora, 2015 .
  3. 1 2 3 4 5 Lerner, 2017 , с. 1741—1755.
  4. 1 2 3 4 5 Michael Bryant. What is the Wayback Machine and Why is it Useful? . Groovy Post (22 апреля 2021). Дата звернення: 29 травня 2021 року.
  5. 1 2 Wayback Machine . Wayback Machine. Дата звернення: 7 червня 2021 року.
  6. Dominic Cummings: how the internet knows when you've updated your blog . The Conversation (28 мая 2020). Дата звернення: 3 червня 2021 року.
  7. 1 2 3 4 5 Odgen, 2017 .
  8. In An Old Church, The Internet Archive Stores Our Digital History . Kalw. San Francisco local public radio (11 сентября 2019). Дата звернення: 3 червня 2021 року.
  9. 1 2 3 4 5 Price, 2011 .
  10. Jack Schofield. The Time Machine . The Guardian (19 ноября 2007). Дата звернення: 1 червня 2021 року.
  11. 1 2 Jenni McKinnon. Using the Wayback Machine to Archive (and Backup) WordPress . WPMudev (25 мая 2017). Дата звернення: 29 травня 2021 року.
  12. Adrienne LaFrance. Raiders of the Lost Web . The Atlantic (14 октября 2015). Дата звернення: 7 червня 2021 року.
  13. 1 2 3 Rogers, 2017 , с. 160—172.
  14. Hartelius, 2020 , с. 378.
  15. 1 2 3 4 5 Bowyer, 2021 , с. 43—57.
  16. Aja Romano. A lawsuit is threatening the Internet Archive — but it's not as dire as you may have heard . Vox (23 января 2020). Дата звернення: 29 травня 2021 року.
  17. 1 2 3 4 Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web . Forbes (18 января 2016). Дата обращения: 5 июня 2021.
  18. 1 2 O'Connor, 2008 , с. 64.
  19. michelle. Wayback Machine Hits 400,000,000,000! . Internet Archive (May 9, 2014). Дата обращения: 25 марта 2015. Архивировано 26 августа 2014 года.
  20. Richard Koman. How the Wayback Machine Works . Xml.com (21 января 2002). Дата обращения: 5 июня 2021.
  21. A. Rossi. Worldwide Web Crawls . Internet Archive (5 октября 2010). Дата обращения: 5 июня 2021.
  22. Laura Bohannon. Wayback Machine archives websites for over 20 years . Spartan News Room (7 декабря 2017). Дата обращения: 5 июня 2021.
  23. Maemura, 2018 .
  24. Notess, 2002 .
  25. 1 2 Mark Graham. Tips for Using the Internet Archive's Wayback Machine in Your Next Investigation . Global Investigative Journalism Network (5 мая 2021). Дата звернення: 29 травня 2021 року.
  26. Zachary Crockett. Inside Wayback Machine, the internet's time capsule . The Hustle (28 сентября 2018). Дата звернення: 29 травня 2021 року.
  27. Евгений Делюкин. Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц . VcRu (26 февраля 2020). Дата звернення: 1 червня 2021 року.
  28. Eltgroth, 2009 .
  29. Kieren McCarthy. Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule . The Register (4 сентября 2018). Дата звернення: 4 червня 2021 року.
  30. Маргарита Сазонова. Электронные доказательства в спорах в сфере интеллектуальной собственности . Гарант (26 октября 2020). Дата обращения: 5 июня 2021.
  31. Pearce, 2009 , с. 875.
  32. Milligan, 2016 .
  33. Jeffrey Brainard. Dozens of scientific journals have vanished from the internet, and no one preserved them . Science (8 сентября 2020). Дата звернення: 1 червня 2021 року.
  34. Diana Kwon. More than 100 scientific journals have disappeared from the Internet . Nature (10 сентября 2020). Дата звернення: 1 червня 2021 року.
  35. avouner. Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил . Хабр (10 сентября 2020). Дата обращения: 5 июня 2021.
  36. Camilla Hodgson. How the Internet Archive is waging war on misinformation . Financial Times (17 сентября 2019). Дата звернення: 3 червня 2021 року.
  37. Mary Kay Magistad. Where to find what's disappeared online, and a whole lot more: the Internet Archive . The World (23 февраля 2017). Дата звернення: 7 червня 2021 року.
  38. Acker, 2020 .
  39. Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц . Trash Box (2 ноября 2020). Дата обращения: 5 июня 2021.
  40. Журналисты припомнили расистские высказывания пресс-секретаря Минздрава США . Красная весна (24 апреля 2020). Дата обращения: 5 июня 2021.
  41. Did the Wayback Machine Catch Russian-Backed Rebels Claiming Responsibility for Malaysian Airlines Flight MH17? . Open Culture (19 июля 2014). Дата звернення: 3 червня 2021 року.
  42. Jil Lepore. The Cobweb . New Yorker (19 января 2015). Дата звернення: 7 червня 2021 року.
  43. Дамир Камалетдинов. В сеть попали секретные данные об американском ядерном оружии — военные записывали их в школьных приложениях . T Journal (30 мая 2021). Дата обращения: 5 июня 2021.
  44. Carolyn Wimbly Martin. Internet Archive's Open Library and Copyright Law . Lutzker (15 мая 2020). Дата звернення: 4 червня 2021 року.
  45. Nate Anderson. Copy some webpages, owe more than the national debt . Ars Technica (1 мая 2011). Дата обращения: 5 июня 2021.
  46. Eric Bangeman. Internet Archive settles suit over Wayback Machine . Ars Technica (31 августа 2006). Дата звернення: 7 червня 2021 року.
  47. Lisa M. Bowman. Net archive silences Scientology critic . C Net (24 сентября 2002). Дата звернення: 10 червня 2021 року.
  48. Ernest Miller. Features: Sherman, Set the Wayback Machine for Scientology . LawMeme (24 сентября 2002). Дата звернення: 10 червня 2021 року.
  49. Nora Caplan-Bricker. Preservation Acts . Harper's Magazine (декабрь 2018). Дата звернення: 2 червня 2021 року.
  50. Crudo, 2014 .
  51. Mike Masnick. Russia Blocks The Internet Archive's Wayback Machine Over A Single Page . Tech dirt (26 июня 2015). Дата звернення: 3 червня 2021 року.
  52. Роскомнадзор заблокировал архив интернета из-за "Одиночного джихада" . Московский комсомолец (25 июня 2015). Дата обращения: 5 июня 2021.
  53. Роскомнадзор заблокировал страницу «архива интернета» за экстремизм . Lenta (25 июня 2015). Дата обращения: 5 июня 2021.
  54. АЗАПИ хочет навечно заблокировать «Архив интернета» . Роскомсвобода (22 августа 2019). Дата обращения: 5 июня 2021.
  55. «Архив интернета» могут навечно заблокировать в России . C News (23 августа 2019). Дата звернення: 7 червня 2021 року.
  56. Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru . C News (19 августа 2020). Дата звернення: 7 червня 2021 року.
  57. Американские издатели книг подали в суд на Internet Archive . Ведомости (2 июня 2020). Дата обращения: 5 июня 2021.
  58. Access to Internet Archive's Wayback Machine Blocked in India . The Wire (8 августа 2017). Дата звернення: 3 червня 2021 року.
  59. Wayback Machine has been blocked in India . The Verge (9 августа 2017). Дата обращения: 5 июня 2021.
  60. Kyrgyzstan Blocks Archive.org on 'Extremism' Grounds . Global Voices. Дата обращения: 5 июня 2021.
  61. Anna Kramer. The internet is splitting apart. The Internet Archive wants to save it all forever . Protocol (10 марта 2021). Дата звернення: 9 червня 2021 року.

Література

  • Acker, A., & Chaiet, M. The weaponization of web archives: Data craft and COVID-19 publics. // Harvard Kennedy School (HKS) Misinformation Review. — 2020. — doi : 10.37016/mr-2020-41 .
  • Anat Ben-David, Adam Amram. The Internet Archive and the socio-technical construction of historical facts // Internet Histories. — 2018. — doi : 10.1080/24701475.2018.1455412 .
  • Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource. — 2015. — Т. 67 , вып. 8 . — С. 1904—1915 . — doi : 10.1002/asi.23503 .
  • Bowyer S. The Wayback Machine: notes on a re‑enchantment // Archival Science. — 2021. — Т. 21 . — С. 43—57 .
  • Deborah R. Eltgroth. Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence // Fordham L. Rev.. — 2009. — Т. 78 , вып. 181 .
  • Greg R. Notess. The Wayback Machine: The Web's Archive // Online. — 2002. — Т. 26 , вып. 2 .
  • Hartelius J. The anxious flâneur: Digital archiving and the Wayback Machine // Quarterly Journal of Speech. — 2020. — Т. 106 , вып. 4 . — С. 377—398 .
  • James L. Quarles III and Richard A. Crudo. [Way]Back to the Future: Using the Wayback Machine in Patent Litigation // Landslide. — 2014. — Т. 6 , вып. 3 .
  • Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present // Association for Computing Machinery. — 2017. — doi : 10.1145/3133956.3134042 .
  • Maemura E., Worby N., Milligan I., Becker C. If These Crawls Could Talk: Studying and Documenting Web Archives Provenance // Journal of the association for information science and technology. — 2018. — Т. 69 , вып. 10 . — С. 1223—1233 .
  • Milligan I. Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives // International Journal of Humanities and Arts Computing. - 2016.
  • Murphy J., Hashim N., O'Connor P. Take Me Back: Validating the Wayback Machine // Journal of Computer-Mediated Communication. - 2008. - Вип. 13 . — С. 60—75 .
  • Odgen J., Halford S., Carr L. Observing Web Archives // WebSci. — 2017. — С. 299—308 .
  • Pearce D., Charlton B. Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org) // Medical Hypothesis. — 2009. — С. 875 .
  • Price. Internet Archiving – The Wayback machine // MLA Commons. - 2011.
  • Phyllis Holman Weisbard. Oldies but Goodies: Archiving WebBased Information // Feminist Collections. — 2011. — Т. 32 , вып. 2 .
  • Rogers R. Doing Web history with the Internet Archive: screencast documentaries // Internet Histories. — 2017. — Т. 1 , вып. 1-2 . — С. 160—172 . — doi : 10.1080/24701475.2017.1307542 .