Почему Google не смог создать всемирную цифровую библиотеку?
Ответ в новой книге Принстонского университета
В сентябре изд-во Принстонского университета выпустило небольшую книгу об одном важном несостоявшемся проекте — оцифровка Google’ом всех книг на Земле: «Along Came Google: A History of Library Digitization» (И пришёл Google). Оцифровка понемногу шла в разных библиотеках планеты, но была бессистемной. Весть об инициативе поисковика была встречена книжным миром неоднозначно. Привожу несколько цитат о довольно скором конце этого начинания. Но начну со спойлера: начинание Google в конечном итоге похоронил суд (и правительство) США, а не консолидированная атака библиотек, авторов и издателей.
«С новостями о планах Google по сообществу научных библиотек прокатилась ударная волна. Некоторые библиотекари, стремясь к ускорению оцифровки, позитивно восприняли идею универсальной цифровой библиотеки. Другие утверждали, что библиотекари были экспертами в поиске и проверке информационных ресурсов, и не одобряли того, что другие игроки пришли в их сферу.

В течение почти десяти лет Google и его партнеры настойчиво преследовали мечту о цифровой универсальной библиотеке. Когда 22 марта 2011 года окружной суд США по Южному округу Нью-Йорка отклонил юридическое соглашение, предложенное Google после предъявления иска издателями и авторами, утопическая библиотека превратилась в нечто большее, чем мечтательные устремления. Оглядываясь в 2017 году назад на провалившееся соглашение, журналист Atlantic Джеймс Сомерс размышлял о том, что было потеряно:

«Мы могли получить доступ в один клик к полному тексту почти каждой книги, которая когда-либо была опубликована. За книги, все еще находящиеся в печати, вам пришлось бы заплатить, но всё остальное — коллекция, которая должна была стать больше, чем фонды Библиотеки Конгресса, Гарварда, Мичиганского университета, любой из великих национальных библиотек Европы — было бы доступно бесплатно на терминалах, которые планировали разместить в каждой желающей местной библиотеке. Но эта стольжеланная цифровая библиотека не была реализована. Когда самый значительный гуманитарный проект нашего времени был демонтирован в суде, ученые, архивисты и библиотекари, которые приложили руку к его уничтожению, вздохнули с облегчением, поскольку в то время они считали, что они еле-елепредотвратили катастрофу».
Уведомление о проекте оцифровки в Библиотеке Мичиганского университета
«Google старался угодить как библиотекам, так и издателям, увязывая оцифрованный текст с физическими местами, где книги можно было приобрести у издателя или заказать в библиотеке. Библиотекарям понравилосьрешение Google добавить ссылку «Найти это в библиотеке» на странице «Поиск книг» у Google, хотя их и удручало то, что ссылка должна была применяться только к материалам, находящимся в общественномдостоянии. Становилось все более очевидным, что Google все еще думает о бизнес-модели поиска книг в Google (монетизации). С одной стороны, Google пытался угодить издателям; с другой стороны, он пытался удовлетворить библиотекарей. Библиотекари чувствовали бы себя наиболее комфортно, если бы Google принял их стандартные методы и процедуры; издателям было бы удобнее, если бы Google не делал ничего, что могло бы угрожать их продажам и доходам. Это была очень тонкая грань, по которой требовалось пройти, не упав.

Предполагалось, что отсканированные книги будут проиндексированы, но результаты поиска будут отображаться по-разному. Произведения, являющиеся общественным достоянием, будут доступны полностью постранично. Для тех книг, которые все еще находились в печати, Google пообещал сотрудничать с издателями, чтобы определить, какие части их книг будут доступны и при каких условиях. Для работ, для которых у него не было разрешения на показ и которые все еще могли быть защищены авторским правом, Google будет показывать только «фрагменты"(snippets). Владелец авторских прав может отказаться от участия в любое время после установления права собственности на авторское право (копирайт).

Google понимал, что не все издатели захотят, чтобы их контент был доступен в Интернете, и предоставил возможность «отказаться от участия», чтобы устранить сомнения издателей. Похоже, что перекладывание наиздателей бремя «отказа», вместо того чтобы вести долгие переговоры с издателями о том, какие названия будут включены, привело издателей в ярость. Гильдия авторов подала иск против Google в суд 20.09.2005 г. Пять издателей — McGraw-Hill, Pearson, Penguin, Simon and Schuster, а также John Wiley & Sons — подали в суд на Google в том же суде месяц спустя. В конечном счете эти два дела были объединены в одно».
Интересно, что стороны достигли соглашения и показали его судье:

«Предлагаемое урегулирование привело бы к тому, что Google единовременно выплатил $ 45 млнправообладателям отсканированных книг, $ 15,5 млн за судебные издержки издателям, $ 30 млн авторам и $ 34,5 млн на создание Реестра прав на книги — в общей сложности $ 125 млн.

Памела Самуэльсон, проф. юридической школы Калифорнийского университета, отметила, что „предлагаемое соглашение выглядело беспроигрышным: библиотеки получат доступ к миллионам книг, Google сможет окупить свои инвестиции в проект оцифровки книг, а авторы и издатели получат новый поток доходов от книг, которые приносили нулевую прибыль.“ Но в конце концов cуд отклонил это мировое соглашение: Министерство юстиции США выразило свою озабоченность по поводу мирового соглашения с точки зрения антимонопольного законодательства. Несмотря на то, что урегулирование было охарактеризовано как „не предоставляющееисключительного права“, Министерство указало, что крайне маловероятно, что какая-то другая компания попытается отсканировать так много книг, чтобы создать свою собственную базу данных и сервис поиска по ней. Поскольку Министерство рекомендовало не соглашаться на мировое соглашение, Суд отклонил его и вернул сторонам для пересмотра.

Вместо этого Google согласился на урегулирование, которое резко ограничило его права на использование материалов, защищенных авторским правом. Хотя он смог продолжить предлагать поиск по ним, он не смог предложить пользователям полный доступ к текстам.

Закон об авторском праве продолжает мешать усилиям по созданию национальной цифровой библиотеки. Массовая оцифровка мертва, потому что после эпизода с Google немногие некоммерческие организации готовы пойти на риск оцифровки материалов, опубликованных после 1923 года».
Как я понял, самым крупным собранием книг и других библиотечных материалов, оцифрованных Google и прочими, на сегодня является HathiTrust, которое по состоянию на конец 2020 года насчитывало почти 17,5 млн томов. Полнотекстовый просмотр доступен для 6,8 млн томов из общественного достояния.
Made on
Tilda