База содержит более 25 млн. оцифрованных статей и старинных документов.
Internet Archive (archive.org) запустил поисковый индекс «Исследователь Архива Интернета» ( Internet Archive Scholar ), который имеет базу из более 25 млн. научных статей и документов. Индекс содержит:
- общедоступный онлайн-контент, сохраненный в партнёрских коллекциях The Wayback Machine и Archive-It;
- оцифрованные печатные материалы, в том числе документы 18 века;
- общие материалы из коллекций archive.org и других партнеров.
Метаданные поступают из fatcat.wiki — открытого редактируемого каталога научных работ.
По словам создателей сервиса, они хотят предоставить исследователям доступ к полному массиву для анализа текстов и данных. Полученные наборы данных также могут быть опубликованы в открытом доступе для анализа, например, графика цитирования или N-граммы.
Информацию для авторов исследовательских работ можно найти здесь . Сюда входят инструкции по исправлению библиографических метаданных и обновлению опубликованных работ.
Источник securitylab