«Нейро-архивариус»: В Москве ИИ расшифровал более 4,5 млн записей архивов
С помощью нейросети удалось оцифровать самые востребованные документы последних двух столетий
Развитие нейросетей дали человечеству не только генеративные нейросети, но и возможность ускорить процесс оцифровки документов прошлого, это поможет сохранить историю государства и защитить её от переписывания
Фото: Marjan Blan
Искусственный интеллект успешно расшифровал более 9 миллионов страниц старых архивных документов, таких как метрические книги, исповедные ведомости и ревизские сказки. В рамках эксперимента по применению компьютерного зрения в архивном деле, московские нейросети проанализировали более 4,5 миллиона изображений с архивными записями. Об этом сообщила пресс-служба соцкомплекса правительства Москвы.
По словам заммэра Анастасии Раковой, для обучения искусственного интеллекта были использованы современное цифровое оборудование и оцифрованные архивные документы о семейной истории. В настоящее время в базе сервиса представлено более 4,5 миллиона изображений архивных документов, что соответствует около 9 миллионам страниц метрических книг, исповедных ведомостей и ревизских сказок.
С начала этого года в Москве была запущена совместная платформа «Поиск по архивам», разработанная Главархивом Москвы и компанией «Яндекс». С её помощью нейросети расшифровывают архивные записи, содержащие сложную орфографию, датирующиеся XVIII — началом XX веков. Сервис искусственного интеллекта способен в течение нескольких секунд находить фамилии, имена, названия населённых пунктов и другие ключевые слова в исторических документах. Это значительно облегчает и ускоряет поиск информации о своих предках и помогает составить генеалогическое древо.
За несколько месяцев работы сервиса пользователи смогли найти и изучить более 2,5 миллиона архивных записей с текстовыми расшифровками, что составляет более половины всех материалов на платформе. Важно отметить, что сервис чтения старых рукописей бесплатен и доступен на открытой платформе.
Интерес жителей Москвы и всей страны к изучению своей семейной истории привёл к тому, что к столичному эксперименту присоединились Московская, Оренбургская, Новгородская области и Республика Мордовия. Региональные архивы уже использовали нейросети, разработанные в Москве, для анализа около 1,7 миллиона электронных копий документов. Сервис позволяет искать информацию по материалам двух последних столетий, которые наиболее популярны среди пользователей. Его функционал включает поиск по каталогу или строке, а также фильтры по годам, фондам и описям. Кроме того, каждая страница снабжена построчной расшифровкой, выполненной нейросетями, что позволяет удобно изучать содержание документов.