Когда машина читает прошлое: как ИИ помогает разгадать рукописные тексты
В Новосибирском государственном университете запустили необычный проект, где технологии встречаются с историей на уровне чернильных пятен и крестьянских подписей начала XX века. Магистрант Степан Гудков создал программу, способную «читать» рукописные решения волостных судов — документы, которые деся

В Новосибирском государственном университете запустили необычный проект, где технологии встречаются с историей на уровне чернильных пятен и крестьянских подписей начала XX века. Магистрант Степан Гудков создал программу, способную «читать» рукописные решения волостных судов — документы, которые десятилетиями лежали в архивах, ожидая, пока кто-то расшифрует их почерк, написанный то ли торопливо, то ли с особой важностью. Эти бумаги — не просто юридические формулировки.
В них — история повседневности: споры о заборе, ссоры из-за коровы, обиды между соседями, редкие примирения. Каждое решение — фрагмент жизни сибирской деревни накануне великих потрясений. Но чтобы донести эти истории до современников, их нужно перевести из сканированных страниц в читаемый текст. А вручную это занимает годы: сотни решений требуют трёх лет упорного труда даже у опытной команды.
Теперь на помощь приходят алгоритмы. Система сначала «понимает» структуру страницы — находит строки, отделяет заголовки от основного текста, учитывает, что столбцы могут быть разной ширины или вовсе отсутствовать. Затем нейросети преобразуют рукописные знаки в цифровой текст, несмотря на капризы дореволюционной орфографии и бесконечное разнообразие почерков — от чёткого канцелярского до дрожащего стариковского.
Но ИИ не заменяет исследователя — он создаёт для него инструмент. В планах — интерфейс, через который историки смогут править распознанный текст, уточнять значения, отмечать особенности. Со временем вся эта работа превратится в единый цифровой корпус, где можно будет искать упоминания определённых фамилий, сёл, судебных практик или даже социальных конфликтов.
А главное — методика окажется применимой далеко за пределами волостных книг. Любой дореволюционный архив, написанный от руки, теперь имеет шанс обрести новую жизнь.
