Специалисты из российской компании Smart Engines совместно с Федеральным исследовательским центром ИУ РАН создали искусственный интеллект (ИИ), который умеет читать старинные свитки и другие тексты, не разворачивая их. Благодаря этой разработке учёные надеются сохранить ценные манускрипты, а также артефакты, пострадавшие в результате старения.
Как пояснили разработчики в беседе с РИА Новости, новый ИИ способен извлекать содержимое хрупких манускриптов, печатных книг, а также берестяных и серебряных свитков, которые пострадали от пожаров или повышенной влажности. Дело в том, что если попытаться развернуть эти документы вручную, их можно повредить, а текст станет нечитаемым, не говоря уже о потере ценных исторических летописей.
Для того, чтобы создать такую нейросеть, российские специалисты обучили алгоритмы машинного зрения на основе рентгеновской томографии. Сперва старинный документ помещают в томограф, а затем ИИ сканирует и реконструирует текст, создавая цифровую копию. Для обучения нейросети учёные компании создали собственный корпус данных на основе свёрнутых документов, цифр и схем с различными графическими элементами.
Исследователи надеются, что ИИ поможет сохранить культурное наследие и в то же время позволит историкам изучить старые тексты. Более того, новая нейросеть отличается от зарубежных аналогов тем, что она работает полностью в автоматическом режиме, а документ можно восстановить нажатием одной кнопки. Учёные планируют представить результаты своей работы на международной научной конференции в августе этого года.