В Сибири создали алгоритм для перевода дореволюционных изданий
Все новости на карте
Новосибирские ученые создали систему, позволяющую переводить дореволюционные тексты в современную русскую орфографию
Старые книги сегодня непонятны для многих россиян. После реформы орфографии русского языка изменились многие правила. Разработанная учеными система автоматически приведет текст в привычный для читателя вид практически без участия человека.
— В старом правописании морфем можно выделить несколько групп слов, — сообщает официальное издание СО РАН «Наука в Сибири». — Исследователи сопоставили устаревшее и современное написание для каждой из групп и, выявив закономерности между ними, описали правила перевода, лежащие в основе программы.
После завершения первого этапа перевода программа переходит к этапу замены устаревших букв.
Алгоритм создан для работы с большими объемами текстов. Он может выполнять рутинную работу редакторов и дает ученым дополнительные инструменты для анализа текстов.
Исследователи рассчитывают, что проект будет востребован массовыми пользователями, например, библиотеками с большим объемом дореволюционных фондов.
Видео дня. «Она нас не сожрет?»: фитнес-тренер оскорбил клиенту