Нейросеть «Яндекса» научили читать дореволюционные архивные документы

Поделиться

Для этого пользователю нужно зайти в раздел «Поиск по архивам».

Орфографические правила в России до прихода власти большевиков имели некоторые отличия. Например, в употреблении была буква «i» и некоторые другие знаки, в том числе некоторые окончания и суффиксы. В дальнейшем реформы шли в сторону упрощений письма и ухода в прошлое ряда атавизмов.

Для этого нейросеть Яндекса «Поиск по архивам» изучила 2,5 млн страниц архивных документов, которые научилась расшифровывать в текст. В результате система «понимает» дореформенные особенности начертания букв и орфографии, тем самым ища необходимую информацию по каталогу или через строку поиска.

В каталог вошли сотни тысяч рукописных строк из реальных текстов XVIII -XIX веков и десятки миллионов сгенерированных примеров. Таким образом новый сервис поможет в работе историков, социологов, демографов, генеалогов, а также тем, кто хочет найти сведения о своей семье.

Вам будет интересно
В честь дня студента, который проходит сегодня, 25 января, ivbg.ru рассказывает, на что уходят ежемесячные траты студентов и на чем...
25.01.2023 181