Место издания:Самар. нац. исслед. ун-т им. С. П. Королева Самара
Номер статьи:34682
Аннотация:Трудоёмкость методов получения векторных представлений слов постоянно возрастает, что связано как с увеличением объёма входных данных, так и с усложнением моделей. Разработка и обучение новой модели, которая бы учитывала дополнительную экспертную информацию о семантической близости между словами, сегодня оценивается в тысячи часов вычислительных экспериментов. В данном исследовании существующие представления корректируются путём их преобразования во вторичные представления с учетом экспертной информации о семантической близости. Предложена функция преобразования представлений и метод её обучения. Таким образом, вместо построения новой модели проводится коррекция существующей, что существенно снижает вычислительные затраты по сравнению с разработкой новой модели.