ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ЦЭМИ РАН |
||
Результаты работы: предложен метод восходящего синтаксического анализа на основе ранее построенной теории $L$-графов и способ его реализации с помощью объектно-ориентированного языка C++; кроме того, предложена реализация $L$-графов на языке C++, идея которой оказалась полезной и при решении других задачах с графовым подходом; выполнены обзор и сравнительный анализ инструментов верификации, исследованы возможности их применения для проверки корректности программ на языке Питон; в рамках проекта по развитию программного комплекса, предназначенного для построения прикладных систем по автоматической обработке текстов на русском языке, была протестирована и скорректирована новая версия транслятора лексико-синтаксических шаблонов; набор шаблонов был применен для экспериментального исследования метода построения глоссариев; предложены новые методы построения векторных представлений для текстовых вхождений многозначных слов, основанные на генерации лексических подстановок; созданы новые методы построения векторных представлений для текстовых вхождений многозначных слов, основанные на генерации лексических подстановок, позволившие улучшить качество кластеризации вхождений слов по значению для английского и русского языков, а также новые комбинированные методы выявления семантического фрейма для глаголов; дана постановка задачи реконструкции слов по мультимножеству подслов в гипотезе сдвига один при наличии запретов (под запретами понимается множество подслов, которые не могут появляться в реконструированном слове); рассмотрены частные случаи задачи реконструкции с запретами, допускающие простые решения; показано, что в ряде случаев задача реконструкции с запретами может быть сведена к уже решенной задаче реконструкции без запретов.