Математическое и программное обеспечение перспективных систем обработки символьной информации с элементами искусственного интеллектаНИР

Mathematical methods and software for advanced symbolic information processing systems with artificial intelligence features

Соисполнители НИР

МГУ имени М.В.Ломоносова Координатор

Источник финансирования НИР

госбюджет, раздел 0110 (для тем по госзаданию)

Этапы НИР

# Сроки Название
1 1 января 2021 г.-31 декабря 2021 г. Математическое и программное обеспечение перспективных систем обработки символьной информации с элементами
Результаты этапа: В соответствии с планом исследований в 2021 году получены следующие основные результаты: 1. Предложены (а) алгоритм построения бесконтекстного L-графа с регулярным скобочным следом по заданной LR(1)-грамматике, (б) процедура детерминизации полученного L-графа и (в) алгоритм восходящего синтаксического анализа. 2. Реализованы/разработаны/исследованы (а) экспериментальное семантико-синтаксическое представление предложений русского языка, (б) новые методы распознавания слов-паронимов и устойчивых словосочетаний, (в) задача обнаружения семантических сдвигов, (+) протестированы на русскоязычных коллекциях данных стандартные нейронные архитектуры. 3. Получены (а) формулировка задачи восстановления символьных периодических последовательностей, искаженных шумами, (б)результаты экспериментального исследования зависимости характеристик качества метода восстановления и (в) новый метод восстановления эталонной последовательности. 4. Исследованы/доказаны/предложены (а) линейные разностные операторы, коэффициенты которых представляют собой бесконечные двусторонние последовательности над полем нулевой характеристики, (б) неразрешимость ряда задач, возникающих в связи с алгоритмическим представлением бесконечных последовательностей, (в) пакет символьного построения экспоненциально-логарифмических решений ряда линейных обыкновенных дифференциальных уравнений. 5. Разработаны база и словарь данных, унифицирующие работу с рядом систем, моделирующих процессы в установках токамак.
2 1 января 2022 г.-31 декабря 2022 г. Математическое и программное обеспечение перспективных систем обработки символьной информации с элементами
Результаты этапа: В соответствии с планом исследований в 2022 году получены следующие результаты: 1. В направлении "Исследование аппарата L-графов" предложены: (а) метод восходящего синтаксического анализа, (б) прикладная программа на языке С#, реализующая метод, (в) методы построения алгоритмов с помощью L-графов. 2. В направлении "Разработка методов глубинного обучения" (a) представлена нейронная модель флективного анализа русских словоформ, (б) выполнено статистическое исследование паронимов, (в) исследованы мнения пользователей сети ВКонтакте о рождении детей. 3. В направлении "Исследование формальных свойств задач комбинаторики слов" (а) исследована задача эффективной реализации случайной последовательной адсорбции, (б) выполнено статистическое исследование комбинированного алгоритма решения задачи коммивояжера для размерностей, не превышающих 55. 4. В направлении "Теоретическое обоснование алгоритмов символьных вычислений" (а) исследованы алгоритмы нахождения лорановых и регулярных решений линейных дифференциальных уравнений, (б) рассмотрена задача построения начальных членов формальных лорановых рядов. 5. В направлении "Разработка структур данных" (совместно с кафедрой АНИ) (а) реализованы основные компоненты среды SIEMNED: (б) выполнено сравнительное исследование расчетов и первой серии экспериментов на Токамаке МИФИСТ-0. По результатам научных исследований 2022 года выявлены ряд новых интеллектуальных задач символьной обработки.
3 1 января 2023 г.-31 декабря 2023 г. Математическое и программное обеспечение перспективных систем обработки символьной информации с элементами
Результаты этапа: В соответствии с планом исследований по разработке математического и программного обеспечения перспективных систем обработки символьной информации (с элементами искусственного интеллекта) в 2023 году получены следующие основные результаты: 1. В направлении «Исследование аппарата L-графов для задания формальных языков и описания способов их обработки в анализаторах, трансляторах и других языковых процессорах» предложены : (а) алгоритм преобразования беcконтекстного выражения в эквивалентный L-граф; (б) алгоритм , преобразующий бесконтекстный L-граф в эквивалентную бесконтекстную грамматику, алгоритм реализован в виде программы на языке С++; (в) разработаны способы построения последовательной, условной и циклической композиции L-преобразователей, через которые можно выразить любой алгоритм 2. В направлении "Теоретическое обоснование алгоритмов решения конкретных задач символьных вычислений" доказано, что наличие ненулевых левых и правых общих кратных для произвольных ненулевых элементов R (условие Оре) является необходимым и достаточным условием равенства рангов по строкам и столбцам произвольной матрицы над R. Рассмотрены системы линейных обыкновенных дифференциальных уравнений с бесконечными формальными степенными рядами в роли коэффициентов. Для случая, когда определитель ведущей матрицы индуцированной системы отличен от нуля и не содержит литералов, предлагается алгоритм построения лорановых решений системы 3. В направлении извлечения информации из текстов: 3.1 Разработана онтология, которая содержит актуальные термины области информационной безопасности, объединяя знания о различных подобластях и разделах предметной области. Онтология включает 554 класса, 8 экземпляров, 93 отношения синонимии и 9 других типов отношений. 3.2 Рассмотрены различные подходы к распознаванию сгенерированных текстов. Основным способом автоматического порождения текстов являются нейронные сети, демонстрирующие возможности приемлемого освоения естественного языка В рамках нейросетевого подхода была дообучена нейросетевая модель RoBERTa. 3.3 Исследованы методы извлечения отношений между вложенными именованными сущностями, т.е. сущностями, которые содержатся в других именованных сущностях, 3.4. Исследованы методы задания вопросов (prompt) к модели Машинного понимания текстов (Machine Reading Comprehension, MRC) для извлечения именованных сущностей из текстов. 4. Признаки сложности текста, относящиеся к дискурсивному уровню, наименее исследованы, хотя чем более связный текст, тем проще он для понимания. Моделирование связности опирается на построение графов сущностей и графов дискурсивных отношений (связывающих предложения, в которых упоминаются эти сущности, и фиксирующих вид связи). Также для оценки связности используются предобученные нейросетевые языковые модели, позволяющие учесть контекст употребления сущностей 5. В направлении создания программного обеспечения для автоматизации историко-архивных исследований и в рамках проекта электронного архива по истории Московского университета разработаны А) база данных математиков Московского университета XIX-´XX вв, Б) программа для визуализации коллекции автографов из книг библиотеки Московского общества испытателей природы, В) новые годичные базы данных по дореволюционным студентам Московского университета (1889-1890, 1891-1892, 1894-1895). В 2023 году было сделано 28 публикаций. Из них 6 статей в журналах, индексируемых в базе SCOPUS, одна публикация в журнале, индексируемом в базе РИНЦ. Защищена одна кандидатская диссертация. Наиболее значимые публикации: Loukachevitch N. et al. NEREL: a Russian information extraction dataset with rich annotation for nested entities, relations, and wikidata entity links //Language Resources and Evaluation. – 2023. – С. 1-37. Tikhomirov M. M., Loukachevitch N. V. Generation of Interpreted Vector Representations of Words Based on Supersenses //Pattern Recognition and Image Analysis. – 2023. – Т. 33. – №. 3. – С. 517-524. Rozhkov I. S., Loukachevitch N. V. Prompts in Few-Shot Named Entity Recognition //Pattern Recognition and Image Analysis. – 2023. – Т. 33. – №. 2. – С. 122-131. Волкова И. А., Шамаева Е. Д. ЭКСКУРС В ГРАФЫ ЗНАНИЙ //International Journal of Open Information Technologies. – 2023. – Т. 11. – №. 3. – С. 75-83. Golubev A. et al. RuSentNE-2023: Evaluating Entity-Oriented Sentiment Analysis on Russian News Texts //Proceedings of the International Conference “Dialogue. – 2023. – Т. 2023.
4 1 января 2024 г.-31 декабря 2024 г. Математическое и программное обеспечение перспективных систем обработки символьной информации с элементами
Результаты этапа:
5 1 января 2025 г.-31 декабря 2025 г. Математическое и программное обеспечение перспективных систем обработки символьной информации с элементами
Результаты этапа:

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".

Прикрепленные файлы


Имя Описание Имя файла Размер Добавлен