Комплексирование методов при нейросетевом решении обратных задач высокой размерностиНИР

Integration of methods in the neural network solution of inverse problems of high dimension

Источник финансирования НИР

грант РНФ

Этапы НИР

# Сроки Название
1 23 апреля 2019 г.-31 декабря 2019 г. Комплексирование методов при нейросетевом решении обратных задач высокой размерности, этап 2019 г.
Результаты этапа: В отчётном году были заложены основы выполнения Проекта, получены первые массивы исходных данных, референсные результаты решения рассматриваемых задач и первые результаты по комплексированию физических методов. Как и было запланировано, рассмотрение велось для двух классов обратных задач (ОЗ): I. ОЗ разведочной геофизики (РГ) – сильно нелинейные многопараметрические ОЗ, обладающие весьма высокой размерностью как по входу (тысячи входных признаков – наблюдаемых величин), так и по выходу (сотни определяемых параметров). Эти задачи также характеризуются возможностью численного расчёта прямой задачи и наличием нескольких дополняющих друг друга методов разведки для осуществления физического комплексирования. II. ОЗ оптической спектроскопии (ОС) по идентификации и определению концентраций компонентов в многокомпонентных смесях – сложные комплексные ОЗ с высокой входной размерностью (сотни и первые тысячи) и выходной размерностью до десяти определяемых компонентов (параметров). Характеризуются сильно нелинейным взаимодействием компонентов, а также возможностью постановки активного физического эксперимента для получения массивов данных с известными желаемыми ответами и наличием нескольких дополняющих друг друга спектроскопических методов для осуществления физического комплексирования. В Проекте рассматриваются три вида комплексирования методов: алгоритмическое комплексирование (совместное применение нескольких алгоритмов для решения рассматриваемой ОЗ), комплексирование данных (совместное использование разбиения данных на наборы, аугментация данных) и физическое комплексирование (совместное применение нескольких физических методов для исследования одного и того же объекта, с совпадающими искомыми параметрами возникающих ОЗ и со сходными или идентичными методами их решения). Наименее исследованным и наиболее интересным является физическое комплексирование, которому в рамках данного Проекта будет уделено наибольшее внимание; при этом общей целью является разработка методологии совместного использования всех видов комплексирования методов. В области РГ в качестве первой задачи была выбрана структурная нелинейная двухмерная ОЗ, которая состоит в определении структурных границ, разделяющих геологические слои с постоянными значениями параметра: • Плотности в задаче гравиметрии (гравиразведки, ГР), • Намагниченности в магнитометрии (магниторазведки, МР), • Удельного сопротивления в электроразведке (ЭР). Путём решения прямой задачи (ПЗ) были получены базы данных, содержащие по 30 000 примеров, для каждой из трёх физических задач (ГР, МР, ЭР). В области ОС в качестве первой задачи была выбрана задача определения концентраций ионов в многокомпонентном растворе солей тяжёлых металлов CuSO4, NiSO4, CoSO4, Cu(NO3)2, Ni(NO3)2, Co(NO3)2. Концентрации определялись по спектрам поглощения (СП) растворов и по их спектрам комбинационного рассеяния (КР). Оба вида спектров существенно зависят от наличия в растворе тех или иных ионов и от их концентраций, причём зависимость является нелинейной. При этом спектральные полосы поглощения отдельных ионов перекрываются, а в спектрах КР простые ионы вообще не имеют собственных полос, и могут лишь влиять на форму полос КР воды. Всё это делает решаемую задачу достаточно сложной, а расчёт ПЗ на данном этапе развития науки – невозможным. Поэтому массив данных для решения выбранной задачи был получен путём физического эксперимента. Исследовались водные растворы солей тяжёлых металлов CuSO4, NiSO4, CoSO4, Cu(NO3)2, Ni(NO3)2, Co(NO3)2. Концентрации ионов Cu2+, Ni2+, Co2+, NO3-, SO42- варьировались в диапазоне от 0 до 0,14 М (Моль/литр) с шагом 0,01 М, концентрации солей-сульфатов от 0 до 0,14 М, концентрации нитратов от 0 до 0,07 М. Всего было приготовлено 3806 растворов, количество ионов в растворе варьировалось от 2 до 5, количество солей от 1 до 6. Свойства всех задач были исследованы путём статистического анализа данных в массивах. В качестве базовых алгоритмов решения ОЗ были выбраны следующие алгоритмы машинного обучения, реализованы их обучение и применение: А) Нейронные сети (НС) типа многослойный персептрон (МСП). Б) Линейная регрессия (ЛР) в линейном базисе с предварительным шкалированием данных. В) Метод проекций на латентные структуры (ПЛС). Г) Алгоритм случайного леса (СЛ). Д) Градиентный бустинг (ГБ). Для рассматриваемых ОЗ РГ линейные методы СЛ и ПЛС справляются с задачами только для первого (верхнего) слоя, метод линейной регрессии – для 1 и 2 слоёв. С увеличением номера (глубины залегания) слоя более явственно проявляется преимущество МСП с тремя скрытыми слоями, способного строить достаточно сложные нелинейные зависимости. Среди физических методов наилучшие результаты показал метод электроразведки, наихудшие – метод магниторазведки. Тем не менее, результаты всех трёх физических методов сравнимы, что создаёт предпосылки для использования физического комплексирования. Для ОЗ ОС метод градиентного бустинга в целом показывает результаты, близкие к результатам НС, хотя и несколько хуже; показатели для ЛР в основном также сравнимы с ними; ПЛС даёт более высокий уровень ошибки. Спектроскопия КР демонстрирует существенно более высокие уровни ошибок, чем спектроскопия поглощения. При этом представляет интерес проверка работоспособности физического комплексирования методов с разным уровнем ошибки. Следует также отметить, что спектроскопия поглощения лучше определяет концентрации простых ионов, спектроскопия КР – сложных. Это связано с тем, что именно простые ионы дают окраску раствора и имеют существенно отличающиеся друг от друга полосы поглощения. Напротив, КР позволяет лучше определить сложные ионы, имеющие собственные полосы в низкочастотной области КР спектра. Разница оказывается не слишком большой благодаря сравнительно высокой кросс-корреляции между концентрациями анионов и катионов. Были реализованы и использованы следующие методы отбора существенных входных признаков задачи: отбор по дисперсии значений признака; отбор по кросс-корреляции с определяемым параметром; отбор по кросс-энтропии с определяемым параметром; отбор по результатам анализа весов НС (АВНС), а также следующие методы преобразования (выделения) признаков: агрегация входных признаков, анализ главных компонент (АГК). Для задачи МР сокращение вектора входных признаков путём их отбора по результатам АВНС приводит к ухудшению результатов; то же происходит для задачи ГР. Это может быть связано с тем, что количество точек измерения при шаге измерений в 500 м может быть недостаточным для полного описания изменений поля. Для задачи ЭР результаты улучшаются, что может быть связано с бОльшим числом входных признаков – с одной стороны, наличие действительной и мнимой части поля позволяет точнее описать его; с другой – сокращение числа входных признаков для этой задачи при том же количестве примеров оказывается более важным. Для ОЗ ОС количество входных признаков по результатам АВНС было сокращено в 8 раз, до 100 признаков в ОЗ спектроскопии поглощения и до 250 признаков в ОЗ спектроскопии КР. В обоих случаях сокращение входной размерности данных ведёт к улучшению результатов, причём улучшение является более выраженным для спектроскопии КР, для которой характерна более высокая погрешность решения. Далее, оценивались статистические показатели нейросетевых решений обеих рассматриваемых ОЗ ОС на полных наборах исходных признаков и на преобразованных признаках, полученных методом АГК. Было оставлено количество преобразованных признаков, соответствующее 99% описанной дисперсии данных. Их оказалось очень мало: 6 для СП и 5 для КР. В обоих случаях столь резкое сокращение входной размерности данных ведёт к заметному ухудшению результатов. По-видимому, причиной является тот факт, что АГК выделяет признаки исключительно по вариабельности исходных данных, без учёта решаемой задачи. При этом достаточно высокий уровень шумов, имеющихся в экспериментальных данных, может приводить к тому, что выделенные признаки в большей степени описывают изменчивость данных, обусловленную шумами, а не изменением искомых параметров задачи. В дальнейшем необходимо будет продолжить исследования в этом направлении с целью определения оптимального порогового уровня описанной дисперсии данных. В целом можно сделать вывод, что понижение размерности входных данных, как и ожидалось, способно снизить погрешность нейросетевого решения задачи, однако для определения оптимального метода понижения размерности и его параметров необходимы массовые вычислительные эксперименты. Так как в ходе выполнения плана работ на отчётный год были получены согласованные массивы данных, соответствующие использованию различных физических методов, было принято решение поставить первые рекогносцировочные вычислительные эксперименты с целью выяснения того, эффективно ли физическое комплексирование (комплексирование физических методов). Сравнивались результаты, полученные базовыми НС для трёх рассматриваемых в проекте физических методов РГ поодиночке (референсные значения), а также при использовании методов попарно и все трёх вместе. В данном вычислительном эксперименте использовались полные наборы входных признаков для каждой задачи, а при комплексировании массивы входных признаков объединялись, с соответствующим увеличением входной размерности решаемой нейронной сетью задачи. Наблюдалось кратное уменьшение погрешности решаемой задачи при использовании физического комплексирования. Ярче всего эффект проявляется при одновременном использовании всех трёх физических методов, а также для параметров третьего (самого глубокого) яруса, для которого задача является наиболее сложной. Однако при комплексировании методов СП и КР в задаче ОС ионов тяжёлых металлов ситуация меняется. При кратном отличии в уровне погрешности комплексируемых методов их совместное использование не позволяет улучшить результат лучшего из них. Для иона NO₃⁻ ситуация несколько выправляется – можно предположить, что, если удастся предобработкой данных сблизить результаты физических методов, их комплексирование сработает и для этой задачи. Для проверки этого предположения задача решалась нейронными сетями в пространствах признаков, отобранных посредством АВНС, и признаков, полученных с помощью АГК. При решении задачи в пространстве отобранных признаков (100 признаков для СП, 250 для КР, 350 при совместном использовании) оказалось, что, хотя при совместном использовании эффект от понижения размерности заметно более выражен, тем не менее по-прежнему наименьшая погрешность решения задачи достигается при использовании СП «в одиночку». В случае с преобразованием признаков посредством АГК сравнивались 4 варианта: СП и КР по отдельности (99% описанной дисперсии составляют 6 признаков для СП и 5 признаков для КР), объединение множеств главных компонент (СП+КР, 11 признаков), выполнение АГК в объединённом пространстве исходных спектров (СП&КР, 99% описанной дисперсии соответствуют 7 признаков). Вариант СП+КР стал теперь лучше всех остальных, и даже позволил ощутимо снизить погрешность решения задачи для ионов Cu²⁺ и Ni²⁺. Впрочем, для остальных ионов погрешность решения задачи при переходе в столь малоразмерное пространство выросла. В целом можно сказать, что подтвержден сделанный выше вывод о необходимости массовых вычислительных экспериментов на разных задачах для выработки устойчивой и в достаточной мере универсально методики понижения размерности входного пространства. Что же касается физического комплексирования, на данный момент можно сделать следующий вывод: оно может привести к снижению общей погрешности решения ОЗ, однако эффект сильнее проявляется в ситуациях, когда комплексируемые методы по отдельности дают близкие по качеству результаты. Были проведены также исследования в направлении комплексирования данных – по использованию аугментации данных методом добавления шума как способа повышения устойчивости нейросетевого решения ОЗ к шумам (на полученных ранее данных ещё одной задачи из области оптической спектроскопии – задачи диагностики водно-этанольных растворов). В целом, в отчётном году подтверждены сделанные ранее выводы о том, что добавление шума в процессе тренировки НС позволяет повысить устойчивость решения к шумам, если шум, добавляемый в процессе тренировки, имеет ту же природу и сходные качественные и количественные характеристики с тем шумом, в условиях которого нейронной сети предстоит работать на независимых данных. Более подробно с полученными выводами можно ознакомиться в публикации.
2 1 января 2020 г.-31 декабря 2020 г. Комплексирование методов при нейросетевом решении обратных задач высокой размерности, этап 2020 г.
Результаты этапа: В отчётном году были получены следующие основные научные результаты: 1) Массивы исходных данных ещё по одной выбранной задаче из области ОЗ РГ, полученные путем численного решения прямых задач для всех рассматриваемых физических методов. Результаты исследования свойств задач путём статистического анализа данных в массивах. Как и было запланировано, в отчётном году было проведено расширение схемы параметризации в сторону уменьшения шага измерения с 500 до 200 м (что позволяет описать более мелкомасштабные структуры поля) и увеличения количества слоёв в модели до пяти, а также создан класс с возможностью выклинивания (нулевая мощность слоя). Это заметно усложнило задачу и увеличило её размерность как по входу, так и по выходу. Для каждого из трех геофизических методов: гравиразведки, магниторазведки, электроразведки, - были рассчитаны базы данных, записи которых содержали синтезированные решения. Они были получены на основе оператора прямой задачи. Каждая БД включает в себя 10000 примеров. Был проведён статистический анализ данных в массивах. Обращают на себя внимание близость среднего и медианы и отсутствие «тяжёлых хвостов» распределений для всех типов полей. 2) Массивы исходных данных ещё по одной выбранной задаче из области ОЗ ОС, полученные путем постановки масштабных физических экспериментов для всех рассматриваемых физических методов. Результаты исследования свойств задачи путём статистического анализа данных в массивах. На втором году выполнения Проекта было принято решение рассмотреть задачу контроля выведения из организма человека люминесцентных нанокомпозитов (нанокомплексов, состоящих из углеродных точек (УТ) и противоракового препарата – доксорубицина (Д)) и их компонентов с уриной. Задача решалась с помощью лазерной флуоресцентной спектроскопии (ЛФС) (при возбуждении на двух длинах волн 405 и 532 нм), спектроскопии оптического поглощения (СОП), измерения водородного показателя pH, а также методов машинного обучения. Получены поканальные статистические показатели для массивов спектров флуоресценции на длинах волн 405 и 532 нм и для массива спектров поглощения. 3) Базовые (референсные) решения новых задач путём автономного использования каждого из базовых алгоритмов. Результаты анализа полученных результатов с физической точки зрения. Для получения базовых решений ОЗ ОС 2020 года все её варианты решались в режиме одновременного определения параметров, т.е. одновременно определялись концентрация УТ, концентрация Д и значение водородного показателя pH. Все результаты приводятся на тестовом наборе данных. В качестве базовых алгоритмов решения ОЗ были выбраны алгоритмы машинного обучения, реализованные в 2019 году, с подбором оптимальных параметров каждого алгоритма под каждую решаемую задачу для учёта специфики данных: нейронные сети (НС) типа многослойный персептрон (МСП), линейная регрессия (ЛР) в нелинейном базисе с предварительным шкалированием данных, метод проекций на латентные структуры (ПЛС), алгоритм случайного леса (СЛ), градиентный бустинг (ГБ). Как следует из сравнительного анализа, наименьшую ошибку определения искомых параметров по спектрам СОП и по спектрам флуоресценции с возбуждением излучением с длиной волны λвозб=405 нм обеспечивает применение МСП. Сравнимые результаты для определения концентраций дает использование метода ПЛС. Для случая возбуждения флуоресценции излучением с длиной волны λвозб=532 нм наименьшие значения САО определения концентрации компонентов суспензии и рН обеспечивает применение метода ГБ. При определении pH сравнимые результаты показывают НС и ПЛС. При этом СОП обеспечивает существенно более низкие уровни ошибок, чем ЛФС. Это объясняется тем, что степень перекрытия спектральных полос поглощения компонентов суспензии оказывается существенно ниже, чем степень перекрытия полос флуоресценции. В качестве базовых алгоритмов решения ОЗ РГ были выбраны те же алгоритмы машинного обучения, реализованные в 2019 году. В базовой версии все ОЗ решались в режиме автономного определения параметров. Наилучший результат показала нейронная сеть, наихудший – ПЛС. 4) Результаты проверки влияния отбора и выделения существенных входных признаков на качество решения новых задач. Для ОЗ РГ проведено сравнение результатов нейросетевого решения всех трёх типов ОЗ РГ на полном наборе и с отбором существенных признаков по уровню кросс-корреляции, в режиме автономного определения. Получены аналогичные результаты для случая комплексирования физических методов – их попарного применения, или одновременного применения всех трёх методов. Также получены аналогичные результаты для режима группового определения параметров, соответствующих одной вертикали. Отбор существенных признаков даже с помощью столь простого линейного метода оказывает положительное влияние на уровень ошибки. Для ОЗ ОС для повышения точности определения концентрации УТ, Д и рН в урине по спектрам флуоресценции или поглощения с помощью методов машинного обучения использовались 4 способа отбора существенных признаков: по уровню стандартного отклонения значений признака; по уровню кросс-корреляции признака с определяемым параметром; по уровню кросс-энтропии признака с определяемым параметром; по результатам анализа весов нейронной сети – МСП с 1 скрытым слоем. Помимо этого, использовались 3 способа преобразования признаков: линейный анализ главных компонент, дискретное и непрерывное вейвлет-преобразования. Все указанные способы отбора существенных признаков применялись к решениям поставленных задач методами искусственных нейронных сетей (НС), линейной регрессии (ЛГ), проекции на латентные структуры (ПЛС), случайного леса (СЛ), градиентного бустинга (ГБ). В результате отбора (преобразования) входных признаков, САО определения концентраций УТ и Д, а также значения рН, уменьшается для всех использованных методов решения ОЗ. Наиболее существенное уменьшение в большинстве случае обеспечивает преобразование входных признаков посредством непрерывного вейвлет-преобразования – до 25%. На данном этапе выполнения настоящего проекта наиболее эффективной методикой решения поставленной ОЗ оказалось определение искомых параметров по спектрам поглощения с помощью метода ПЛС после преобразования входных признаков посредством непрерывного вейвлет-преобразования для УТ и рН, или их отбора посредством корреляции для Д. Результаты, полученные для ОЗ ОС на данных 2019 года, опубликованы в статье в индексируемом издании (I.Isaev et al.). 5) Результаты проверки применимости для всех рассматриваемых задач разработанных и использованных авторами ранее методов снижения выходной размерности задачи: поэтапного и группового определения параметров, и оптимальные методики их применения. Сравнение результатов применения автономного и группового определения параметров при решении ОЗ РГ 2020 года позволяет подтвердить вывод, сделанный исполнителями Проекта ранее: при группировке параметров, характеризующихся разным уровнем ошибки решения ОЗ в режиме автономного определения, значения ошибки уменьшаются для тех параметров, которые в автономном режиме определялись хуже других (с которыми они группируются). Для тех параметров, которые в автономном режиме определяются лучше других, значения ошибки при группировке, как правило, увеличиваются. Выводы подтверждаются также в случае предварительного отбора существенных признаков, и при использовании комплексирования физических методов. 6) Результаты тестирования ряда альтернативных способов генерации дополнительных данных (в том числе новых), и результаты проверки эффективности использования этих способов для снижения погрешности решения ОЗ. В ситуации, когда нет ни адекватной модели решения прямой задачи, ни возможности получить необходимый объём экспериментальных данных, остаётся промежуточный, «квазимодельный» подход: генерация данных не на основе физически содержательной модели, а на основе адаптивной аппроксимационной модели, построенной на сравнительно небольшом количестве опорных экспериментальных данных. В рамках «квазимодельного» подхода к решению ОЗ в данном Проекте рассматриваются несколько основных направлений. Первое из них – построение аппроксимационных адаптивных моделей решения прямой задачи на основе имеющихся экспериментальных данных, и генерация дополнительных примеров с помощью построенных моделей. К сожалению, вычислительные эксперименты в этом направлении не принесли желаемых результатов – расширение тренировочного набора примерами, полученными с помощью моделей решения ПЗ, основанных на НС и на градиентном бустинге, не привело к снижению погрешности решения ОЗ. Второе направление предполагает использование методов аугментации данных (например, путём наложения шумов различной природы). Это направление оказалось более перспективным – наложение шумов позволяет повысить устойчивость решения ОЗ к шумам в данных и снизить погрешность её решения, что было вновь продемонстрировано в отчётном году на примере решения ОЗ с использованием комплексирования физических методов. Опубликованы тезисы и сделан доклад на международном симпозиуме (I.Isaev et al.), подана для публикации статья в индексируемом издании, которая будет опубликована в 2021 г. Наибольший интерес представляет третье направление – методы прямой генерации новых данных с помощью свёрточных автоэнкодеров и с помощью генеративных соревнующихся сетей (Generative Adversarial Networks, GAN). Обучение автоэнкодеров требует большого количества примеров и вычислительных ресурсов, для реализации полного цикла работ с большой моделью. Была построена модель с 10 свёрточными слоями, которая позволили сжать исходное пространство спектральных каналов размерности 2048 до латентного пространства 32 признаков в так называемом “узком горле” автоэнкодера. Несмотря на то, что полученные спектры получились похожи на оригинальные, имеется ряд проблем с точки зрения физики, что не позволяет использовать данные сети для работы с физическими задачами. Эти проблемы продемонстрированы в отчёте на примерах. Были также произведены работы по реализации и обучению условных генеративных состязательных сетей (ГСС) (conditional GAN, cGAN) на базе одномерных свёрточных сетей (генератора и дискриминатора) на массиве спектров поглощения солей тяжелых металлов (данные 2019 года). В качестве параметров условия, на основе которого ГСС должна генерировать пример, выступали либо концентрации металлов (режим регрессии), либо факт их наличия в бинарном коде (режим классификации). К сожалению, для обоих вариантов постановки задачи пока не удалось добиться позитивных результатов. Хотя НС справляется с выделением диапазонов основных областей, однако не может побороть негативное влияние шума, приходящего на вход в качестве инициализирующего значения. Таким образом, при работе с автоэнкодерами и с ГСС исполнители Проекта столкнулись с определёнными проблемами. Намечены пути их преодоления. Исследования в этих направлениях следует продолжить в 2021 г. 7) Результаты сравнительного анализа нескольких способов алгоритмического комплексирования методов решения задачи. Результаты применения этих способов для решения рассматриваемых задач, сравнение результатов с референсными. Был рассмотрен подход, в рамках которого максимально разнообразные предикторы работали совместно – в рамках однородного комитета, комитета со взвешиванием, либо с выработкой окончательного решения нейронной сетью-супервизором в рамках подхода Stacked Generalization. Предикторы выбирались из списка референсных моделей, перечисленных в разделе 3). Полученные в этом направлении результаты в основном подтвердили известные закономерности – одноранговый комитет (однородный или со взвешиванием) обеспечивает меньшие значения ошибки решения ОЗ, чем составляющие его предикторы, причём выигрыш тем больше, чем ниже корреляция между массивами выходных значений предикторов. Эффект от применения комитета тем больше, чем больше примеров в массиве данных, к которому он применяется. Наконец, в случае достаточной представительности наборов данных взвешивание предикторов в рамках комитета позволяет получить дополнительный выигрыш по сравнению с однородным комитетом, ответ которого представляет собой среднее ответов входящих в него предикторов. В рамках подхода, называемого Stacked Generalization, искомая задача вначале решается одним предиктором или комитетом предикторов. Затем ответ подается на вход алгоритма-супервизора, который обучается компенсировать ошибку этого предиктора или комитета. Для ОЗ ОС показано, что степень улучшения качества решаемой задачи за счет выработки окончательного решения НС-супервизором (НСС) больше зависит от типа иона, нежели от архитектуры НСС. Ожидается, что эффект от применения НСС усилится, если на первом этапе вместо единственного предиктора будет использоваться комитет предикторов. 8) Результаты дальнейшей проверки эффективности физического комплексирования методов, на задачах 2019 и 2020 года. Результаты проверки эффективности совместного использования физического комплексирования и отбора/преобразования входных признаков. В отчётном году были продолжены на новых задачах масштабные исследования эффективности комплексирования физических методов (КФМ). Полученные результаты подтверждают гипотезы, выдвинутые по результатам первого года выполнения Проекта: КФМ эффективно, если методы по отдельности дают сравнимые погрешности решения ОЗ, причем комплексирование большего количества методов (трёх) увеличивает выигрыш по сравнению с использованием любых двух из них. В случае, если один из физических методов даёт существенно меньшую погрешность решения ОЗ, чем другой, их комплексирование не позволяет улучшить результат. Эти выводы в отчёте проиллюстрированы примерами. Сформулированные выше выводы подтверждены для всех ярусов и всех пар физических методов, в режимах автономного и группового определения. Эффект КФМ также подтверждается при его одновременном использовании с отбором существенных признаков. Сделанные выводы полностью справедливы для градиентного бустинга (ГБ), и с некоторыми оговорками – для алгоритма случайного леса (СЛ). Для линейного алгоритма ПЛС эффект от КФМ полностью отсутствует. 9) Результаты, полученные дополнительно к намеченным на 2020 год. А) Предварительные исследования по ОЗ ОС, запланированной на 2021 год: задаче определения состава и диагностики качества белых вин по их спектрам разной физической природы с помощью НС и других алгоритмов машинного обучения. В экспериментальном плане эта задача является наиболее сложной из всех задач Проекта. Для изучения оптических свойств входящих в модельные растворы (МР) компонентов и оценки адекватности получаемых спектров были проведены рекогносцировочные экспериментальные исследования компонентов МР белых вин и двух реальных белых вин с помощью спектрофотометрии и флуоресцентной спектроскопии. Эти исследования позволили запланировать на следующий этап выполнения Проекта следующие шаги разработки диагностики качества белых вин с помощью ИНС и комплексирования различных экспериментальных методов: флуоресцентной спектроскопии с возбуждением в красной области спектра, метода когерентного антистоксового рассеяния света (КАРС), спектроскопии ИК поглощения. Б) Вычислительный эксперимент с дискретизацией ответов предиктора. При генерации массивов данных путём решения прямой задачи для ОЗ РГ использовались дискретные значения параметров, при этом шаг дискретизации составлял 20 м. Однако ответы НС (и других методов машинного обучения) непрерывны. В данном вычислительном эксперименте исследовался подход, когда ответ нейронной сети округлялся до ближайшего использовавшегося дискретного значения. При реальном использовании это может соответствовать ситуации, когда шаг дискретизации равен удвоенной допустимой погрешности определения параметров. Квантование (дискретизация) может как уменьшить результирующую ошибку (в случае ошибки от 0 до 10 м), так и увеличить (в случае ошибки от 10 до 20 м). Как видно из результатов, в среднем ошибка снижается. Особенно это заметно в случае КФМ. 10) Публикация результатов работы по проекту в рецензируемых научных изданиях и представление результатов на всероссийских и международных конференциях. В отчётном году были опубликованы 12 работ по проекту, в том числе: • 5 статей в изданиях, индексируемых Web of Science, Scopus и РИНЦ • 1 статья в издании, индексируемом Scopus и РИНЦ • 3 публикации в виде тезисов и материалов конференций в изданиях, индексируемых РИНЦ • 3 публикации в виде тезисов докладов на международных конференциях Представлено 9 докладов на 9 научных мероприятиях, в том числе 1 приглашённый, 6 устных и 1 стендовый доклад на 8 международных конференциях и семинарах, и 1 устный доклад на всероссийской конференции. Страница Проекта в ИАС «ИСТИНА» МГУ: https://istina.msu.ru/projects/239480881/.
3 1 января 2021 г.-31 декабря 2021 г. Комплексирование методов при нейросетевом решении обратных задач высокой размерности, этап 2021 г.
Результаты этапа:

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".