Оптимизация генеративного ридера в составе RAG системы - доклад на конференции | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Авторы: Соколов А.П., Замелин П.А., Камелина Ю.Д., Пластова П.И.
Международная Конференция : V Международная конференция по нейронным сетям и нейротехнологиям (NeuroNT'2024)
Даты проведения конференции: 20 июня 2024
Дата доклада: 20 июня 2024
Тип доклада: Устный
Докладчик: не указан
Место проведения: Санкт-Петербург, Russia
Аннотация доклада:
В докладе предлагается простая методология для оптимизации подсистемы генеративного ридера, являющегося одним из ключевых компонентов RAG систем. Описанная методология может быть использована в качестве предварительной оптимизации, которая позволяет быстро построить вопросно-ответную систему (QA-система) приемлемого качества. Основным принципом этой методологии является использование генеративной модели GPT4 от OpenAI в качестве эталонного генеративного ридера. Наша методология описывает процедуру создания синтетического датасета и определяет основные метрики для оптимизации. Использование синтетических данных позволяет точно контролировать, что изменения, вносимые в QA-систему, приближают ее ответы в эталонным. На основе разработанной методики мы провели ряд простых экспериментов по оптимизации для быстрого поиска лучшей конфигурации подсистемы ридера. Эти эксперименты позволили существенно улучшить качество ответов QA-системы. В результате мы добились относительного прироста средней семантической близости ответов нашего ридера с эталонным GPT4 почти 50% по шкале BLEURT и 26% по шкале SAS. Наша методология была проверена для построения русскоязычной вопросно-ответной системы, но она также может быть применена для построения вопросно-ответной системы
Добавил в систему: Соколов Андрей Павлович

	ИСТИНА	Войти в систему Регистрация
	ИСТИНА ЦЭМИ РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИСТИНА ЦЭМИ РАН

Оптимизация генеративного ридера в составе RAG системыдоклад на конференции