![]() |
ИСТИНА |
Войти в систему Регистрация |
ИСТИНА ЦЭМИ РАН |
||
В данной работе разработаны принципы и алгоритмы формирования, хранения и управления метаданными провенанса больших данных, порождаемых крупными научными экспериментами. Провенанс с точки зрения компьютерных наук – это метаинформация, имеющая отношение к истории получения данных, начиная от источника. Метаданные провенанса содержат ключевую информацию, которая необходима для определения происхождения, авторства и качества данных, их правильного хранения, корректного воспроизведения, а также для интерпретации и подтверждения соответствующих научных результатов. Особенно важными такие метаданные являются при реализации рабочих процессов в распределенных средах получения и обработки данных. Хотя за последние годы был осуществлен целый ряд проектов по созданию систем управления такими метаданными, но подавляющее большинство реализованных решений являются централизованными, что плохо соответствует современным тенденциям работы в распределенных средах, модели открытого доступа к данным, и возможности использования метаданных организационно несвязанными или слабо связанными сообществами исследователей. В то же время большую популярность для разных приложений приобрели распределенные реестры на основе блокчейн-технологии. В самое последнее время на основе блокчейна появились разработки и для систем управления метаданными провенанса. Однако эти разработки предназначены для облачной среды хранения данных, являются довольно тяжеловесными и ресурсоемкими,что связано, главным образом с использованием блокчейнов открытого типа. Это делает сомнительными перспективы успешного использования указанных решений для хранения и управления метаданными провенанса данных, порождаемых крупными научными экспериментами в распределенных средах. Для решения этой проблемы в данной работе мы предлагаем использовать новый подход к созданию распределенного реестра метаданных провенанса на основе блокчейна закрытого типа и алгоритмов достижения консенсуса, которые не требуют для своего поддержания больших затрат ресурсов.