Установление взаимосвязи между структурой и функциональными свойствами белков/ферментов на основе интеллектуального анализа информационных ресурсов и разработка предсказательных алгоритмовНИР

Establishment of interrelation between structure and functional properties of proteins / enzymes on the basis of intellectual analysis of information resources and development of predictive algorithms

Источник финансирования НИР

грант РФФИ

Этапы НИР

# Сроки Название
1 15 августа 2018 г.-31 декабря 2018 г. Установление взаимосвязи между структурой и функциональными свойствами белков/ферментов на основе интеллектуального анализа информационных ресурсов и разработка предсказательных алгоритмов
Результаты этапа: Разработана первая версию публичной веб-платформы инструментов биоинформатики, позволяющая проводить интеллектуальный анализ больших данных с использованием современных высокопроизводительных вычислительных средств. Адаптированы и интегрировать в разрабатываемую платформу оригинальные программы, а также сторонние алгоритмы с открытым кодом для эффективной обработки больших объемов информации с использованием суперкомпьютера. Алгоритм Zebra от 2014 года ре-имплементирован для эффективной обработки больших выравниваний, состоящих из десятков тысяч последовательностей и структур белков. Метод Mustuseal доработан с учетом аппаратных требований нового раздела суперкомпьютера «Ломоносов-2», открытого в марте 2018 года (узлы с многоядерными процессорами Intel Skylake и процессорами NVidia Pascal P100 с аппаратной поддержкой высокоскоростного интерфейса NVLink) и установлен на суперкомпьютере «Ломоносов-2». Проведен биоинформатический анализ белков/ферментов суперсемейства Ntn-гидролаз, выявлены особенности структурной организации активных центров, поиск мунлайтинговых ферментов и ферментов с разнородными активностями в этом суперсемействе. Проведен биоинформатический анализ белков/ферментов суперсемейства пенициллин-связывающих белков. Осуществлен автоматизированный сбор экспериментальных результатов, полученных в разных лабораториях, созданы базы данных по семействам пенициллинацилаз и бета-лактамаз и проведен интеллектуальный анализ информационных ресурсов для выявления характеристических признаков в каталитических и регуляторных центрах белков этих семейств. Созданы базы данных характерных «сигнатур аминокислотных последовательностей сайтов», «3D-мотивов» и соответствующих молекулярных моделей центров связывания кофакторов NAD+ и NADH для последующего поиска ранее неизвестных функциональных и регуляторных центров в ферментах, представленных в базе данных PDB. Разрабатываемый подход апробирован для поиска новых центров связывания и мунлайтинговых свойств в белках семейства глицеральдегид-3-фосфат дегирогеназ (ГАФД). Разработаны критерии, характеризующие реакционноспособную конформацию фермент-субстратных комплексов (Near to Attack Conformations, NAC) для реакций, катализируемых ферментами семейства пенициллинацилаз. Разработан метод поиска природных пенициллинацилаз или их мутантных форм, способных модифицировать и синтезировать бета-лактамные антибиотики с алкильными боковыми заместителями. Разработаны методы экспериментального исследования свойств искомых ферментов.
2 1 января 2019 г.-31 декабря 2019 г. Установление взаимосвязи между структурой и функциональными свойствами белков/ферментов на основе интеллектуального анализа информационных ресурсов и разработка предсказательных алгоритмов
Результаты этапа: Разработана вторая, расширенная и улучшенная, версия платформы инструментов биоинформатики (в том числе ее публичная веб-версия, свободно доступная пользователям по всему миру), позволяющая проводить анализ всей доступной информации о последовательностях, структурах и функциях белков с использованием современных высокопроизводительных вычислительных средств для эффективной обработки больших данных. В усовершенствованной версии сделан акцент на методах анализа 3D-структурной информации с использованием оригинальных и сторонних алгоритмов (в том числе, на основе оригинальной методологии 3D-мотивов). Продолжена работа по адаптации и интеграции в разрабатываемую платформу оригинальных программ биоинформатического анализа для эффективной обработки больших объемов информации с использованием суперкомпьютера. Завершена работа над методом Zebra2, разработанным в первый год проекта, новый метод полностью интегрирован в платформу. Алгоритм pocketZebra от 2014 года ре-имплементирован для эффективной обработки больших выравниваний, работа по интеграции соответствующего метода pocketZebra2 в платформу завершена практически полностью. Продолжена работа по разработке предсказательных алгоритмов для изучения взаимосвязи между структурой и функцией белков на основе систематического анализа всей доступной 3D-структурной информации о суперсемействах с использованием методов машинного обучения. Алгоритм Zebra3D для поиска и классификации специфически организованных функционально значимых участков структуры ферментов уточнен, протестирован и апробирован на широкой выборке суперсемейств белков в рамках решения описанных ниже задач второго года проекта. Программа Zebra3D представлена для публичного использования. Продолжена работа по разработке новых оригинальных алгоритмов интеллектуального анализа информационных ресурсов. Будет разработано программное обеспечение для анализа научных текстов с целью извлечения информации "белок-мутация-эффект". Продолжена работа по созданию базы данных «3D-мотивов» и соответствующих молекулярных моделей центров связывания кофактора NAD+/NADH для последующего поиска ранее неизвестных функциональных и регуляторных центров в ферментах, представленных в базе данных PDB. Библиотека «3D-мотивов», характеризующих центры связывания кофактора NAD+/NADH, полученная в первый год проекта, уточнена. Произведен поиск новых центров связывания кофактора NAD+/NADH в структурах белков в базе данных PDB. Создана база данных «3D-мотивов» и соответствующие молекулярные модели центров связывания ионов металлов в активных центрах ферментов для последующего поиска ранее неизвестных функциональных и регуляторных центров в ферментах, представленных в базе данных PDB. Созданы продуценты одиночных мутантов пенициллинацилазы по специфическим позициям подсемейств Ile177, Phe57 и Val56 бета-цепи, проведены выделение и очистка ферментных препаратов, экспериментально проверена их способность проявлять каталитическую активность, связывать и использовать лауриламид в качестве ацильного донора для синтеза соответствующих пенициллинов и цефалоспоринов. Проведен поиск мутантов пенициллинацилазы, способных связывать и превращать производные широкого круга природных насыщенных, мононенасыщенных, омега-3, омега-6 и омега-9-полиненасыщенных жирных кислот, в первую очередь миристиновой, стеариновой, пальмитиновой, сорбиновой, пальмитолеиновой, олеиновой кислот. Описаны характеристические признаки каталитической активности ПЭТ-деградирующих ферментов суперсемейства α/β-гидролаз. Проведен биоинформатический анализ суперсемейства α/β-гидролаз с использованием оригинальной платформы. Информация об экспериментально охарактеризованных мутантах и влиянии точечных замен в ключевых участках структуры ПЭТазы из Ideonella sakaiensis - субстрат-связывающем сайте, C-концевом участке, тяжей β6 и β7 в структуре - на активность и стабильность ПЭТазы, собранная в первый год, использована для изучения механизма действия этого фермента и ключевых структурных факторов его каталитической активности. Изучена встречаемость мутаций, которые приводят к увеличению активность ПЭТазы, в структурах ее гомологах в суперсемействе. Предложен метод поиска новых природных биокатализаторов, способных гидролизовать полиэтилентерефталат, на основании сравнительного анализа гомологов с разными свойствами. Проведена оптимизация методики образования дисульфидного мостика в структуре полученного в первом году выполнения проекта двойного bT307C+bV320C мутанта пенициллинацилазы, влияние нововведенного дисульфидного мостика на термо-, pH-, гало- и операционную стабильность фермента. На основании предсказаний разработанной на первом году выполнения проекта программы Yosshi получен новый двойной мутант пенициллинацилазы bS150C+bN173C, способный образовать другой дисульфидный мостик в структуре фермента, для последующего исследования его функциональных свойств. Проведен поиск ранее неизвестных участков связывания в структуре сериновых бета-лактамаз и комплементарных им ингибиторов. Изучены особенности структурной организации обнаруженного нами нового участка связывания в структуре глицеральдегид-3-фосфат дегидрогеназ и возможности создания селективных модуляторов ферментативной активности, способных связываться на этом участке в ферментах из различных организмов
3 1 января 2020 г.-31 декабря 2020 г. Установление взаимосвязи между структурой и функциональными свойствами белков/ферментов на основе интеллектуального анализа информационных ресурсов и разработка предсказательных алгоритмов
Результаты этапа:
4 1 января 2021 г.-31 декабря 2021 г. Установление взаимосвязи между структурой и функциональными свойствами белков/ферментов на основе интеллектуального анализа информационных ресурсов и разработка предсказательных алгоритмов
Результаты этапа: Установление взаимосвязи между структурой и функциональными свойствами белков/ферментов является одной из наиболее актуальных задач, важных как для фундаментального понимания организации и функционирования живых систем, так и для использования этих знаний в медицине и биотехнологии. Полноценное решение задачи долгое время сдерживала ограниченность информации о структурной организации весьма сложных биологических объектов и путях регуляции их функционального поведения, дополнительные проблемы представлял анализ большого объема разрозненных и часто противоречивых экспериментальных данных. В этих условиях была возможна лишь упрощенная эмпирическая систематизация комиссии по ферментам Международного союза теоретической и прикладной химии (IUPAC, ЕС классификация), ограниченная постулатом «один белок – одна функция», в рамках которой было крайне затруднительным предсказание функциональных особенностей вновь открываемых ферментов. Накопление существенного объема данных о структурах ферментов, их комплексов с субстратами и ингибиторами, примеров аллостерических белков, открытие явления мунлайтинга, т.е. наличия нескольких (вплоть до двух десятков!) функциональных активностей в рамках одной белковой структуры, загадки псевдоферментов, потерявших каталитическую активность, но сохраняющих регуляторные свойства, появление возможностей сравнительного анализа белков на различных уровнях структурной организации, а также аминокислотных последовательностей, развитие современных компьютерных технологий, методологий нейронных сетей, машинного обучения, интеллектуального анализа разносторонних информационных ресурсов позволяет приступить к работе над проблемой соотношения структуры и функции ферментов на качественно новом уровне. Исследования последних лет наглядно показали, что схожесть структуры белков не означает тождественность функций: одна и та же функция может выполняться белками с различной структурой (аналогичные белки), один и тот же центр в структуре белка способен катализировать различные химические реакции (ферменты с разнородными активностями), а один и тот же белок способен выполнять разные функции в рамках общей структурной организации (мунлайтинговые белки). При этом объем накопленных экспериментальных данных позволяет говорить о том, что ферменты с разнородными активностями, аллостерические и мунлайтинговые белки не являются особыми случаями, как считалось ранее, а являются широко распространенным и, возможно, даже универсальным явлением в природе. Для понимания молекулярных механизмов структурно-функциональных взаимосвязей в белках необходимо изучение структурной организации конкретных сайтов, ответственных за взаимодействие с другими белками и связывание различных лигандов (субстратов, ингибиторов, эффекторов) в гомологичных и аналогичных белках, а также взаимодействие (взаимосвязь) между различными сайтами в структуре одного белка. Взрывной рост числа публично доступных пространственных структур белков/ферментов в базе PDB создает предпосылки для использования этой информации, в дополнение к данным по аминокислотным последовательностям, для более точного сравнительного анализа функционально разнообразных эволюционно удаленных гомологов одного суперсемейства, а также позволяет искать общие признаки в функционально схожих неродственных (аналогичных) белках с различной структурой и отсутствием сходства по последовательности. Целью предлагаемого проекта является разработка многослойной биоинформатической платформы, позволяющей идентифицировать ранее неизвестные функциональные свойства известных белков/ферментов и находить белки/ферменты с заданной функцией, или предрасположенностью к выполнению заданной функции, в базах данных последовательностей и структур белков. Основная идея состоит в том, чтобы объединить и использовать в разрабатываемом подходе три уровня компьютерного моделирования: биоинформатический анализ (в том числе, методы машинного обучения) всех доступных структур и последовательностей белков/ферментов функционально разнообразных суперсемейств для изучения особенностей организации и поиска характеристических признаков в каталитических и регуляторных центрах гомологичных и аналогичных белков; методы молекулярного моделирования (докинга, молекулярной динамики, гибридных квантово-химических подходов) для уточнения механизмов и сравнительного анализа биохимической основы процессов, реализуемых в конкретных активных центрах; автоматизированный интеллектуальный анализ информационных ресурсов, таких как статьи, патенты, абстракты конференций и веб-сайты научных лабораторий, для экстракции и систематизации разрозненной экспериментальной информации о функциях и свойствах белков. Многосторонний анализ экспериментально аннотированных белков/ферментов исходя из постулатов «один центр – много функций» (ферменты с разнородными активностями), «одна функция – много центров» (аналогичные, а также аллостерически регулируемые белки) и «один белок – много функций» (мунлайтинговые белки) на уровне соответствующих суперсемейств и с учетом химических и молекулярных основ механизмов их действия позволит определить и описать необходимые структурные факторы, присущие отдельно каждой аннотированной функции, и использовать их в качестве шаблонов для поиска новых функций в других белках. Задачами данного проекта являются: 1. Провести автоматизированный интеллектуальный анализ информационных ресурсов, таких как статьи, патенты, абстракты конференций и веб-сайты научных лабораторий, для экстракции и систематизации разрозненной экспериментальной информации о функциях и свойствах белков. На основании систематизированных экспериментальных данных отобрать наиболее активно изучаемые актуальные объекты – ферменты с разнородными активностями, аналогичные, аллостерически регулируемые и мунлайтинговые белки – для дальнейшего изучения. 2. С использованием методов биоинформатики (в том числе, методов машинного обучения) провести анализ всех доступных структур и последовательностей отобранных белков/ферментов на уровне соответствующих функционально разнообразных суперсемейств для изучения особенностей организации и поиска характеристических признаков («сигнатур аминокислотных последовательностей сайтов», а также «3D-мотивов» расположения ключевых остатков в пространстве) в каталитических и регуляторных центрах гомологичных и аналогичных белков. 3. Разработанные программы и полученные с их помощью молекулярные модели структурных признаков функциональных и регуляторных центров («сигнатуры аминокислотных последовательностей сайтов» и «3D-мотивы») будут использованы для поиска прототипов биокатализаторов с необходимыми функциональными свойствами для целей биотехнологии, а также для аннотации ранее неизвестных активностей полифункциональных (мунлайтинговых) белков как потенциальных мишеней действия новых лекарственных препаратов от заболеваний человека. 4. Предсказательный потенциал разработанного подхода будет проверен экспериментально при создании препаратов пенициллинацилазы с высокой каталитической активностью к алифатическим ацильным донорам для препаративного получения полусинтетических бета-лактамных антибиотиков и разработке селективных ингибиторов мунлайтинговых ферментов. 5. Предлагаемый набор инструментов биоинформатики будет реализован с использованием современных высокопроизводительных вычислительных средств и представлен в виде публичной веб-платформы в сети интернет с интуитивно понятным графическим интерфейсом, что откроет доступ к новому ресурсу для широкого круга пользователей. Таким образом, преимуществом проекта является объединение методов биоинформатики для анализа конкретных центров связывания в структурах белков/ферментов, методов теоретической химии и энзимологии для уточнения химических механизмов процессов, реализуемых в конкретных функциональных центрах, а также высокопроизводительных вычислений с использованием суперкомпьютеров в единую платформу (см. «Анализ современного состояния исследований в данной области»). Развитие общедоступных веб-сервером мы считаем принципиально важным шагом решения проблемы поиска взаимосвязи между структурой и функцией белков. В виду сложности и масштабности этой задачи чрезвычайно важно объединение усилий разных ученых и коллективов, работающих над этой проблемой, а также разносторонняя проверка предлагаемых подходов. Доступность веб-серверов способствует быстрой оценке эффективности разных методов и позволяет эффективно интегрировать в комплексную методологию наиболее перспективные идеи. Привлечение к решению задач проекта междисциплинарного коллектива исполнителей, сочетающего различные профессиональные компетенции в биоинформатике и математических методах в биологии, молекулярном моделировании и теоретической химии, биокатализе, механизмах действия и специфичности ферментов, биоинженерии и дизайне ферментов, информационном поиске и извлечении знаний из текстов, методах машинного обучения, суперкомпьютерного моделирования и параллельных вычислений, позволит приступить к работе над проблемой соотношения структуры и функции ферментов на качественно новом уровне.

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".