Аннотация:Множественное выравнивание аминокислотных последовательностей гомологичных белков – ключевой инструмент современной биоинформатики и эволюционного анализа. Различия в пространственной ориентации боковых цепей аминокислот могут предопределять существенное функциональное разнообразие представителей одного суперсемейства, однако это обстоятельство никак не учитывают при построении выравниваний и последующем сравнительном анализе. Прежде всего, это связано с недостатками соответствующих алгоритмов, которые опираются на биохимическое сходство “алфавита” аминокислотных замен и либо вообще не используют информацию о 3D-структурной организации белков, либо ограничиваются сравнением остова (атомов основной цепи). Впервые разработано программное обеспечение для систематического исследования специфической ориентации боковых цепей аминокислот в эквивалентных позициях структур гомологов. Программа предназначена для использования в качестве вспомогательного средства при анализе множественных выравниваний аминокислотных последовательностей белков. Новый метод, основанный на алгоритме машинного обучения HDBSCAN, позволяет выявить статистически значимые различия в положении боковых цепей аминокислот в каждой позиции множественного выравнивания и классифицировать их на подсемейства. Метод апробирован на широкой выборке данных. Полученные результаты позволяют говорить о феномене специфической ориентации боковых цепей аминокислот как о достаточно распространенном явлении, требующем дальнейшего изучения и заслуживающем внимания при сравнительном анализе функционально разнообразных суперсемейств белков. Разработанное программное обеспечение находится в свободном доступе по адресу: https://github.com/TimoninaDaria/Subfamily-Specific-Sidechain-Orientations.