Федеральный исследовательский центр «Фундаментальные основы биотехнологии» РАН обладает уникальными базами данных.
- База данных «Протеомика злокачественных клеток»
Отечественная многомодульная общедоступная база данных «Протеомика злокачественных клеток» («ПЗК») в настоящее время содержит семнадцать взаимосвязанных информационных модулей, в состав каждого из которых входят протеомные и биомедицинские данные о белках соответствующих объектов исследований. Объектами исследований являются различные злокачественные клеточные линий человека (включая клетки рабдомиосаркомы RD, двух культивируемых линий рака почки 769-P, A-498 и аденокарциномы кишечника НТ-29, а также линий лейомиосаркомы SK-UT-1B и остеосаркомы U-2 OS). Данные представленные на четырех информационных уровнях. Основа модулей – синтетические двумерные карты, представляющие собой обобщенные результаты фракционирования белков методом двумерного электрофореза.
База данных зарегистрирована в Государственном реестре баз данных 27.04.2017 (регистрационный номер 2017620475), размещена в сети Интернет (http://ef2.inbi.ras.ru).
- База данных «Протеомика рака простаты»
По итогам протеомных исследований образцов тканей простаты со злокачественными и доброкачественными опухолями, сформирована многоуровневая компьютерная база данных «Протеомика рака простаты» (http://ef.inbi.ras.ru/), которая зарегистрирована в Государственном реестре баз данных (регистрационный номер 2012620676 от 13.07.2012).
База данных «Протеомика рака простаты» содержащая 302 белковые фракции. Среди идентифицированных в Институте биохимии им. А.Н.Баха белков оказалось 10 новых, для некоторых из которых зарегистрированы резкие количественные изменения, связанные с клеточной дифференцировкой, что представляется перспективным для диагностических целей.
- База данных «Протеомика мышечных органов»
Сформирована многомодульная база данных «Протеомика мышечных органов» (http://mp.inbi.ras.ru/), которая содержит комплексные модули «Белки миокарда» и «Белки миобластов» (всего более 300 идентифицированных мышечных белков).
- База данных по олигопептидам EROP-Moscow
База данных EROP-Moscow (Endogenous Regulatory OligoPeptides) с онлайн-доступом (http://erop.inbi.ras.ru/) о структуре и функциях природных олигопептидов.
Природные олигопептиды, содержащие от 2 до 50 аминокислотных остатков являются регуляторами практически всех жизненно важных процессов. К настоящему времени известна химическая структура почти 6000 олигопептидов, выделенных из живых организмов более чем 1000 биологических видов — представителей всех биологических империй/царств. Среди них нейропептиды представляют самый большой функциональный класс, насчитывающий более 1300 природных структур.
Для формирования клиент-серверной базы данных была проведена формализация химических, биологических и других характеристик природных олигопептидов, образующихся в результате рибосомального матричного, нерибосомального матричного или ферментативного синтеза. К настоящему времени число структурах природных олигопептидов в базе данных составляет более 9000.
- База данных «Database of Periodic DNA Regions in Major Genomes»
База данных содержит информацию о районах с различными тапами периодичности в разнообразных геномах. Для геномов эукариот эти районы в среднем занимают ~8% от генома (http://victoria.biengi.ac.ru/cgi-bin/indelper/index.cgi). Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
- Web-сайт для поиска скрытой периодичности в символьных последовательностях с учетом делеций и вставок символов
Сайт дает возможность найти скрытую периодичность со вставками и или делециями как для числовых так и для символьных последовательностях (http://victoria.biengi.ac.ru/splinter/login.php). Создан сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
- База данных потенциальных мутаций типа сдвиг рамки считывания в cds
База данных содержит информацию о потенциальных мутациях типа сдвиг рамки считывания в разнообразных cds из эукариотических геномов. В среднем около 23% cds содержит такие мутации (http://victoria.biengi.ac.ru/cgi-bin/frameshift/index.cgi). Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
- Web-сайт для поиска потенциальных мутаций типа сдвиг рамки считывания в cds
Сервер дает возможность найти потенциальные мутации типа сдвиг рамки считывания в любых cds (http://victoria.biengi.ac.ru/fsfinder/). Создан сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
- База данных потенциальных промоторных последовательностей
База данных находится по адресу: http://victoria.biengi.ac.ru/cgi-bin/dbPPS/index.cgi
База данных содержит более 390 тысяч потенциальных промоторов в геноме латука посевного (lactuca sativa), более 825 тысяч потенциальных промоторов в геноме перца стручкового (capsicum annuum) и более 3 миллионов потенциальных промоторов в геноме человека разумного (homo sapiens). Создание базы данных стало возможным только потому, что разработан новый математический метод создания множественного выравнивания нуклеотидных последовательностей.
Областью возможного применения является биотехнология и генетическая инженерия.
Аналогичных баз данных не существует. Это связано с тем, то выявление промоторных последовательностей всеми ранее разработанными математическими алгоритмами невозможно. Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.3390/sym13060917, https://doi.org/10.3390/biology11081117, https://doi.org/10.3390/plants12203573,
https://doi.org/10.3390/ijms241612561
- База данных по SINE повторам из генома риса
База данных находится по адресу: http://victoria.biengi.ac.ru/sinerice/
База данных содержит десятки тысяч новых и известных SINE повторов из 45 различных семейств. Создание базы данных стало возможным только потому, что разработан новый математический метод создания множественного выравнивания нуклеотидных последовательностей.
Областью возможного применения является биотехнология и генетическая инженерия.
Аналогичных баз данных для генома риса не существует. Это связано с тем, что обнаружение новых не известных ранее SINE последовательностей всеми ранее разработанными математическими алгоритмами невозможно. Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.)
- Web-сайт для постоения и оценки статистической значимости множественных выравниваний последовательностей ДНК, РНК и белков методом MAHDS
Сервис позволяет строить множественные выравнивания последовательностей ДНК, РНК и белков методом MAHDS, а также оценивать статистическую значимость произвольных множественных выравниваний. Особенность метода MAHDS заключается в его способности строить статистически значимые выравнивания слабо гомологичных последовательностей, подобие которых другими методами не обнаруживается (http://victoria.biengi.ac.ru/mahds).Создан сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.3390/genes12020135, https://doi.org/10.3390/ijms23073764
- Web-сайт для поиска дисперсных повторов в геномах IP методом
Сервис позволяет находить дисперсные повторы длиной от 100 до 800 оснований в последовательностях ДНК длиной от 500000 до 20000000 оснований с помощью IP метода (http://victoria.biengi.ac.ru/shddr). Особенностью IP метода является его способность обнаруживать de-novo дисперсные повторы, имеющие малую степень подобия. Создан сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.3390/ijms241310964
- База данных тандемных повторов в геноме перца стручкового (capsicum annuum)
База данных содержит более 900 тысяч тандемных повторов длиной от 2 до 200 оснований обнаруженные с помощью метода mRPWM в геноме перца стручкового (capsicum annuum (http://victoria.biengi.ac.ru/capsicum_tr). Метод mRPWM позволяет найти значительно больше повторов, чем другие известные методы, за счёт того что mRPWM может обнаруживать в том числе и сильно дивергированные повторы. Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.1093/dnares/dsad007
- База данных дисперсных повторов в геномах растений
База данных содержит 117050 дисперсных повторов 35 классов в геноме Arabidopsis thaliana, 2524971 дисперсных повторов 26 классов в геноме Capsicum annuum, 330328 дисперсных повторов 35 классов в геноме Daucus carota, 388615 дисперсных повторов 30 классов в геноме Oryza sativa, 2419867 дисперсных повторов 54 классов в геноме Zea mays. Дисперсные повторы были найдены при помощи IP метода, основанного на оптимизации позиционно-весовых матриц и применении двухмерного динамического программирования, который позволяет обнаруживать повторы, имеющие слабое подобие.
Метод подробно описан в публикациях: https://doi.org/10.3390/ijms241310964 и https://doi.org/10.3390/ijms25084441.
База данных создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).