Использование современных биоинформатических методов для расшифровки молекулярных механизмов формирования ишемической болезни сердца
Заказать уникальную курсовую работу- 30 30 страниц
- 29 + 29 источников
- Добавлена 24.11.2019
- Содержание
- Часть работы
- Список литературы
- Вопросы/Ответы
Введение 4
Понятие мультифакториальных заболеваний 5
2. Анализ полиморфизмов, ассоциированных с ИБС 9
2.1 Полиморфизмы, локализованные в хромосоме 9р21 9
2.2 Полиморфизмы, связанные с увеличением содержания ЛПНП и холестерина 11
2.3 Прочие полиморфные варианты 16
3. Биоинформатические инструменты, используемые для анализа генетического полиморфизма 18
3.1 Базы данных SNP 19
3.2 Программное обеспечение для проведения и интерпретации генетического анализа 22
3.3 Программы, направленные на «предсказание» фенотипа, присущего тем или иным SNP 25
Заключение 27
Список литературы 28
Существует исчерпывающий онлайн-список , он регулярно обновляется, в настоящее время содержит ссылки и информацию на более чем 480 программ (http://www.nslij-genetics.org/soft/). Инструменты для проведения статистического генетического анализа и анализа паттернов LD среди маркеров и прогнозирования гаплотипов являются одними из наиболее часто разрабатываемых областей программного обеспечения.Многие статистические генетики и биоинформатики также реализуют свой собственный код для анализа, часто полагаясь на пакеты на языке программирования R (например, haplo.stats_R для анализа ассоциации гаплотипов).Когда образцы и маркеры определены, и если предварительно созданные стратегии генотипирования не применяются, следующим шагом часто является разработка и валидация анализа. Тщательное использование программного обеспечения для разработки анализов, а также систем управления лабораторной информацией (LIMS) может помочь уменьшить количество ошибок и сократить затраты на генотипирование. Существует множество программ, помогающих в разработке анализа для различных подходов генотипирования, в том числе некоторые со специальными компонентами для разработки SNP: PrimerBatch3, который включает в себя несколько типов анализа SNP17, и популярный общий инструмент Primer3 18.Следует по возможности применять эффективные принципы построения анализа генотипирования, включая рассмотрение потенциальные эффекты смешения от повторяющихся областей, SNP, которые могут гибридизоваться с последовательностями зондов,[21] GC-богатые области, полинуклеиновые кислоты и потенциальные триаллельные варианты. Для лабораторий, обрабатывающих большие объемы результатов генотипирования, LIMS может быть желательным средством информатики.Для тех, кто занимается анализом GWAS, одной из первых проблем является тщательное применение алгоритмов генотипирования.Основные алгоритмы и программное обеспечение в значительной степени зависят от платформы (например, Affymetrix и Illumina), а в некоторых случаях - от массива.Те, кто использует подход пула ДНК для сохранения образцов и средств, могут применять специфичные для пула алгоритмы вызова, включая GenePool22. После того как генотипы были собраны, очищены и вызваны, в зависимости от масштаба проекта (например, GWAS, ген-кандидат или репликация), может быть предпринят ряд дополнительных шагов. Расчет простых популяционных генетических мер, таких как равновесие Харди-Вайнберга (HWE), может быть информативным.[4] Такая статистика включена во многие программы, или также доступны отдельные подпрограммы, такие как SNP-HWE24.Когда окончательный генотипированный или вмененный набор SNP готов, выбор соответствующих инструментов для статистической ассоциации является критическим шагом. На выбор программного обеспечения и процедур влияют многие факторы, в том числе характер изучаемого фенотипа (ов), наличие и выбор ковариат, объем отсутствующих данных, структура семьи и наличие родословных, структура когорты или контроля случая, стратификация населения. Внедрение и совместное использование процедур тестирования ассоциаций на языке программирования R популярно, многие из них доступны через Bioconductor. Существует много специализированных инструментов генетического анализа. PLINK является, пожалуй, наиболее полной и хорошо документированной свободно доступной системой для проведения крупномасштабного генетического анализа, включая варианты для популяционных тестов по различным моделям, семейного тестирования, гаплотипов, условных тестов, вменения, стратификации и аннотации34.[16] Дополнительные всесторонние пакеты программного обеспечения для связи и ассоциации включают Mendel37, MERLIN38 и Genomizer39, GHOST40 (на основе семейства) и GenAbel (на основе генотипа) и ProbAbel (на основе вменяемого) для анализа GWAS. Семейные тесты ассоциации реализованы как отдельное программное обеспечение или как часть более крупных пакетов, включая FBAT41 и QTDT42. PowerMarker43 и FamHap44 - это два пакета программного обеспечения для ассоциаций, нацеленных на то, чтобы быть относительно удобными для пользователей с реализациями графического интерфейса Windows. Объединение доказательств для связи между несколькими исследованиями может предоставить доказательства для репликации генетических эффектов.В частности, при проведении GWAS, где объем обрабатываемых результатов велик, зачастую после завершения первичного анализа или метаанализа требуется больше информатики.Непосредственной задачей является отображение результатов (например, WGAViewer45, GWAS GUI46, AssociationViewer47), в частности, региональных LD и графиков ассоциации, которые могут быть сгенерированы с помощью SNAP через веб-интерфейс2 или популярный инструмент Haploview48. Рассмотрение таких графиков может быть полезным при оценке приблизительных границ генома, которые могут содержать функциональные варианты. Идентификация сильно связанных вариантов и вариантов в LD информирует о необходимости проведения дальнейших исследований, таких как повторное секвенирование, молекулярные эксперименты с генами-кандидатами в регионе, а также прогнозирование и проверка потенциальных функциональных вариантов. Прогнозирование «функциональных SNP» является активной и развивающейся областью биоинформатики SNP. 3.3 Программы, направленные на «предсказание» фенотипа, присущего тем или инымSNPСуществует множество программ, направленных на определение результата нуклеотидных замен, вплоть до структуры белка-транскрипта. Ниже будут перечислены некоторые из них.SIFT-сервер -это онлайн-сервер биоинформатики, который используется для прогнозирования повреждающего эффекта замещения нуклеотидов и сдвига фрейма (вставки / удаления) на функцию белка.Для этого инструмента кодирование SNP и Indels были отделены от общего количества и представлены в виде идентификационных номеров rs для SNP (несоответствие, бессмысленность и усиление при остановке) и в качестве расположения хромосом для Indels.[29] PolyPhen-2-онлайнсервер, автоматически прогнозирует nsSNP, которые влияют на структуру аминокислотного замещения и функцию белка, используя сравнительный метод.PolyPhen осуществляет поиск белковых 3D-структур и осуществляет множественные выравнивания гомологичных последовательностей и аминокислотных контактов в нескольких белковых базах данных и рассчитывает независимые оценки положения (PSIC) для каждого из двух вариантов, а затем вычисляет разницу PSIC-оценок между двумя вариантами, где более высокая разница в баллах PSIC указывает на то, что функциональное влияние аминокислотного замещения может иметь место. I-Mutant версии 3.0 представляет собой набор машин опорных векторов, основанных на предикторах, интегрированных в уникальный веб-сервер. Это дает возможность прогнозировать изменения стабильности белка при изменениях в одном сайте из структуры или последовательности белка. Результат I-Mutant рассчитывается следующим образом: DDG <0: уменьшить стабильность, DDG> 0: повысить стабильность или DDG = 0: нейтрально.ЗаключениеВ настоящий момент большое распространение в практике клинициста приобретают генетические методы диагностики. Они позволяют расширить представление о патогенезе заболеваний, применять более эффективные методы лечения, обнаруживать дополнительные воздействующие на пациента факторы риска. Генетическое типирование пока что не входит в рутинную практику диагностики и расчета степени риска развития ишемической болезни сердца, но судя по данным исследований, проведенных на большой выборке, эта методика перспективна и ее использование потенциально способно снизить смертность от сердечно-сосудистых осложнений.Изучение генома невозможно представить без использования биоинформационных программ различной направленности: базы данных олигонуклеотидных замен, моделирование изменений структуры белка, программное обеспечение для интерпретации генетического анализа. Наибольшую значимость в изучении SNP, ассоциированных и ишемической болезнью сердца имеют программы последней категории ввиду своей практической направленности.Выводы:Влияние на функцию генов локуса INK4/ARF вызывает и развитие атеросклеротического поражения сосудов, и онкологические заболевания, что говорит о схожести определенных моментов патогенеза этих заболеваний. Наиболее перспективным направлением разработки биоинформационных программ является прогнозирование «генов-кандидатов» ишемической болезни сердца.Возможно использование генетического тестирования с целью выявления степени риска развития ишемической болезни сердца и назначения наиболее эффективного лечения. Список литературыБаженова О., О'Брайен С. Применение биоинформатики в медицинских исследованиях // Здоровье – основа человеческого потенциала: проблемы и пути их решения. 2014. №1. Горбунова Виктория Николаевна Генетика и эпигенетика синтропных заболеваний // Экологическая генетика. 2010. №4. Иноземцева Анастасия Анатольевна, Барбараш Ольга Леонидовна Возможности применения генетических полиморфизмов липидных нарушений для оценки тяжести ишемической болезни сердца // МвК. 2015. №2.Кукава Н.Г., Титов Б.В., Осьмак Г.Ж., Матвеева Н.А., Кулакова О.Г., Фаворов А.В., Шахнович Р.М., Руда М.Я., Фаворова О.О. Мультилокусный анализ генетической предрасположенности к инфаркту миокарда у русских: репликационное исследование // ActaNaturae (русскоязычная версия). 2017. №4 (35). Малыгина Н.А., Костомарова И.В., Мелентьев И.А., Мелентьев А.С., Вершинин А.А., Серова Л.Д. МОЛЕКУЛЯРНО-ГЕНЕТИЧЕСКИЕ МАРКЕРЫ ДЛЯ ПРОГНОЗА ТЕЧЕНИЯ ИШЕМИЧЕСКОЙ БОЛЕЗНИ СЕРДЦА У БОЛЬНЫХ СТАРШИХ ВОЗРАСТНЫХ ГРУПП. Российский кардиологический журнал. 2009Artieda M, Gañán A, Cenarro A, et al. Association and linkage disequilibrium analyses of APOE polymorphisms in atherosclerosis. DisMarkers. 2008;24(2):65–72. Baudhuin LM. Genetics of coronary artery disease: focus on genome-wide association studies. Am J TranslRes. 2009;1(3):221–234. Published 2009 Mar 5.Elosua R. The Genetics of Ischemic Heart Disease: From Current Knowledge to Clinical Implications. The State of Cardiovascular Genomics: Abundant Data, Limited Information.RevEspCardiol. 2017;70:696-810Enas A.E, Lipoprotein(a): An independent, genetic, and causal factor for cardiovascular disease and acute myocardial infarction. Indian Heart JournalVolume 71, Issue 2, March–April 2019, Pages 99-112Feng Zhang, Yulan Lu, Sijia Yan, Qinghe Xing, Weidong Tian, SPRINT: an SNP-free toolkit for identifying RNA editing sites, Bioinformatics, Volume 33, Issue 22, 15 November 2017, Pages 3538–3548Frikke-Schmidt R., Genetic Variation in ABCA1 Predicts Ischemic Heart Disease in the General Population. Arteriosclerosis, Thrombosis, and Vascular Biology. 2008;28:180–186Guerini, Franca R. PhDa,;Ripamonti, Enrico PhDa; Costa, Andrea S. PhD.The Syntaxin-1A gene single nucleotide polymorphism rs4717806 associates with the risk of ischemic heart disease. Medicine, June 2019 - Volume 98 - Issue 24. Haver VG, Verweij N, Kjekshus J, et al. The impact of coronary artery disease risk loci on ischemic heart failure severity and prognosis: association analysis in the COntrolledROsuvastatinmultiNAtional trial in heart failure (CORONA). BMC Med Genet. 2014;15:140. Published 2014 Dec 21Hubachek J.A. Rs6922269 marker at the MTHFD1L gene predict cardiovascular mortality in males after acute coronary syndrome.Molecular Biology Reports, 2015, Volume 42, Number 8, Page 1289Johnson A.D., Single-Nucleotide Polymorphism Bioinformatics. Circulation: Cardiovascular Genetics. 2009;2:530–536Kawakami K.,The apolipoprotein E genotype influences the risk for vasospastic angina. Can J Cardiol. 2001 Jun;17(6):660-6.Lanktree M, Oh J, Hegele RA. Genetic testing for atherosclerosis risk: inevitability or pipe dream?. Can J Cardiol. 2008;24(11):851–854. doi:10.1016/s0828-282x(08)70194.-6Lee D, Xu IM, Chiu DK, et al. Folate cycle enzyme MTHFD1L confers metabolic advantages in hepatocellular carcinoma. J Clin Invest. 2017;127(5):1856–1872. Mohamed M. Hassan, Shaza E. Omer, Rahma M. Khalf-allah, Razaz Y. Mustafa, Isra S. Ali, and Sofia B. Mohamed, “Bioinformatics Approach for Prediction of Functional Coding/Noncoding Simple Polymorphisms (SNPs/Indels) in Human BRAF Gene,” Advances in Bioinformatics, vol. 2016, Article ID 2632917, 15 pages, 2016.Moore K.J. Scavenger Receptors in Atherosclerosis. Arteriosclerosis, Thrombosis, and Vascular Biology. 2006;26:1702–1711Nikulina S, Artyukhov I, Shesternya P, et al. Clinical application of chromosome 9p21.3 genotyping in patients with coronary artery disease. Exp Ther Med. 2019;18(4):3100–3108. doi:10.3892/etm.2019.7884Palmer BR, Slow S, Ellis KL, et al. Genetic polymorphism rs6922269 in the MTHFD1L gene is associated with survival and baseline active vitamin B12 levels in post-acute coronary syndromes patients. PLoS One. 2014;9(3):e89029. Published 2014 Mar 11. Samadi S., Farjami Z.,Rare P376L variant in the SR-BI gene associates with HDL dysfunction and risk of cardiovascular disease; Clinical Biochemistry, Volume 73, November 2019, Pages 44-49Seal A., Gupta A.,Tools, resources and databases for SNPs and indels in sequences: a review? International Journal of Bioinformatics Research and Applications? №10, 2014Stengård JH, Frikke-Schmidt R, Tybjaerg-Hansen A, Nordestgaard BG, Sing CF. Variation in 5' promoter region of the APOE gene contributes to predicting ischemic heart disease (IHD) in the population at large: the Copenhagen City Heart Study. Ann Hum Genet. 2007;71(Pt 6):762–771. Sun V.Y, Effects of Genetic Variants Associated with Familial Hypercholesterolemia on Low-Density Lipoprotein-Cholesterol Levels and Cardiovascular Outcomes in the Million Veteran Program. Genomic and Precision Medicine. 2018;11Tashkenbaeva Eleonora Negmatovna, TogaevDilshodKhidirnazarovich, ZiyadullaevShukhratKhudayberdievich Study of relation of polymorphism gene glut9 with coronary heart disease associated asymptomatic hyperuricemia in Uzbek population // European science review. 2016. №9-10. Yamada Y, Ichihara S, Nishida T. Molecular genetics of myocardial infarction. Genomic Med. 2008;2(1-2):7–22. doi:10.1007/s11568-008-9025-x
1. Баженова О., О'Брайен С. Применение биоинформатики в медицинских исследованиях // Здоровье – основа человеческого потенциала: проблемы и пути их решения. 2014. №1.
2. Горбунова Виктория Николаевна Генетика и эпигенетика синтропных заболеваний // Экологическая генетика. 2010. №4.
3. Иноземцева Анастасия Анатольевна, Барбараш Ольга Леонидовна Возможности применения генетических полиморфизмов липидных нарушений для оценки тяжести ишемической болезни сердца // МвК. 2015. №2.
4. Кукава Н.Г., Титов Б.В., Осьмак Г.Ж., Матвеева Н.А., Кулакова О.Г., Фаворов А.В., Шахнович Р.М., Руда М.Я., Фаворова О.О. Мультилокусный анализ генетической предрасположенности к инфаркту миокарда у русских: репликационное исследование // ActaNaturae (русскоязычная версия). 2017. №4 (35).
5. Малыгина Н.А., Костомарова И.В., Мелентьев И.А., Мелентьев А.С., Вершинин А.А., Серова Л.Д. МОЛЕКУЛЯРНО-ГЕНЕТИЧЕСКИЕ МАРКЕРЫ ДЛЯ ПРОГНОЗА ТЕЧЕНИЯ ИШЕМИЧЕСКОЙ БОЛЕЗНИ СЕРДЦА У БОЛЬНЫХ СТАРШИХ ВОЗРАСТНЫХ ГРУПП. Российский кардиологический журнал. 2009
6. Artieda M, Gañán A, Cenarro A, et al. Association and linkage disequilibrium analyses of APOE polymorphisms in atherosclerosis. DisMarkers. 2008;24(2):65–72.
7. Baudhuin LM. Genetics of coronary artery disease: focus on genome-wide association studies. Am J TranslRes. 2009;1(3):221–234. Published 2009 Mar 5.
8. Elosua R. The Genetics of Ischemic Heart Disease: From Current Knowledge to Clinical Implications. The State of Cardiovascular Genomics: Abundant Data, Limited Information.RevEspCardiol. 2017;70:696-810
9. Enas A.E, Lipoprotein(a): An independent, genetic, and causal factor for cardiovascular disease and acute myocardial infarction. Indian Heart Journal
10. Volume 71, Issue 2, March–April 2019, Pages 99-112
11. Feng Zhang, Yulan Lu, Sijia Yan, Qinghe Xing, Weidong Tian, SPRINT: an SNP-free toolkit for identifying RNA editing sites, Bioinformatics, Volume 33, Issue 22, 15 November 2017, Pages 3538–3548
12. Frikke-Schmidt R., Genetic Variation in ABCA1 Predicts Ischemic Heart Disease in the General Population. Arteriosclerosis, Thrombosis, and Vascular Biology. 2008;28:180–186
13. Guerini, Franca R. PhDa,;Ripamonti, Enrico PhDa; Costa, Andrea S. PhD.The Syntaxin-1A gene single nucleotide polymorphism rs4717806 associates with the risk of ischemic heart disease. Medicine, June 2019 - Volume 98 - Issue 24.
14. Haver VG, Verweij N, Kjekshus J, et al. The impact of coronary artery disease risk loci on ischemic heart failure severity and prognosis: association analysis in the COntrolledROsuvastatinmultiNAtional trial in heart failure (CORONA). BMC Med Genet. 2014;15:140. Published 2014 Dec 21
15. Hubachek J.A. Rs6922269 marker at the MTHFD1L gene predict cardiovascular mortality in males after acute coronary syndrome.Molecular Biology Reports, 2015, Volume 42, Number 8, Page 1289
16. Johnson A.D., Single-Nucleotide Polymorphism Bioinformatics. Circulation: Cardiovascular Genetics. 2009;2:530–536
17. Kawakami K.,The apolipoprotein E genotype influences the risk for vasospastic angina. Can J Cardiol. 2001 Jun;17(6):660-6.
18. Lanktree M, Oh J, Hegele RA. Genetic testing for atherosclerosis risk: inevitability or pipe dream?. Can J Cardiol. 2008;24(11):851–854. doi:10.1016/s0828-282x(08)70194.-6
19. Lee D, Xu IM, Chiu DK, et al. Folate cycle enzyme MTHFD1L confers metabolic advantages in hepatocellular carcinoma. J Clin Invest. 2017;127(5):1856–1872.
20. Mohamed M. Hassan, Shaza E. Omer, Rahma M. Khalf-allah, Razaz Y. Mustafa, Isra S. Ali, and Sofia B. Mohamed, “Bioinformatics Approach for Prediction of Functional Coding/Noncoding Simple Polymorphisms (SNPs/Indels) in Human BRAF Gene,” Advances in Bioinformatics, vol. 2016, Article ID 2632917, 15 pages, 2016.
21. Moore K.J. Scavenger Receptors in Atherosclerosis. Arteriosclerosis, Thrombosis, and Vascular Biology. 2006;26:1702–1711
22. Nikulina S, Artyukhov I, Shesternya P, et al. Clinical application of chromosome 9p21.3 genotyping in patients with coronary artery disease. Exp Ther Med. 2019;18(4):3100–3108. doi:10.3892/etm.2019.7884
23. Palmer BR, Slow S, Ellis KL, et al. Genetic polymorphism rs6922269 in the MTHFD1L gene is associated with survival and baseline active vitamin B12 levels in post-acute coronary syndromes patients. PLoS One. 2014;9(3):e89029. Published 2014 Mar 11.
24. Samadi S., Farjami Z.,Rare P376L variant in the SR-BI gene associates with HDL dysfunction and risk of cardiovascular disease; Clinical Biochemistry, Volume 73, November 2019, Pages 44-49
25. Seal A., Gupta A.,Tools, resources and databases for SNPs and indels in sequences: a review? International Journal of Bioinformatics Research and Applications? №10, 2014
26. Stengård JH, Frikke-Schmidt R, Tybjaerg-Hansen A, Nordestgaard BG, Sing CF. Variation in 5' promoter region of the APOE gene contributes to predicting ischemic heart disease (IHD) in the population at large: the Copenhagen City Heart Study. Ann Hum Genet. 2007;71(Pt 6):762–771.
27. Sun V.Y, Effects of Genetic Variants Associated with Familial Hypercholesterolemia on Low-Density Lipoprotein-Cholesterol Levels and Cardiovascular Outcomes in the Million Veteran Program. Genomic and Precision Medicine. 2018;11
28. Tashkenbaeva Eleonora Negmatovna, TogaevDilshodKhidirnazarovich, ZiyadullaevShukhratKhudayberdievich Study of relation of polymorphism gene glut9 with coronary heart disease associated asymptomatic hyperuricemia in Uzbek population // European science review. 2016. №9-10.
29. Yamada Y, Ichihara S, Nishida T. Molecular genetics of myocardial infarction. Genomic Med. 2008;2(1-2):7–22. doi:10.1007/s11568-008-9025-x
Вопрос-ответ:
Какие молекулярные механизмы влияют на формирование ишемической болезни сердца?
Формирование ишемической болезни сердца связано с разными молекулярными механизмами, такими как нарушение обмена липидов, реактивное кислородное образование, воспаление, апоптоз (программированная гибель клеток) и др.
Какие полиморфизмы ассоциированы с ишемической болезнью сердца?
Существует несколько полиморфизмов, связанных с ишемической болезнью сердца, включая полиморфизмы, локализованные в хромосоме 9р21, полиморфизмы, связанные с увеличением содержания ЛПНП и холестерина, а также другие полиморфные варианты.
Какие биоинформатические инструменты используются для анализа генетического полиморфизма?
Для анализа генетического полиморфизма используются различные биоинформатические инструменты, включая базы данных генетических вариаций, программы для анализа последовательностей ДНК и белков, а также программы для моделирования и предсказания влияния полиморфизмов на функциональность молекул.
Какие молекулярные механизмы связаны с увеличением содержания ЛПНП и холестерина?
Увеличение содержания ЛПНП и холестерина в организме может быть связано с нарушением обмена липидов, дефектами в генетической информации, а также с изменениями в работе ферментов и рецепторов, ответственных за метаболизм липидов и холестерина.
Какие еще полиморфные варианты могут быть связаны с ишемической болезнью сердца?
Помимо полиморфизмов в хромосоме 9р21 и полиморфизмов, связанных с увеличением содержания ЛПНП и холестерина, существует ряд других полиморфных вариантов, которые могут быть ассоциированы с ишемической болезнью сердца. Например, полиморфизмы в генах, связанных с воспалительными процессами или апоптозом.
Какие молекулярные механизмы формируют ишемическую болезнь сердца?
Ишемическая болезнь сердца (ИБС) формируется за счет различных молекулярных механизмов, включая нарушение кровоснабжения сердечной мышцы из-за атеросклеротического сужения коронарных артерий, воспалительные процессы в сосудистой стенке, дисбаланс между оксидантами и антиоксидантами, повреждение ДНК и активацию апоптоза, а также другие факторы.
Какие полиморфизмы связаны с ИБС?
Существует несколько полиморфизмов, которые были ассоциированы с ИБС. В частности, полиморфизмы, локализованные в хромосоме 9p21, связаны с повышенным риском развития ИБС. Также были выявлены полиморфизмы, связанные с увеличением содержания ЛПНП и холестерина в крови, что также является фактором риска для ИБС. Кроме того, существуют другие полиморфные варианты, которые могут влиять на развитие ИБС.
Какие биоинформатические инструменты используются для анализа генетического полиморфизма связанного с ИБС?
Для анализа генетического полиморфизма, связанного с ИБС, используются различные биоинформатические инструменты. В частности, используются базы данных полиморфизмов, такие как dbSNP и dbVar, которые содержат информацию о генетических вариантах, включая те, которые ассоциированы с ИБС. Также применяются различные алгоритмы и методы анализа, такие как ассоциационный анализ, машинное обучение и функциональная аннотация генетических вариантов.