Bioinformatika
Bioinformatika je vědní disciplína, která se zabývá metodami pro shromažďování, analýzu a vizualizaci rozsáhlých souborů biologických dat, zejména dat molekulárně-biologických.
Předmětem zájmu a používanými metodami se bioinformatika prolíná s dalšími příbuznými obory, např. molekulární biologií, genomikou, proteomikou, genetikou, výpočetní biologií, matematickou biologií, systémovou biologií, teoretickou biologií, biomedicínskou informatikou, biomedicínským inženýrstvím, výpočetní chemií, informatikou a počítačovou lingvistikou.
Typická data
- Sekvence proteinů a nukleových kyselin (DNA, RNA)
- Struktura makromolekul (hlavně proteinů)
- Údaje o aktivitě a expresi genů
- Údaje o funkcích genů a jejich produktů
- Údaje o interakcích mezi proteiny a DNA
Práce bioinformatika
- in silico, tj. práce či simulace na počítači, na rozdíl od práce na živých organismech v přirozených (in vivo) či laboratorních (in vitro) podmínkách
- práce s velkými objemy dat
- vyhledávání subsekvencí v datech
- srovnávání podobných sekvencí, analýza sekvencí
- snaha předpovídat strukturu a funkci proteinů
- výsledky analýz zobrazovat graficky
- dynamické modelování
- užitečná pro biology, lékaře, právníky, policisty, konzumenty GMO
Dostupné bioinformatické nástroje a databáze jsou shromážděny v Tools and Data Services Registry[1] (bio.tools) evropské bioinformatické infrastruktury ELIXIR. České bioinformatické nástroje a databáze v bio.tools sdružuje konsorcium ELIXIR-CZ.
Oblasti bioinformatického výzkumu
Anotace genomu
Snaha o nacházení genů, míst interakce s proteiny a dalších významných oblastí v sekvenci DNA je nazývána anotací genomu. Zabývá se jí více vědních oborů, především molekulární biologie. Bioinformatika se snaží na základě vlastností laboratorně (např. sekvenováním mRNA) nalezených oblastí předpovědět pozice dalších oblastí výpočetními metodami. U prokaryot lze s úspěchem použít metody založené na znalostech vlastností promotorů a dalších hraničních oblastí genů, tzv. ab initio metody. U eukaryot je použití těchto metod náročnější, protože mají mnohem složitější strukturu genomu. Dalšími často volenými nástroji jsou pravděpodobnostní modely (např. Skryté Markovovy Modely (Hidden Markov modelss) či metody strojového učení (Vhodné jsou např. support vector machines).
Sekvenční analýzy
Základním úkonem, potřebným v mnoha bioinformatických aplikacích, je zarovnání sekvencí a analýza jejich podobnosti (sequence alignment), povětšinou se jedná o sekvence nukleových kyselin či aminokyselin v bílkovině. Několik sekvencí je třeba nejdříve přiložit k sobě tak, aby si prvky na jednotlivých pozicích co nejvíce odpovídaly a bylo tak možné vyhodnotit míru podobnosti. Základními algoritmy pro tento úkon jsou Smith-Waterman a Needleman-Wunsch. Při hledání a porovnávání dlouhých sekvencí na úrovni genomu je třeba využívat jisté heuristiky, protože základní algoritmy jsou příliš pomalé. Příkladem programu pro rychlé vyhledávání na dlouhých sekvencích s využitím heuristiky je BLAST.
Analýzy úrovně genové exprese
Molekulární biologové laboratorními metodami měří úroveň exprese jistých genů, tedy jaké množství mRNA je z daného genu v daném období transkribováno. Často používanými metodami jsou reverzní transkripce do cDNA (metoda EST), microarray či SAGE (serial analysis of gene expression). Výsledky těchto analýz jsou rozsáhlé soubory dat s velkou úrovní šumu, bioinformatika data upravuje do použitelné podoby.
Analýzy genové regulace
Reakce buňky na změny v prostředí jsou z velké části založeny na genové regulaci. Komplexním systémem informačních drah je informace o podnětu z vnějšího prostředí (např. hormon nebo podnět z chemoreceptoru) přenesena do jádra, kde ovlivní míru exprese jednotlivých genů. Buňka tak začne produkovat proteiny, potřebné v dané situaci. Bioinformatika zkoumá principy této regulace. Je například možné porovnat microarray data z buňky v běžném stavu a buňky vystavené vlivu léčiva a zjistit tak přesně, které geny byly léčivem ovlivněny. Analýza genové regulace je velmi důležitou součástí výzkumu rakoviny.
Předpověď struktury proteinů
Struktura proteinu z velké části determinuje její funkci, proto je jeho znalost důležitá. Experimentální zjištění tohoto tvaru (např. pomocí rentgenové krystalografie) je však drahé, pomalé a ne vždy možné. Proto se bioinformatika snaží získat prostorové uspořádání proteinů jinak.
Primární strukturu proteinu (pořadí aminokyselin) lze jednoduše získat například sekvenací mRNA pro daný protein. Sekundární, terciární (popř. kvarterní) strukturu se bioinformatika a teoretická chemie snaží předpovědět na základě znalosti primární struktury. Používaných technik je mnoho, základní přístupy jsou tyto:
- Využití fyzikálně-chemických vlastností jednotlivých aminokyselin či molekul - tzv. ab initio metody (například snaha určit celkovou energii, jakou molekula potřebuje pro zaujetí určitého tvaru a najít tvar s minimální potřebnou energií)
- Využití biologických znalostí - například předpověď struktury proteinu na základě znalosti struktury proteinu z homologního genu či proteinu s podobnou funkcí
- Využití experimentálně zjištěných tvarů proteinů - především metody strojového učení
- Kombinace několika z těchto přístupů
Zatímco při předpovědi sekundární struktury bývá dosaženo poměrně dobrých výsledků, (Současné metody mají úspěšnost přes 70%) předpověď terciární struktury je náročnější a méně přesná.
Srovnávací genomika
Srovnávací genomika se snaží porozumět vztahům genů či jiných částí genomu napříč organismy a lépe tak porozumět procesu evoluce, případně přispět k anotaci genomů na základě znalostí vztahů mezi nimi. Jelikož genomy jsou rozsáhlé a mají složitou strukturu, vyžaduje tvorba srovnávacích syntenických map hlubší analýzu a automatizaci výpočtů.
Bioinformatický software
Jedním z často využívaných open source programů na analýzu bioinformatických dat je například RStudio, který využívá programovacího jazyka R. S vcelku přátelským GUI (grafickým uživatelským rozhraním) je mnohostranně využitelný, ať už se jedné o exprese genů, fylogenetickou analýzu či DNA alignmenty. Jednou ze základních metod na zobrazení právě exprese genů fylogeneze je například teplotní mapa.
Vědecké časopisy
- Applied Bioinformatics
- Bioinformatics
- BMC Bioinformatics
- Briefings in Bioinformatics
- In Silico Biology
- Nucleic Acids Research - hlavně pravidelná speciální čísla o bioinformatických nástrojích, či databázích
- Journal of Bioinformatics, Biology and Computational Biology
- PLoS Computational Biology
Vědecké a zájmové společnosti
Bioinformatika v Česku
Obor Bioinformatiky lze studovat na několika vysokých školách:
- Fakulta informatiky Masarykovy univerzity nabízí bakalářský i navazující magisterský obor Bioinformatika v rámci programu Aplikovaná informatika[2]
- Přírodovědecká fakulta Masarykovy univerzity nabízí bakalářský i navazující magisterský obor Bioinformatika a chemoinformatika v rámci programu Biochemie[3]
- Vysoká škola chemicko-technologická v Praze spolu s Fakultou informačních technologií ČVUT, Ústavem molekulární genetiky a Ústavem organické chemie a biochemie AV ČR nabízejí společný bakalářský a navazující magisterský obor Bioinformatika[4]
- Přírodovědecká fakulta Univerzity Palackého nabízí bakalářský i navazující magisterský obor Bioinformatika na Katedře Informatiky ve spolupráci s katedrami Biochemie a Fyzikální chemie[5]
- Fakulta informačních technologií VUT v Brně nabízí navazující magisterský program Bioinformatika a biocomputing[6]
- Fakulta elektrotechniky a komunikačních technologií VUT v Brně nabízí bakalářský i navazující magisterský program Biomedicínská technika a bioinformatika[7]
- Fakulta elektrotechnická ČVUT nabízí obor Biomedicínská informatika v rámci programu Biomedicínské inženýrství a informatika[8]
- Přírodovědecká fakulta a Matematicko-fyzikální fakulta Univerzity Karlovy v Praze nabízí studijní program Bioinformatika[9]
Paranormální jevy
Pojem bioinformatika lze najít i literatuře zabývající se paranormálními jevy, kde je tímto termínem myšleno mimosmyslové vnímání.[10]
Literatura
- Fatima Cvrčková, Úvod do praktické bioinformatiky, Academia, ISBN 80-200-1360-1, 2006 (1. vydání)
- Marketa Zvelebil, Jeremy Baum, Understanding Bioinformatics, Garland Science, ISBN 978-0-8153-4024-9, 2007 (1. vydání)
- Dan E. Krane, Fundamental concepts of Bioinformatics, Benjamin Cummings, ISBN 0-8053-4633-3
- Jean-Michel Claverie, Bioinformatics for dummies, ISBN 0-7645-1696-5
Reference
- https://bio.tools/. bio.tools [online]. [cit. 2016-09-20]. Dostupné online.
- Studijní katalog FI MU Brno
- Studijní obor Bionformatika a chemoinformatika. www.muni.cz [online]. [cit. 2014-04-09]. Dostupné v archivu pořízeném dne 2014-04-13.
- http://studuj.bioinformatiku.cz/
- Studijní obory Katedry Informatiky UPOL
- Studijní obor Bioinformatika a biocomputing na FIT VUT v Brně
- Propagační web oboru Biomedicínská technika a bioinformatika na FEKT VUT v Brně. jdi.na.biomedicinu.cz [online]. [cit. 2011-01-11]. Dostupné v archivu pořízeném dne 2010-01-11.
- Biomedicína - Biomedicínské Inženýrství a Informatika na FEL ČVUT Praha. biomedicina.fel.cvut.cz [online]. [cit. 2011-01-11]. Dostupné v archivu pořízeném dne 2011-01-14.
- http://bioinformatika.mff.cuni.cz/
- Přehlížené přiznání na esoterické encyklopedii. sirver.neutral.cz [online]. [cit. 2007-10-17]. Dostupné v archivu pořízeném dne 2009-04-11.