Биоинформатиката е интердисциплинарна научна област која се занимава со развивање на методи и софтверски алатки за обработка на биолошките податоци. Како интердисциплинарна научна област, таа ги обединува биологијата, информатиката, информатичкото инженерство, математиката и статистиката за анализа и толкување на биолошките податоци. Биоинформатиката се користи за in silico анализи на биолошки проблеми со употреба на математички и статистички техники.

Мапа на човековиот X хромозом (од Националниот центар за биотехнолошки информации - National Center for Biotechnology Information).

Биоинформатиката е сеопфатен термин за сите биолошки истражувања кои користат компјутерско програмирање како дел од нивната методологија, а, исто така, претставува и синоним за одредени анализи кои постојано се користат, особено во областа на геномиката. Типични примери за примена на биоинформатиката се идентификацијата на гени и еднонуклеотидни полиморфизми (анг. single nucleotide polymorphisms, SNPs). Често, оваа идентификација се користи со цел подобро да се разбере генетската основа на одредена болест, уникатни адаптации, посакувани особини (посебно кај земјоделските видови) или разлики меѓу популациите. На помалку формален начин, биоинформатиката, исто така, се обидува да ги разбере организациските принципи во низите на нуклеинските киселини и белковините.[1]

Вовед уреди

Биоинформатиката стана важен дел во многу области од биологијата. Во експерименталната молекуларна биологија, биоинформатичките техники, како што се обработката на слики и сигнали, овозможуваат екстракција на корисни резултати од големи количества на необработени податоци. Во областа на генетиката и геномиката, таа помага во секвенционирањето и анотацијата на геномите и нивните мутации. Таа игра улога во аналитиката на текстот на биолошката литература и развојот на биолошки и генетски онтологии за организација и пребарување на биолошки податоци. Таа, исто така, игра улога во анализата на генската експресија и регулација. Биоинформатичките алатки помагаат во споредбата на генетските и геномските податоци и во разбирањето на еволутивните аспекти на молекуларната биологија. На поинтегративно ниво, таа помага во анализата и категоризацијата на биолошки патишта и мрежи кои се важен дел од системската биологија. Во структурната биологија, таа помага во симулацијата и моделирањето на ДНК,[2] РНК,[2][3] белковините,[4] како и на биомолекуларните интеракции.[5][6][7][8]

Историја уреди

Историски гледано, терминот биоинформатика не го имал истото значење кое го има денес. Полина Хогевег и Бен Хеспер го измислиле овој термин во 1970 година за да го именуваат проучувањето на информациските процеси во биолошките системи.[9][10][11] Оваа дефиниција ја сместила биоинформатиката како научно поле паралелно со биохемијата (проучувањето на хемиските процеси во биолошките системи).[9]

Низи уреди

 
Низите на генетскиот материјал често се користат во биоинформатиката и полесно се обработуваат компјутерски отколку мануелно.

По одредувањето на аминокиселинската низа на инсулинот во раните 1950-ти години, од страна на Фредерик Сангер, употребата на компјутерите во молекуларната биологија станала од суштинско значење. Мануелното споредување на повеќе низи се покажало многу непрактично. Пионер во областа на биоинформатиката била американскиот физички хемичар Маргарет Оукли Дејхоф.[12] Таа ја изградила една од првите бази на податоци за белковински низи, првично објавена во форма на книги.[13] Маргарет Оукли Дејхоф ги вовела и методите за порамнување на низите, кои се од клучно значење во молекуларната еволуција.[14] Друг кој дал голем придонес во полето на биоинформатиката бил Елвин А. Кебат, кој во 1970 година бил пионер во анализата на биолошките низи.[15]

Цели уреди

Полето на биоинформатиката еволуирало како резултат на потребата од анализа и интерпретација на растечкиот број на биолошки податоци. Биолошките податоци ги вклучуваат нуклеотидните и аминокиселинските низи, белковинските домени, белковинските структури и структурите на нуклеинските киселини.[16] Самиот процес на анализа и интерпретација на податоците се нарекува сметачка биологија. Важни поддисциплини во рамките на биоинформатиката и сметачката биологија се:

  • Развојот и имплементацијата на компјутерски програми кои овозможуваат ефикасен пристап до, употреба и управување со различни типови на информации
  • Развој на нови алгоритми (математички формули) и статистички методи кои ги проценуваат односите помеѓу членовите на големи групи од податоци. На пример, постојат методи за лоцирање на ген во рамките на одредена низа, методи за одредување на белковинска структура и/или функција и методи за класификација на белковинските низи во сродни фамилии.

Првичната цел на биоинформатиката е зголемување на нашето разбирање за биолошките процеси. Она што ја одделува од другите биолошки дисциплини е фокусот кон развивањето и примената на компјутерските техники за постигнување на оваа цел. Примери вклучуваат: препознавање на обрасци, податочно рударење, алгоритми за машинско учење и визуелизација. Главни истражувачки напори во биоинформатиката се: порамнување на низи, предвидување на гени, асемблирање на низи, дизајнирање на лекови, откривање на лекови, порамнување на белковински структури,предвидување на структурата на белковините, предвидување на генската експресија, белковина-белковина интеракции, проучување на геномските асоцијации, моделирање на еволуцијата и клеточната делба.

Биоинформатиката го вклучува создавањето и усовршувањето на базите на податоци, алгоритмите, сметачките и статистичките техники за решавање на формалните и практичните проблеми кои произлегуваат од управувањето и анализата на биолошките податоци.

Во текот на изминатите неколку децении, брзиот развој во полето на геномиката и другите молекуларни технологии и паралелниот развој на информатичките технологии доведе до експлозија на нови податоци од полето на молекуларната биологија. Биоинформатиката всушност ги опфаќа сите математички и компјутерски пристапи кои служат за систематизација, анализа и интерпретација на сите овие нови биолошки податоци.

Чести активности во биоинформатиката се мапирањето и анализата на нуклеинските и белковинските низи, порамнувањето на ДНК и белковинските низи да се изврши споредба, како и создавањето и прикажувањето на тридимензионални модели на белковински структури.

Однос со другите научни полиња уреди

Биоинформатиката е научна област која е слична, но одделна од биолошкото сметање, додека често се смета синонимна со сметачката биологија. Биолошкото сметање користи биоинженерството и биологијата за изградба на биолошки компјутери, додека биоинформатиката користи пресметки за подобро разбирање на биолошките процеси. Биоинформатиката и сметачката биологија вклучуваат анализа на биолошки податоци, посебно на ДНК, РНК и белковински низи. Областа на биоинформатиката доживеала експлозивен раст од средината на 1990-тите години, во голема мера поради Проектот за човечкиот геном и поради брзиот напредок во технологијата за ДНК-низирање.

Анализата на биолошките податоци за добивање на разбирливи информации вклучува пишување и работа со софтверски програми кои користат алгоритми од теоријата на графови, вештачка интелигенција, софт компјутинг, податочно рударење, обработка на слики и компјутерска симулација. Овие алгоритми зависат од теоретски основи како што се дискретна математика, теорија на контрола, теорија на систем, теорија на информации и статистика.

Анализа на низи уреди

 
Низите на различни гени или белковини можат да бидат порамнети за да се испита нивната сличност.

По секвенцнирањето на геномот на бактериофагот Phi X 174 во 1977 година,[17] биле низирани геномите на илјадници други организми. Информацијата добиена од низите се анализира за да се откријат гените кои кодираат за белковини, РНК-гени, регулаторни низи, структурни мотиви и репетитивни низи. Споредбата на гените во рамките на еден вид или помеѓу различни видови може да укаже на сличности помеѓу функциите на белковините, или сродствените односи помеѓу видовите (употреба на молекуларна систематика за изградба на филогенетски дрва). Со зголемувањето на количеството на новодобиените податоци, стана сè повеќе непрактично мануелно да се анализираат ДНК-низите. Во денешно време, сметачките програми, како BLAST, секојдневно се користат за да се пребаруваат низите на повеќе од 260 000 организми, кои содржат над 190 милијарди нуклеотиди.[18] Овие програми можат да компензираат за мутации (сменети, избришани или вметнати бази) во ДНК-низата, а можат и да идентификуваат сродни низи. Една варијанта на порамнувањето на низите се користи и во самиот процес на секвенционирање.

Секвенционирање на ДНК уреди

Пред да може низите да се анализираат, тие треба да се добијат. Секвенционирањето на ДНК сѐ уште не е тривијален проблем бидејќи необработените податоци може да бидат бучни или да даваат слаби сигнали. Развиени се алгоритми за „повикување на бази“ за различните експериментални пристапи кон секвенционирањето на ДНК.

Асемблирање на низи уреди

Повеќето техники за секвенционирање на ДНК продуцираат кратки фрагменти од низата кои треба да бидат асемблирани (собрани) за да се добие комплетен ген или геном. Таканаречената техника на шотган секвенционирање (анг. Shotgun sequencing) генерира низи на илјадници мали ДНК фрагменти (чија должина се движи од 35 до 900 нуклеотиди, зависно од технологијата за секвенционирање). Краевите на овие фрагменти се преклопуваат и, кога се правилно подредени од страна на програма за асемблирање на геноми, можат да се користат за реконструкција на целиот геном. Шотган секвенционирањето е релативно брзо, но за големите геноми асемблирањето на фрагментите може да биде доста комплицирано. За големи геноми, како човечкиот, потребни се мултипроцесорни компјутери, а процесот може да потрае и денови на CPU време на голема меморија, а резултат сепак содржи бројни празнини кои потоа мора да бидат пополнети. Денес, шотган секвенционирањето е методот од избор за речиси сите геноми, а алгоритмите за асемблирање на геномот се критична област на истражување во биоинформатиката.

Анотација на геноми уреди

Во геномиката, анотацијата е процес на одбележување на гените и другите биолошки одлики во ДНК-низата. Овој процес треба да биде автоматизиран, бидејќи повеќето геноми се премногу големи за да бидат рачно анотирани. Анотацијата е возможна бидејќи гените имаат препознатливи старт и стоп региони, иако точната низа на овие региони може да варира помеѓу гените.

Првиот опис на систем за анотација на геноми бил објавен во 1995 година[19] од страна на тим при Институтот за истражување на геноми во САД, кои први извршиле комплетно секвенционирање и анализа на геномот на бактеријата Haemophilus influenzae.[19] Овен Вајт дизајнирал и изградил софтверски систем за идентификација на гените кои кодираат белковини, транспортни РНК-молекули, рибозомни РНК молекули и за првични функционални назначувања. Повеќето денешни системи за анотација на геноми функционираат на сличен начин, но програмите за анализа на геномската ДНК постојано се менуваат и подобруваат.

Сметачка еволутивна биологија уреди

Еволутивна биологија е наука за потеклото на видовите, како и нивната промена со текот на времето. Информатиката се покажала како корисно средство за биолозите кои ја изучуваат еволуцијата, бидејќи им овозможила да:

  • ја следат еволуцијата на голем број на организми со мерење на промени во нивната ДНК,
  • споредуваат цели геноми, што го овозможува проучувањето на покомплексни еволутивни настани, како што се генска дупликација, хоризонтален пренос на гени и предвидувањето на факторите кои се важни во бактериската видообразба,
  • изградат комплексни компјутерски модели на популациона генетика за да се предвиди исходот на системот со текот на времето,[20]
  • следат и споделуваат информации за голем број на видови на организми.

Компаративна геномика уреди

Сржта на компаративна анализа на геноми е воспоставување на врска помеѓу гени (анализа на ортологија) или други геномски одлики кај различни организми. Токму овие интергеномски мапи овозможуваат да се откријат еволутивните процеси одговорни за дивергенција на два генома. Комплексноста на еволуцијата на геномот претставува голем предизвик за развивачите на математички модели и алгоритми, кои имаат на располагање цел спектар на алгоритамски, статистички и математички техники, кои варираат од егзактни, евристички, алгоритми со фиксни параметри и апроксимациони алгоритми за проблеми кои се засноваат на модели на парсимонија, до MCMC (анг. Markov chain Monte Carlo) алгоритми за Бајесова анализа на проблеми засновани на пробабилистички модели.

Многу од овие студии се засновани на детекцијата на низна хомологност за класификација на низите во белковински фамилии.[21]

Пан геномика уреди

Пан геномика е концепт кој бил воведен во 2005 година од страна на Тетелин и Медини и оттогаш се изучува во биоинформатиката. Пан геном е целосниот генски репертоар на одредена таксономска група: иако првично се применувал за блиску сродни видови, може да се примени и за родови, колена итн. Поделен е на - јадрен геном: збир на гени кои се заеднички за сите проучувани геноми (најчесто гени од витално значење за опстанокот) и флексибилен геном: збир на гени кои не се присутни во сите проучувани геноми. Биоинформатичката алатка BPGA може да се користи за да се одликува пан геномот на бактериски видови.[22]

Експресија на гени и белковини уреди

Анализа на генска експресија уреди

Експресијата на многу гени може да се утврди со мерења на нивоата на иРНК со повеќе техники, вклучувајќи ДНК микрочипови, EST (од анг. expressed sequence tag) секвенционирање, SAGE (од анг. Serial analysis of gene expression) секвенционирање, MPSS (од анг. Massively parallel signature sequencing), RNA-Seq, позната и како WTSS (од анг. whole transcriptome shotgun sequencing), или со различни апликации на in situ хибридизација. Сите овие техники се многу склони на бучава и/или подлежат на пристрасност во биолошкото мерење, па затоа голема истражувачка област во сметачката биологија вклучува развој на статистички алатки за одделување на сигналите од бучавата во студиите за експресија на гени.[23]

Анализа на белковинска експресија уреди

Белковинските микрочипови и HT (анг. high throughput) масената спектрометрија (MS) може да дадат информации за белковините присутни во даден биолошки примерок. Во биоинформатиката се проучуваат податоците кои се добиваат со овие методи. Локализацијата на белковини во ткиво може да се изведе со помош на афинитетна протеомика прикажана како просторни податоци врз основа на имунохистохемија и ткивни микрочипови.[24]

Анализа на регулација уреди

Регулацијата е комплексна оркестрација на настани со кои даден сигнал, обично вонклеточен хормон, на крајот води кон зголемување или намалување на активноста на еден или повеќе белковини. За изучување на различни чекори од овој процес се користат голем број на биоинформатички методи.

Анализа на клеточна организација уреди

Неколку пристапи се развиени за да се анализира локацијата на органелите, гените, белковините и други компоненти на клетките. Ова е битно бидејќи локацијата на овие компоненти влијае на процесите во клетката и на тој начин помага во предвидувањето на однесувањето на биолошките системи.

Структурна биоинформатика уреди

 
Тридимензионалните белковински структури, како оваа, се чест предмет на биоинформатички анализи.

Многу значајна област во биоинформатиката е предвидувањето на структурата на белковините. Аминокиселинската низа на дадена белковина, т.н. првична структура, лесно може да се утврди од низата на генот кој ја кодира таа белковина. Во поголемиот број на случаи, првичната структура на белковината ја одредува нејзината нативна тридимензионална структура. Познавањето на оваа структура е од суштинско значење за разбирањето на функцијата на белковината. Структурните информации за една белковина обично се класифицираат како информации за неговата вторична, третична и четвртична структура.

Една од клучните идеи во биоинформатиката е идејата за хомологија. Во геномската гранка на биоинформатиката, хомологијата се користи за да се предвиди функцијата на даден ген: ако низата на генот А, чија функција е позната, е хомологна на низата на генот Б, чија функција е непозната, може да се заклучи дека Б има иста функција со А. Во структурната гранка на биоинформатиката, хомологијата се користи за да се утврди кои делови од белковината се важни за формирање на структурата и интеракцијата со други белковини. Во техниката која се нарекува хомологно моделирање, овие информации се користат за да се предвиди структурата на одредена белковина доколку е позната структурата на неговата хомологна белковина. Во моментов оваа техника останува единствениот начин за точно предвидување на белковинските структури.

Други техники за предвидување на структурата на белковините вклучуваат protein threading и de novo (од нула) физичко моделирање.

Мрежна и системска биологија уреди

 
Интеракциите помеѓу белковините често се визуелизираат и анализираат со употреба на мрежи.

Мрежната анализа се обидува да ги разбере односите во рамките на биолошките мрежи. Иако биолошките мрежи може да се конструираат од една молекула или ентитет (како што се гени), мрежната биологија честопати се обидува да интегрира многу различни типови на податоци, како што се белковини, мали молекули, податоци за експресија на гени, итн., кои се поврзани физички, функционално, или и двете.

Системската биологија подразбира употреба на компјутерски симулации на клеточните подсистеми (како што се мрежите на метаболити и ензими кои го чинат метаболизмот, патеки за пренос на сигнали и генетски регулаторни мрежи) за да ги анализираат и визуелизираат сложените врски на овие клеточни процеси.

Други полиња на истражување уреди

Други полиња на истражување на биоинформатиката вклучуваат: анализа на литература, анализа на слики, анализа на податоци за поединечни клетки, информатика на биоразновидност и интеграција на онтологии и податоци.

Бази на податоци уреди

Базите на податоци се од суштинско значење за истражувањата и апликациите на биоинформатиката. Постојат повеќе бази на податоци, кои покриваат различни типови на информации: на пример, ДНК и белковински низи, молекуларни структури, фенотипови и биоразновидност. Базите на податоци можат да содржат емпириски податоци (добиени директно од експерименти), предвидени податоци (добиени од анализи) или, најчесто, и двете. Тие можат да бидат специфични за одреден организам, метаболички пат или молекула од интерес. Алтернативно, тие можат да инкорпорираат податоци собрани од повеќе други бази на податоци. Овие бази на податоци се разликуваат во нивниот формат, механизмот за пристап и дали се јавни или не.

Некои од најчесто користените бази на податоци се наведени подолу.

  • За употреба во анализа на биолошки низи: Genbank, UniProt
  • За употреба во структурна анализа: Protein Data Bank (PDB)
  • За употреба во пронаоѓање на белковински фамилии и мотиви: InterPro, Pfam
  • За употреба во следната генерација на секвенционирање: Sequence Read Archive
  • За употреба во мрежна анализа: Metabolic Pathway Databases (KEGG, BioCyc), Interaction Analysis Databases, Functional Networks
  • За употреба во дизајнот на синтетички генетски кола: GenoCAD

Софтвер и алатки уреди

Софтверските алатки за биоинформатиката се движат од едноставни алатки на командната линија, до посложени графички програми и самостојни веб-услуги достапни од различни биоинформатички компании или јавни институции.

Софтвер за биоинформатика со отворен код уреди

Многу бесплатни и со отворен код софтверски алатки за биоинформатика постоеле уште од 1980-тите години и нивниот број постојано расте.[25] Комбинацијата на континуирана потреба за нови алгоритми за анализа на новите видови биолошки отчитувања, потенцијалот за иновативни in silico експерименти и слободно достапните бази со отворен код помогнаа да се создадат можности за сите истражувачки групи да придонесат и за биоинформатиката и за опсегот на достапен софтвер со отворен код, без оглед на начинот на финансирање. Алатките со отворен код честопати делуваат како инкубатори на идеи, или приклучоци (plug-in) поддржувани од заедницата во комерцијални апликации. Тие, исто така, можат да обезбедат de facto стандарди и заеднички предметни модели за да помогнат во предизвикот на интеграцијата на биоинформациите.

Софтверски пакети со отворен код вклучуваат наслови како што се: Bioconductor, BioPerl, Biopython, BioJava, BioJS, BioRuby, Bioclipse, EMBOSS, .NET Bio, Orange (софтвер) со биоинформатичките add-on, Apache Taverna, UGENE и GenoCAD. За одржување на оваа традиција и да се создадат понатамошни можности, непрофитната Open Bioinformatics Foundation[25] ги имаат поддржано годишните BOSC (Bioinformatics Open Source Conference) од 2000 година.[26]

Поврзано уреди

Наводи уреди

  1. Lesk, A. M. (26 July 2013). „Bioinformatics“. Encyclopaedia Britannica. Посетено на 17 April 2017.
  2. 2,0 2,1 Sim, A. Y. L.; Minary, P.; Levitt, M. (2012). „Modeling nucleic acids“. Current Opinion in Structural Biology. 22 (3): 273–278. doi:10.1016/j.sbi.2012.03.012. PMC 4028509. PMID 22538125.
  3. Dawson, W. K.; Maciejczyk, M.; Jankowska, E. J.; Bujnicki, J. M. (2016). „Coarse-grained modeling of RNA 3D structure“ (PDF). Methods. 103: 138–156. doi:10.1016/j.ymeth.2016.04.026. PMID 27125734.
  4. Kmiecik, S.; Gront, D.; Kolinski, M.; Wieteska, L.; Dawid, A. E.; Kolinski, A. (2016). „Coarse-Grained Protein Models and Their Applications“. Chemical Reviews. 116 (14): 7898–936. doi:10.1021/acs.chemrev.6b00163. PMID 27333362.
  5. Wong, K. C. (2016). Computational Biology and Bioinformatics: Gene Regulation. CRC Press/Taylor & Francis Group. ISBN 9781498724975.
  6. Joyce, A. P.; Zhang, C.; Bradley, P.; Havranek, J. J. (2015). „Structure-based modeling of protein: DNA specificity“. Briefings in Functional Genomics. 14 (1): 39–49. doi:10.1093/bfgp/elu044. PMC 4366589. PMID 25414269.
  7. Spiga, E.; Degiacomi, M. T.; Dal Peraro, M. (2014). „New Strategies for Integrative Dynamic Modeling of Macromolecular Assembly“. Во Karabencheva-Christova, T. (уред.). Biomolecular Modelling and Simulations. Advances in Protein Chemistry and Structural Biology. 96. Academic Press. стр. 77–111. doi:10.1016/bs.apcsb.2014.06.008. ISBN 9780128000137. PMID 25443955.
  8. Ciemny, Maciej; Kurcinski, Mateusz; Kamel, Karol; Kolinski, Andrzej; Alam, Nawsad; Schueler-Furman, Ora; Kmiecik, Sebastian (2018-05-04). „Protein–peptide docking: opportunities and challenges“. Drug Discovery Today (англиски). 23 (8): 1530–1537. doi:10.1016/j.drudis.2018.05.006. ISSN 1359-6446. PMID 29733895.
  9. 9,0 9,1 Hogeweg P (2011). Searls, David B. (уред.). „The Roots of Bioinformatics in Theoretical Biology“. PLoS Computational Biology. 7 (3): e1002021. Bibcode:2011PLSCB...7E2021H. doi:10.1371/journal.pcbi.1002021. PMC 3068925. PMID 21483479.
  10. „Bioinformatica: een werkconcept“. 1 (6). Kameleon. 1970: 28–29. Наводот journal бара |journal= (help)
  11. Hogeweg P (1978). „Simulating the growth of cellular forms“. Simulation. 31 (3): 90–96. doi:10.1177/003754977803100305.
  12. Moody, Glyn (2004). Digital Code of Life: How Bioinformatics is Revolutionizing Science, Medicine, and Business. ISBN 978-0-471-32788-2.
  13. Dayhoff, М. К. (1966) Атлас на белковини редослед и структура. Националната Биомедицински Истражувања Фондацијата, 215 pp.
  14. „Evolution of the structure of ferredoxin based on living relics of primitive amino Acid sequences“. Science. 152 (3720): 363–6. 1966. Bibcode:1966Sci...152..363E. doi:10.1126/science.152.3720.363. PMID 17775169.
  15. „Kabat Database and its applications: 30 years after the first variability plot“. Nucleic Acids Res. 28 (1): 214–218. January 2000. doi:10.1093/nar/28.1.214. PMC 102431. PMID 10592229.
  16. „Concepts, Historical Milestones and the Central Place of Bioinformatics in Modern Biology: A European Perspective“. Bioinformatics – Trends and Methodologies. InTech. 2011. Архивирано од изворникот на 2012-01-25. Посетено на 8 Jan 2012.
  17. „Nucleotide sequence of bacteriophage phi X174 DNA“. Nature. 265 (5596): 687–95. February 1977. Bibcode:1977Natur.265..687S. doi:10.1038/265687a0. PMID 870828.
  18. „GenBank“. Nucleic Acids Res. 36 (Database issue): D25–30. January 2008. doi:10.1093/nar/gkm929. PMC 2238942. PMID 18073190.
  19. 19,0 19,1 „Whole-genome random sequencing and assembly of Haemophilus influenzae Rd“. Science. 269 (5223): 496–512. July 1995. Bibcode:1995Sci...269..496F. doi:10.1126/science.7542800. PMID 7542800.
  20. Carvajal-Rodríguez A (2012). „Simulation of Genes and Genomes Forward in Time“. Current Genomics. 11 (1): 58–61. doi:10.2174/138920210790218007. PMC 2851118. PMID 20808525.
  21. Carter, N. P.; Fiegler, H.; Piper, J. (2002). „Comparative analysis of comparative genomic hybridization microarray technologies: Report of a workshop sponsored by the Wellcome trust“. Cytometry, Part A. 49 (2): 43–8. doi:10.1002/cyto.10153. PMID 12357458.
  22. Chaudhari Narendrakumar M., Kumar Gupta Vinod, Dutta Chitra (2016). „BPGA-an ultra-fast pan-genome analysis pipeline“. Scientific Reports. 6: 24373. Bibcode:2016NatSR...624373C. doi:10.1038/srep24373. PMC 4829868. PMID 27071527.CS1-одржување: повеќе имиња: список на автори (link)
  23. Grau, J.; Ben-Gal, I.; Posch, S.; Grosse, I. (1 July 2006). „VOMBAT: prediction of transcription factor binding sites using variable order Bayesian trees“ (PDF). Nucleic Acids Research. 34 (Web Server): W529–W533. doi:10.1093/nar/gkl212. PMC 1538886. PMID 16845064. Архивирано од изворникот (PDF) на 2018-09-30. Посетено на 2018-11-12.
  24. „The Human Protein Atlas“. www.proteinatlas.org. Посетено на 2017-10-02.
  25. 25,0 25,1 „Open Bioinformatics Foundation: About us“. Official website. Open Bioinformatics Foundation. Посетено на 10 May 2011.
  26. „Open Bioinformatics Foundation: BOSC“. Official website. Open Bioinformatics Foundation. Посетено на 10 May 2011.

Литература уреди

Надворешни врски уреди