Национален центар за биотехнолошки информации

 

Национален центар за биотехнолошки информации
Logo of National Center for Biotechnology Information
КратенкаНЦБИ
СедиштеБетесда, Мериленд
Службени јазициАнглиски
ДиректорСтивен Шери
(од 26 септември, 2022 година)
Матична организацијаМедицинска национална библиотека на САД
ПрипадностНационални инситути за здравје
Мреж. местоncbi.nlm.nih.gov

Националниот центар за биотехнолошки информации ( НЦБИ )[1][2] е дел од Националната медицинска библиотека на Соединетите Американски Држави (NLM), poddr на Националниот институт за здравје (NIH). Проектот е одобрен и финансиран од владата на Соединетите Американски Држави. НЦБИ се наоѓа во Бетесда, Мериленд и е основана во 1988 година од страна на конгресот како легислатива спонзорирана од страна на американскиот конгресмен Клод Пепер .

НЦБИ располага со низа на бази од податоци важни за биотехнологијата и биомедицината и е важна како ресурс за биоинформатичките алатки и услуги. Главните бази на податоци се GenBank за ДНК секвенци и PubMed, библиографска база на податоци за биомедицинска литература. Други бази на податоци ја вклучуваат и базата на податоци НЦБИ Епигеномика. Сите овие бази на податоци се достапни на семрежјето преку пребарувачот Entrez . НЦБИ е раководена од Дејвид Липман[2], еден од првите автори на програмата за усогласување на секвенците BLAST[3] и широко почитуван научник во биоинформатиката .

НЦБИ е задолжена за пристапноста до базата за ДНК секвенци позната како GenBank чие основање се случило во 1992 година.[4] GenBank е постојано соработува со поединечни лаборатории и други бази на податоци за секвенци, како што се Европската лабораторија за молекуларна биологија (EMBL) и Јапонската банка за ДНК податоци (DDBJ). [4]

Од 1992 година,НЦБИ нараснува со цел да се обезбедат други бази на податоци покрај GenBank. НЦБИ ја обезбедува базата на податоци за гени, Мрежно Менделово наследство кај човекот, базата на податоци за молекуларно моделирање (3D протеински структури), dbSNP (база на податоци за еднонуклеотидни полиморфизми ), збирка на појдовни секвенци,како мапирање на човечкиот геном и прелистувач за таксономијата, и го координира со Националниот институт за рак за да го обезбеди проектот за анатомија на геномот на ракот. НЦБИ доделува единствен препознавач (препознавачки број на таксономијата) за секој вид на организми.[5]

НЦБИ има софтверски алатки кои се достапни преку интернет прелистувачи или преку FTP. На пример, BLAST која е програма за пребарување сличности меѓу различните секвенци. BLAST може да прави споредби на секвенци со ДНК базата на GenBank и тоа за помалку од 15 секунди.

НЦБИ складиште

уреди

Складиштето на НЦБИ[6] е збирка од слободно достапни, мрежни верзии на избрани биомедицински книги. Складиштето опфаќа широк спектар на теми, вклучувајќи молекуларна биологија, биохемија, клеточна биологија, генетика, микробиологија, состојби на болеста од молекуларна и клеточна гледна точка, методи на истражување и вирусологија. Некои од книгите се мрежни верзии на претходно објавени книги, додека други, како што е Coffee Break, се напишани и уредени од вработените во НЦБИ. Складиштето за книги е дополнување на складиштето на Entrez PubMed од апстракти од рецензирани трудови, бидејќи содржините од складиштето обезбедуваат воспоставени гледишта за областите за проучување кои се развиваат и контекст во кој може да се организираат многу различни поединечни делови од пријавените истражувања.

Основна алатка за пребарување на локално порамнување (BLAST)

уреди

BLAST е алгоритам кој се користи за одредување на сличноста на секвенците помеѓу биолошките секвенци, како што се нуклеотидните секвенци на ДНК и аминокиселинските секвенци на протеини.[7]BLAST е моќна алатка за пронаоѓање на секвенци слични на низата за пребарување во ист организам или во други организми. Ја пребарува низата на прашања во базите на податоци и серверите на НЦБИ и ги објавува резултатите во прелистувачот на корисникот во избраниот формат. Влезните секвенци во BLAST се претежно во формат FASTA или GenBank, додека излезот може да се испорача во различни формати како што се HTML, XML форматирање и обичен текст. HTML е стандардниот излезен формат за мрежната страница на НЦБИ. Резултатите од НЦБИ-BLAST се претставени во графички облик со сите погодоци, табелите со препознавачите на секвенци за добиените податоци поврзани со бодувањето, заедно со порамнувања на секвенците од интерес и пронајдените податоци добиени од аналогни резултати добиени со BLAST.[8]

Системот за пребарување на вкрстени бази на податоци Entrez Global Query се користи во НЦБИ за сите главни бази на податоци како што се нуклеотидни и протеински секвенци, протеински структури, PubMed, таксономија, комплетни геноми, OMIM и неколку други.[9] Entrez е систем за заведување и пронаоѓање систем кој има податоци од различни извори за биомедицински истражувања. НЦБИ ја сподели првата верзија на Entrez во 1991 година, составена од нуклеотидни секвенци од PDB и GenBank, протеински секвенци од SWISS-PROT, пренесени како GenBank, PIR, PRF, PDB и поврзани апстракти и наводи од PubMed. Entrez е специјално осмислен да ги собере податоците од неколку различни извори, бази на податоци и формати во унифициран модел на информации и систем за пребарување што може ефикасно да ги пронајде важните наводи, секвенци и структури.[10]

Gene е воведен од НЦБИ за објаснување и организирање на информациите за гените. Служи како главен јазол во врската на геномската карта, изразувањето, низата, функцијата на протеини, структурата и хомолошките податоци. Единствена ознака GeneID е доделена на секој генетски запис што може да се следи преку циклуси на ревизија. Генитските записи за познати или предвидени гени се воспоставуваат во овој програм и се означени со позиции на картата или нуклеотидни секвенци. Gene има неколку предности во однос на неговиот претходник, LocusLink, вклучувајќи подобра вклученост со други бази на податоци во НЦБИ, со поширок таксономски опсег и подобрени опции за барање и пребарување обезбедени од системот Entrez.[11]

Белковини

уреди

Базата со податоци со белковини одржува текстуален запис за поединечни белковински секвенци, добиени од многу различни ресурси како што се проектот на НЦБИ (RefSeq), GenBank, PDB и UniProtKB/SWISS-Prot. Белковинските записи се присутни во различни облици, вклучувајќи FASTA и XML и се поврзани со други ресурси на НЦБИ. Белковините ги обезбедува важните податоци на корисниците како што се гени, низи на ДНК/РНК, биолошки низи, податоци за изразување и варијации и литература. Исто така, ги обезбедува однапред одредените групи на слични и еднакви белковини при секоја секвенца пресметана од BLAST. Базата на податоци за структура на НЦБИ содржи 3D координатни множества за експериментално определени структури во PDB кои се доведени од НЦБИ. Базата на податоци за зачуван домен ( CDD ) на белковини содржи низи на секвенци кои ги карактеризираат високо запазени домени во протеинските секвенци. Исто така, има записи од надворешни ресурси како SMART и Pfam. Постои уште една база на податоци за белковини позната како база на податоци за групации на белковини, која содржи множества на белковински секвенци кои се групирани според максималните порамнувања помеѓу поединечните секвенци пресметани со BLAST.[12]

База на податоци Pubchem

уреди

Базата на податоци PubChem на НЦБИ е можност за молекулите и нивните активности против биолошките анализи. PubChem може да се пребарува и да се пристапи преку системот за пронаоѓање информации Entrez.[13]

Поврзано

уреди

Наводи

уреди
  1. „The Human Genome Project“. The New York Times.
  2. 2,0 2,1 „Research Institute Posts Gene Data on Internet“. The New York Times. June 26, 1997.
  3. „Sense from Sequences: Stephen F. Altschul on Bettering BLAST“. 2000. Архивирано од изворникот на 2007-10-07.
  4. 4,0 4,1 Mizrachi, Ilene (22 August 2007). „GenBank: The Nucleotide Sequence Database“. The NCBI Handbook. National Center for Biotechnology Information (US). Архивирано од изворникот на May 18, 2023.
  5. „Home - Taxonomy“. NCBI. Архивирано од изворникот на Feb 16, 2024.
  6. „Home - Books“. NCBI. Посетено на 2019-06-12.
  7. Altschul Stephen; Gish Warren; Miller Webb; Myers Eugene; Lipman David (1990). „Basic local alignment search tool“. Journal of Molecular Biology. 215 (3): 403–410. doi:10.1016/s0022-2836(05)80360-2. PMID 2231712.
  8. Madden, T. (2013). „The BLAST Sequence Analysis Tool“. The NCBI Handbook (2nd. изд.). Bethesda, MD: National Center for Biotechnology Information.
  9. NCBI Resource Coordinators (2012). "Database resources of the National Center for Biotechnology Information". Nucleic Acids Research 41 (Database issue): D8–D20.
  10. Ostell J. (2002). The NCBI Handbook, 2nd edition, Chapter 15, The Entrez Search and Retrieval System
  11. Donna R. Maglott, Kim D. Pruitt & Tatusova T. (2005). The NCBI Handbook, 2nd edition, Chapter 19, Gene: A Directory of Genes
  12. Sayers E. (2013). The NCBI Handbook, 2nd edition, NCBI Protein Resources
  13. Wang Y. & Bryant S H. (2014). The NCBI Handbook, 2nd edition, NCBI PubChem BioAssay Database

Надворешни врски

уреди