KEGG ( Кјотошка енциклопедија на гените и геномите ) е збирка бази на податоци што се занимаваат со геноми, биолошки патеки, болести, лекови и хемиски супстанции . KEGG се користи за истражување и едукација на биоинформатиката, вклучително и анализа на податоците вогеномиката, метагеномиката, метаболиката и другите студии на омики, моделирање и симулација во биологијата на системите и истражување на превод во развојот на лекови .

KEGG
175px
Содржина
ОписBioinformatics resource for deciphering the genome.
ОрганизмиAll
Контакт
Истражувачки центарKyoto University
ЛабораторијаKanehisa Laboratories
Главен навод10592173
Објавена на1995
Пристап
Мреж. местоkegg.jp
URL на мреж. службаREST see KEGG API
Алатки
МрежноKEGG Mapper
Разно
KEGG
175px
Содржина
ОписИзвор на биоинформатика за дешифрирање на геномот.
ОрганизмиСите
Контакт
ЛабораторијаKanehisa Laboratories
Главен навод10592173
Објавена на1995
Пристап
Мреж. местоkegg.jp
URL на мреж. службаREST see KEGG API
Алатки
МрежноKEGG Mapper
Разно

ВоведУреди

Проектот за база на податоци KEGG беше инициран во 1995 година од Минору Канехиса, професор на Институтот за хемиски истражувања, универзитет во Кјото, во рамките на тогашната тековна јапонска програма за човечки геном .[1][2] Предвидувајќи ја потребата за компјутеризиран ресурс што може да се користи за биолошка интерпретација на податоците за секвенци на геноми, тој започнал да ја развива базата на податоци KEGG PATHWAY. Тоа е збирка мануелно нацртани мапи на патеки KEGG кои претставуваат експериментално знаење за метаболизмот и разни други функции на клетката и организмот . Секоја мапа на патеката содржи мрежа на молекуларни интеракции и реакции и е дизајнирана да ги поврзе гените во геномот (претежно протеини ) на патеката. Ова ја овозможи анализата наречена мапирање на патеката KEGG, при што содржината на генот во геномот се споредува со базата на податоци на KEGG PATHWAY за да се испита кои патеки и придружните функции веројатно ќе бидат кодирани во геномот.

Според програмерите, KEGG е „компјутерска репрезентација“ на биолошкиот систем .  Интегрира градежни блокови и жични дијаграми на системот - поточно, генетски градежни блокови на гени и протеини, хемиски градежни блокови на ситни молекулии и реакции, и жични дијаграми на молекуларна интеракција и мрежни реакции. Овој концепт се реализира во следните бази на податоци на KEGG, кои се категоризираат на системи, геномски, хемиски и здравствени информации.[3]

  • Информации за системи
    • ПАТВЕЈ - мапи на патеки за функции на клеточни и организми
    • МОДУЛ - модули или функционални единици на гените
    • БРИТЕ - хиерархиска класификација на биолошки ентитети
  • Геномски информации
    • ГЕНОМ - комплетни геноми
    • ГЕНИ - гени и протеини во целосните геноми
    • ОРТОЛОГИЈА - ортологни групи на гени во целосните геноми
  • Хемиски информации
  • Здравствени информации
    • БОЛЕСТ - човечки заболувања
    • ДРAГ - одобрени лекови
    • ЕНВИРОН - сурови лекови и супстанции поврзани со здравјето

Бази на податоциУреди

Информации за системиУреди

Базата на податоци на KEGG PATHWAY, базата на податоци за дијаграмот за жици, е јадрото на ресурсот KEGG. Тоа е збирка патеки мапи кои интегрираат многу субјекти, вклучително гени, протеини, РНК, хемиски соединенија, гликани и хемиски реакции, како и гени на болести и цели на лекови, кои се чуваат како индивидуални записи во другите бази на податоци на KEGG. Мапите на патеката се класифицираат во следниве делови:

Делот за метаболизам содржи естетски нацртани глобални карти, кои покажуваат целосна слика за метаболизмот, покрај редовните мапи на метаболички патеки. Глобалните мапи со ниска резолуција можат да се користат, на пример, за да се споредат метаболичките капацитети на различни организми во студиите за геномика и различни примероци од животната средина во студиите за метагеномика. Спротивно на тоа, KEGG модулите во базата на податоци KEGG MODULE се локализирани дијаграми за жици со поголема резолуција, што претставуваат построги функционални единици во картата на патеката, како што се под патеките конзервирани меѓу специфичните групи на организми и молекуларни комплекси. KEGG модулите се дефинирани како карактеристични генски множества што можат да се поврзат со специфични метаболички капацитети и други фенотипски карактеристики, така што ќе можат да се користат за автоматско толкување на податоците за геномот и метагеномот.

Друга база на податоци што ја надополнува KEGG PATHWAY е базата на податоци на KEGG BRITE. Тоа е онтолошка база на податоци што содржи хиерархиски класификации на различни ентитети, вклучувајќи гени, протеини, организми, болести, лекови и хемиски соединенија. Додека KEGG PATHWAY е ограничен на молекуларни интеракции и реакции на овие субјекти, КЕГГ БРИТЕ вклучува многу различни типови на врски.

Геномски информацииУреди

Неколку месеци по започнувањето на проектот КЕГГ во 1995 година, бил објавен првиот извештај за комплетно секвенцираниот бактериски геном.[4] Оттогаш, сите објавени целосни геноми се акумулираат во KEGG и за еукариотите и за прокариотите . Базата на податоци KEGG GENES содржи информации на ниво на гени / протеини и базата на податоци на KEGG GENOME содржи информации на ниво на организмот за овие геноми. Базата на податоци KEGG GENES се состои од генски сетови за целосни геноми, а на гени во секој сет им се дадени прибелешки во форма на воспоставување кореспонденции со дијаграмите за жици од мапите на патеките KEGG, модулите KEGG и BRITE хиерархиите.

Овие преписки се направени со употреба на концептот на ортолози . Мапите на патеката KEGG се подготвени врз основа на експериментални докази во специфични организми, но тие се дизајнирани да бидат применливи и за други организми, затоа што различни организми, како што се човекот и глувчето, честопати споделуваат идентични патишта што се состојат од функционално идентични гени, наречени ортолошки гени или ортолози. Сите гени во базата на податоци KEGG GENES се групирани како ортолози во базата на податоци на KEGG ORTHOLOGY (KO). Бидејќи на јазлите (генските производи) на мапите со патеки KEGG, како и модулите KEGG и BRITE хиерархиите, им се даваат идентификатори на КО, кореспонденциите се воспоставуваат откако гените во геномот се анонираат со идентификаторите КО со постапката за анотација на геном во KEGG.[3]

Хемиски информацииУреди

Мапите за метаболички патеки на KEGG се подготвени да ги претставуваат двојните аспекти на метаболичката мрежа: геномската мрежа за тоа како геномните кодирани од ензимите се поврзани со катализацијата на последователните реакции и хемиската мрежа за тоа како хемиските структури на подлоги и производи се трансформираат со овие реакции.[5] Збир на ензимски гени во геномот ќе ги идентификува мрежните мрежни ферментирања кога се надредени на мапите на патеката KEGG, кои, пак, ги карактеризираат мрежите за трансформација на хемиската структура, што овозможуваат интерпретација набиосинтетички и биоразградливи потенцијали на организмот. Алтернативно, збир на метаболити идентификувани во метаболот ќе доведе до разбирање на ензимските патеки и гените на ензимот.

Базите на податоци во категоријата хемиски информации, кои колективно се нарекуваат KEGG LIGAND, се организираат со опфаќање на знаењето за хемиската мрежа. Во почетокот на KEGG проектот, KEGG LIGAND се состоеше од три бази на податоци: KEGG COMPOUND за хемиски соединенија, KEGG REACTION за хемиски реакции и KEGG ENZYME за реакции во номенклатурата на ензимите.[6] Во моментов, постојат дополнителни бази на податоци: KEGG GLYCAN за гликани [7] и две помошни бази на податоци за реакција наречени RPAIR (усогласување на парните реактанти) и RCLASS (реакција класа).[8] KEGG COMPOUND, исто така, се прошири да содржи различни соединенија, како што се ксенобиотици, покрај метаболитите.

Здравствени информацииУреди

Кај KEGG, заболувањата се сметаат како нарушени состојби на биолошкиот систем предизвикани од вознемирувачи на генетски фактори и фактори на животната средина, а лековите се сметаат за различни видови на пертурбанти.[9] Базата на податоци на KEGG PATHWAY ги вклучува не само нормалните состојби, туку и нарушените состојби на биолошките системи. Сепак, мапите на патеките на болеста не можат да се подготват за повеќето болести затоа што молекуларните механизми не се добро разбрани. Алтернативен пристап е земен во базата на податоци KEGG DISEASE, која едноставно ги катализира познатите генетски фактори и факторите на заболувања во животната средина. Овие каталози на крајот може да доведат до поцелосни дијаграми на жици на болести.

Базата на податоци KEGG DRUG содржи активни состојки на одобрени лекови во Јапонија, САД и Европа. Тие се одликуваат со хемиски структури и / или хемиски компоненти и се поврзани со целни молекули, метаболизирачки ензими и други информации за молекуларна интеракција во мапите на патеките KEGG и хиерархиите BRITE. Ова овозможува интегрирана анализа на интеракции со лекови со геномски информации. Сурови лекови и други супстанции поврзани со здравјето, кои се надвор од категоријата на одобрени лекови, се чуваат во базата на податоци на KEGG ENVIRON. Базите на податоци во категоријата здравствени информации се колективно наречени KEGG MEDICUS, кој исто така вклучуваат пакет-инсерти на сите продадени лекови во Јапонија.

Модел на претплатаУреди

Во јули 2011 година, KEGG вовел модел на претплата за преземање FTP, како резултат на значителен прекин на владиното финансирање. KEGG продолжува да биде достапен слободно преку својата веб-страница, но моделот на претплата покрена дискусии за одржливоста на базите на податоци за биоинформатика.[10][11]

ПоврзаноУреди

  • База на податоци за компаративна токсикогеномика - CTD ги интегрира KEGG патеките со токсикогеномички и податоци за болести
  • ConsensusPathDB, молекуларна функционална база на податоци за интеракција, со интегрирање на информации од KEGG
  • Генетска онтологија
  • PubMed
  • Uniprot
  • База на податоци за болести на гените

НаводиУреди

  1. „KEGG: Kyoto Encyclopedia of Genes and Genomes“. Nucleic Acids Res. 28 (1): 27–30. 2000. doi:10.1093/nar/28.1.27. PMC 102409. PMID 10592173.
  2. Kanehisa M (1997). „A database for post-genome analysis“. Trends Genet. 13 (9): 375–6. doi:10.1016/S0168-9525(97)01223-7. PMID 9287494.
  3. 3,0 3,1 „Data, information, knowledge and principle: back to metabolism in KEGG“. Nucleic Acids Res. 42 (Database issue): D199–205. 2014. doi:10.1093/nar/gkt1076. PMC 3965122. PMID 24214961.
  4. „Whole-genome random sequencing and assembly of Haemophilus influenzae Rd“. Science. 269 (5223): 496–512. 1995. Bibcode:1995Sci...269..496F. doi:10.1126/science.7542800. PMID 7542800.
  5. Kanehisa M (2013). „Chemical and genomic evolution of enzyme-catalyzed reaction networks“. FEBS Lett. 587 (17): 2731–7. doi:10.1016/j.febslet.2013.06.026. PMID 23816707. |hdl-access= бара |hdl= (help)
  6. „LIGAND database for enzymes, compounds and reactions“. Nucleic Acids Res. 27 (1): 377–9. 1999. doi:10.1093/nar/27.1.377. PMC 148189. PMID 9847234.
  7. „KEGG as a glycome informatics resource“. Glycobiology. 16 (5): 63R–70R. 2006. doi:10.1093/glycob/cwj010. PMID 16014746.
  8. „Modular architecture of metabolic pathways revealed by conserved sequences of reactions“. J Chem Inf Model. 53 (3): 613–22. 2013. doi:10.1021/ci3005379. PMC 3632090. PMID 23384306.
  9. „KEGG for representation and analysis of molecular networks involving diseases and drugs“. Nucleic Acids Res. 38 (Database issue): D355–60. 2010. doi:10.1093/nar/gkp896. PMC 2808910. PMID 19880382.
  10. „The 2012 Nucleic Acids Research Database Issue and the online Molecular Biology Database Collection“. Nucleic Acids Res. 40 (Database issue): D1–8. 2012. doi:10.1093/nar/gkr1196. PMC 3245068. PMID 22144685.
  11. Hayden, EC (2013). „Popular plant database set to charge users“. Nature. doi:10.1038/nature.2013.13642.

Надворешни врскиУреди