Semantic Scholar

(Пренасочено од S2CID)

Semantic Scholar (изг. Семантик сколар) — пребарувачка алатка за академска литература поддржана од вештачка интелигенција разработена од Аленовиот институт за вештачка интелигенција и пуштена во ноември 2015 г.[1] Се служи со напредокот во обработката на природните јазици за резимирање на научни трудови.[2] Екипата на Semantic Scholar активно ја истражува промената на вештачка интелигенција во обработката на природни јазици, машинското учење, односот човек-сметач и пребарувањето на информации.[3]

Semantic Scholar
Вид место
пребарувач
СоздавачАленов институт за вештачка интелигенција
Адресаsemanticscholar.org
Пуштеноноември 2015 (2015-11)

Овој пребарувач започнал како база на податоци која опфаќа теми како информатиката, геонауката и невронауката.[4] Меѓутоа, во 2017 г. системот во својот корпус почнал да вклучува биомедицинска литература.[4] Во септември 2022 г. опфаќал преку 200 милиони публикации од сите научни полиња.[5]

Технологија

уреди

Semantic Scholar дава еднореченично резиме на научна литература. Една од неговите цели е да го реши проблемот со читање на многубројни наслови и долги извадоци на мобилни уреди.[6] Настојува да осигура читателски пристап до трите милиони научни трудови кои се објавуваат годишно, земајќи предвид дека само половина од литературата воопшто се чита.[7]

Вештачката интелигенција ја доловува суштината на трудот користејќи изводна техника.[2] Проектот се служи со комбинација од машинско учење, обработка на природни јазици и машински вид за да додаде слој на семантичка анализа во традиционалните методи на цитатна анализа и да ги извади релевантните бројки, табели, единици и места од трудовите.[8][9]

За разлика од Google Scholar и PubMed, Semantic Scholar е предвиден да ги истакнува најважните и највлијателните елементи на трудот.[10] Вештачката интелигенција ги препознава скриените врски помеѓу истражувачките теми.[11] Како претходно споменатите пребарувачи, Semantic Scholar исто така се користи со графовски структури, вклучувајќи ги Microsoft Academic Knowledge Graph, SciGraph на Springer Nature и Semantic Scholar Corpus.[12]

Секој труд во Semantic Scholar има единствена назнака наречена Semantic Scholar Corpus ID (скрат. S2CID). Еве една ставка за пример:

Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (март 2020). „The reproductive number of COVID-19 is higher compared to SARS coronavirus“. Journal of Travel Medicine. 27 (2). doi:10.1093/jtm/taaa021. PMID 32052846. S2CID 211099356.

Semantic Scholar е бесплатен, и за разлика од сличните пребарувачи (на пр. Google Scholar) не пребарува материјал кој се наплаќа.[13][4]

Во едно споредбено проучување утврдено е дека истражувачките способности на Semantic Scholar преку систематски приод даваат 98,88 % точност на исходот при откривање на податоците.[13] Во истото проучување разгледани се други функции на Semantic Scholar, како алатките за извидување на метаподатоци и неколку цитатни алатки.[13]

Број на корисници и публикации

уреди

Во јануари 2018 г., откако претходната година е спроведен проект за ставање на биомедицински трудови и тематски резимеа, корпусот на Semantic Scholar опфаќал преку 40 милиони трудови од област ана информатиката и биомедицината.[14] Во март 2018 г. за предводник на Semantic Scholar е назначен Даг Рејмонд, разработувач на машинското учење за подлогата Amazon Alexa.[15] Во август 2019 г. бројот на метаподатоци во опфатените трудови (не самите PDF-ови) нараснал на 173 милиони[16] по додавањето на записите на Microsoft Academic Graph.[17] Во 2020 г. е склучено партнерство меѓу Semantic Scholar и издаваштвото на Чикашкиот универзитет, со кое сите написи од тоа издаваштво се ставени во корпусот на Semantic Scholar.[18] На крајот од 2020 г. Semantic Scholar имал индексирано 190 милиони трудови.[19]

Во 2020 г. Semantic Scholar достигнал 7 милиони корисници месечно.[6]

Поврзано

уреди

Наводи

уреди
  1. Eunjung Cha, Ariana (3 ноември 2015). „Paul Allen's AI research group unveils program that aims to shake up how we search scientific knowledge. Give it a try“. The Washington Post. Архивирано од изворникот 6 ноември 2019. Посетено на 3 ноември 2015.
  2. 2,0 2,1 Hao, Karen (18 ноември 2020). „An AI helps you summarize the latest in AI“. MIT Technology Review (англиски). Посетено на 12 февруари 2021.
  3. „Semantic Scholar Research“. research.semanticscholar.org. Посетено на 22 ноември 2021.
  4. 4,0 4,1 4,2 Fricke, Suzanne (12 јануари 2018). „Semantic Scholar“. Journal of the Medical Library Association (англиски). 106 (1): 145–147. doi:10.5195/jmla.2018.280. ISSN 1558-9439. S2CID 45802944.
  5. Matthews, David (1 септември 2021). „Drowning in the literature? These smart software tools can help“. Nature. Посетено на 5 септември 2022. ...the publicly available corpus compiled by Semantic Scholar — a tool set up in 2015 by the Allen Institute for Artificial Intelligence in Seattle, Washington — amounting to around 200 million articles, including preprints.
  6. 6,0 6,1 Grad, Peter (24 ноември 2020). „AI tool summarizes lengthy papers in a sentence“. Tech Xplore (англиски). Посетено на 12 февруари 2021.
  7. „Allen Institute's Semantic Scholar now searches across 175 million academic papers“. VentureBeat (англиски). 23 октомври 2019. Посетено на 16 февруари 2021.
  8. Bohannon, John (11 ноември 2016). „A computer program just ranked the most influential brain scientists of the modern era“. Science. doi:10.1126/science.aal0371. Архивирано од изворникот 29 април 2020. Посетено на 12 ноември 2016.
  9. Christopher Clark; Santosh Kumar Divvala (2016), PDFFigures 2.0: Mining figures from research papers, Proceedings of the 16th ACM/IEEE-CS on Joint Conference on Digital Libraries - JCDL '16Википодатоци Q108172042
  10. „Semantic Scholar“. International Journal of Language and Literary Studies. Посетено на 9 ноември 2021.
  11. Baykoucheva, Svetla (2021). Driving Science Information Discovery in the Digital Age (англиски). Chandos Publishing. стр. 91. ISBN 978-0-12-823724-3.
  12. Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo; Ferro, Nicola; Silva, Mário J.; Martins, Flávio (2020). Advances in Information Retrieval: 42nd European Conference on IR Research, ECIR 2020, Lisbon, Portugal, April 14–17, 2020, Proceedings, Part I (англиски). Cham, Switzerland: Springer Nature. стр. 254. ISBN 978-3-030-45438-8.
  13. 13,0 13,1 13,2 Hannousse, Abdelhakim (2021). „Searching relevant papers for software engineering secondary studies: Semantic Scholar coverage and identification role“. IET Software (англиски). 15 (1): 126–146. doi:10.1049/sfw2.12011. ISSN 1751-8814. S2CID 234053002 Проверете ја вредноста |s2cid= (help).
  14. „AI2 scales up Semantic Scholar search engine to encompass biomedical research“. GeekWire (англиски). 17 октомври 2017. Архивирано од изворникот 19 јануари 2018. Посетено на 18 јануари 2018.
  15. „Tech Moves: Allen Instititue Hires Amazon Alexa Machine Learning Leader; Microsoft Chairman Takes on New Investor Role; and More“. GeekWire. 2 мај 2018. Архивирано од изворникот 10 мај 2018. Посетено на 9 мај 2018.
  16. „Semantic Scholar“. Semantic Scholar. Архивирано од изворникот 11 август 2019. Посетено на 11 август 2019.
  17. „AI2 joins forces with Microsoft Research to upgrade search tools for scientific studies“. GeekWire. 5 декември 2018. Архивирано од изворникот 25 август 2019. Посетено на 25 август 2019.
  18. „The University of Chicago Press joins more than 500 publishers working with Semantic Scholar to improve search and discoverability“. RCNi Company Limited (англиски). Посетено на 22 ноември 2021.
  19. Dunn, Adriana (14 декември 2020). „Semantic Scholar Adds 25 Million Scientific Papers in 2020 Through New Publisher Partnerships“ (PDF). Semantic Scholar. Архивирано од изворникот (PDF) на 2021-11-15. Посетено на 22 ноември 2021.

Надворешни врски

уреди