Машинско преведување: Разлика помеѓу преработките

[проверена преработка][проверена преработка]
Избришана содржина Додадена содржина
с Робот: Автоматизирана замена на текст (-== Видете исто така == +== Поврзано ==)
Vlad5250 (разговор | придонеси)
Нема опис на уредувањето
Ред 1:
'''Машинското преведување''', (скрат. '''МП'''), е дел од [[сметачка лингвистика|сметачката лингвистика]] која го истражува користењето на [[програмска опрема|компјутерскиот софтвер]] за [[преведување]] на текст или говор од еден [[природен јазик]] на друг. На основно ниво, МП извршува едноставна [[замена]] на зборови од еден природен јазик со зборови од друг јазик. Со користење на [[корпускорпусна лингвистикилингвистика|корпус]] техниките, може да се постигне посложено преведување, овие техники допуштаат подобра манипулација со разликите во [[лигвистичкатајазична типологија|лингвистичката типологија]], [[препознавање]] на фрази, превод на [[идиома|идиоми]], како и изолација на аномалии.
 
Сегашниот софтвер за машинско преведување најчесто овозможува преведување во потесни домени или [[професија|професии]] (како што се [[метеорологија|временски прогнози и извештаи]]) — на тој начин што е ограничен опсегот на можни замени на зборовите. Оваа техника посебно е ефективна во домени каде се користи формален јазик. Исто така машински преведени текстови на владини или други правни документи може да бидат од корист за разлика од помалку стандардизирани текстови.
 
Подобрен превод може да се постигне доколку во процесот на преведување се интервенира од страна на човекот: пример некои системи се способни да преведуваат многу подобро ако од страна на човекот се [[word sense disambiguation|определи]] кои зборови во текстот се именки. Со помош на овие техники, МП се покажало како корисна алатка при преведување од страна на човекот, во многу мал број на случаи, може да се добие превод кој може да се користи таков каков што е даден (пример временска прогноза).
Ред 11:
Практичниот напредок во ова поле бил многу побавен, така по [[ALPAC|ALPAC извештајот]] во 1966 г., се востановило дека десетгодишните истражувања не вродиле со плод и не ги оствариле очекувањата. Со тоа финансирањето на ваквии проекти било значително намалено. На почетокот од 1980 г., како резултат на зголемената моќ на сметачите и нивната се помала цена, се зголемува и интересот за [[статистичко машинско преведување|статистичките модели на машинско преведување]].
 
Идејата за користење на дигиталните сметачи за преведување на природните јазици била изложена на почетокот од 1946 г. од страна на [[Ендрју Доналд Бут]] (Andrew Donald Booth) и други. Џорџтаун експериментот секако дека е прва апликација од овој вид, а треба да се има предвид и демонстрацијата направена 1954 г. на [[APEXC]] машината на [[Универзитет Биркбек од Лондон|Биркбек колеџот]] за основно преведување од англиски на француски јазик. Објавени се неколку статии на оваа тема во некои популарни журнали (како например ''[[Wireless World]]'', септември 1955, Cleave and Zacharov). Слична апликација, исто така направена за првпат на Биркбек колеџот во тоа време, била и апликацијата за читање и создавање на [[брајов текст]] со помош на [[сметач]].
 
== Процес на преведување ==
{{Main|Процес на преведување}}
[[Процес на преведување|Процесот на преведување]] може да се дефинира како:
# [[Декодирање]] на [[значење (лингвистика)|значењето]] на [[изворен текст|изворниот текст]]; и
# Ре-[[енкодирање]] на ова [[значење (лингвистика)|значење]] на [[целен јазик|целниот јазик]].
 
Во позадина на оваа едноставно опишана процедура лежи комплексна [[спознание|когнитивна]] операција. За да се декодира значењето на [[изворен текст|изворниот текст]] во целост, преведувачот мора да ги интерпретира и анализира сите својства на текстот, процес кој бара длабоки познавања на [[граматикатаграматика]]та, [[семантика]]та, [[синтакса]]та, [[идиом]]ите, и.т.нитн., на [[изворниот јазик]], како и [[културатакултура]]та на неговите говорници. Преведувачот треба да има исти така длабоки познавања за да го ре-енкодира значењето на [[целниот јазик]].
 
Тука лежи предизвикот во машинското преведување: како да се програмира сметачот за да може да го „разбере“ текстот како што тоа го разбира човекот, и ќе „создаде“ нов текст во [[целен јазик|целниот јазик]] кој ќе „звучи“ како да бил напишан од човек.
Ред 28:
[[Податотека:Direct translation and transfer translation pyramind mk.svg|мини|десно|300п|Пирамида со споредбени длабочини на of intermediary representation. [[Меѓујазично машинско преведување|Меѓујазичното машинско преведување]] е најгоре, по што доаѓа преносното, па непосредното.]]
 
Машинското преведување може да се користи со методот кој се заснива на [[ЕксперсткиЕкспертен систесистем|лингвистички правила]], според кои зборовите би биле преведувани на лингвистички начин — најсоодветни (усно изговорени) зборови на целниот јазик кои ќе ги заменат оние во изворниот јазик.
 
Честопати се расправало дека успехот на машинското преведување бара прво да се реши прболемот на [[обработка на природен јазик|разбирањето на природниот јазик]].
 
Општо, методите кои се засниваат на правила, го парсираат текстот, вообичаено создавајќи посредна, симболичка претстава, од каде во наредната фаза се создава текстот во целниот јазик. Со оглед на природата на посредната претсавапретстава, пристапот е опишан како [[меѓујазично машинско преведување]] или [[transfer-based машинско преведување]]. Овие методи бараат богати [[лексиконилексикон]]и со [[морфологија (лингвистика)|морфолошки]], [[синтакса|синтаксни]] и [[семантика|сематичкисемантички]] информации, како и голем број на правила.
 
Ако има доволно податоци, програмите за машинско преведување честопати даваат задоволителни резултати за [[мајчин јазик|роден говорник]] на еден јазик да го свати приближното значење на тоа што било напишано од страна на другиот роден говорник. Проблемот е да се соберат доволен број на вистински податоци за да се подржи овој метод. Пример, голем мултијазичен [[Текстуален корпус|корпус]] на податоци потребен за фунционирање на статистичките методи не е потребен за методите кои се потпираат на граматиката. Но тогаш, граматичките методи бараат вешт лингвист внимателно да ја дизајнира граматиката која се користи.
 
За преведување помеѓу блиски јазици, може да се користи техниката наречена [[shallow-transfer машинско преведување]].
Ред 40:
== Поврзано ==
* [[Споредба на апликации за машинско преведување]]
* [[Вештачка интелегенцијаинтелигенција]]
* [[Сметачка лингвистика]]
* [[Универзален мрежен јазик]]