Cum funcționează programul de traducere?

Se bazează pe un algoritm de traducere - o secvență de acțiuni clar și strict definite asupra textului pentru a găsi potriviri într-o anumită pereche de limbi L1 - L2 pentru o anumită direcție de traducere (de la o anumită limbă la alta). Dicționarele convenționale și gramaticile din diferite limbi nu sunt aplicabile pentru traducerea automată, deoarece descriu semnificațiile cuvintelor și modelelor gramaticale într-o formă liberă, care nu este în niciun fel acceptabilă pentru utilizarea „mașină”. Prin urmare, este necesară o gramatică formală a limbii, de exemplu. consecventă din punct de vedere logic și exprimată clar (fără implicații sau insinuări). De îndată ce au început să apară descrieri formale ale diferitelor domenii ale limbajului - în primul rând morfologia și sintaxa - s-au înregistrat progrese în dezvoltarea sistemelor de traducere automată. Pentru a funcționa cu succes, un sistem de traducere automată include, în primul rând, dicționare bilingve dotate cu informațiile necesare (morfologice, legate de formele cuvintelor, sintactice, care descriu modalități de combinare a cuvintelor într-o propoziție și semantice, adică responsabile de sens), și în al doilea rând. - mijloace de analiză gramaticală, care se bazează pe unul dintre cele formale, i.e. strict, gramatical. Cea mai comună este următoarea secvență de operații formale care oferă analiză și sinteză într-un sistem de traducere automată.

  • 1. În prima etapă, textul este introdus și căutarea formelor de cuvinte de intrare (cuvinte într-o formă gramaticală specifică, de exemplu, dativul plural) se efectuează în intrare cu o analiză morfologică însoțitoare, în timpul căreia apartenența unui se stabilește forma de cuvânt dată unui lexem specific (un cuvânt ca unitate a dicționarului). În procesul de analiză, informațiile legate de alte niveluri de organizare ale sistemului lingvistic pot fi obținute și din forma unui cuvânt, de exemplu, ce membru al unei propoziții poate fi un anumit cuvânt. Pentru o mașină, combinarea acestor două operații - analizarea gramaticală și abordarea sensului cuvintelor - este o sarcină dificilă. Este mai bine să faceți analiza sintactică independentă de sensul cuvintelor și să utilizați dicționarul în alte etape ale traducerii.
  • 2. Ce este analiza sintactică independentă poate fi înțeleasă dacă încercați să analizați o frază din care sensurile anumitor cuvinte au fost „înlăturate”. Un exemplu strălucit de frază de acest fel este cea inventată de academicianul L.V. Propunerea lui Shcherboy: Glokaya kuzdra shtetko budlanula bokr și bucle bokrenok. O frază fără sens? Ca și cum da: în limba rusă nu există cuvinte din care să fie compus (cu excepția conjuncției și). Și totuși, într-o oarecare măsură, o înțelegem.
  • 3. Adică, mașina realizează o analiză sintactică a unei propoziții fără a se baza pe semnificațiile cuvintelor sale constitutive, folosind informații doar despre proprietățile gramaticale ale acestora. Ca rezultat al analizei sintactice, apare o structură sintactică, care este descrisă ca un arbore de dependență: „rădăcina” este predicatul, iar „ramurile” sunt relațiile sale sintactice cu cuvintele dependente. Fiecare cuvânt al unei propoziții este scris în propria formă de dicționar, iar odată cu acesta sunt indicate și caracteristicile gramaticale pe care acest cuvânt le are în propoziția analizată.
  • 4. 2. Următoarea etapă include traducerea frazelor idiomatice, a unităților frazeologice sau a clișeelor ​​dintr-un anumit domeniu (de exemplu, în timpul traducerii engleză-rusă, expresii precum în cazul, în conformitate cu primesc un singur echivalent digital și sunt excluse). din analiza gramaticală ulterioară); determinarea caracteristicilor gramaticale de bază (morfologice, sintactice, semantice și lexicale) ale elementelor textului de intrare (de exemplu, numărul substantivelor, timpul verbal, rolul acestora într-o propoziție dată etc.), produse în cadrul limbajului de intrare; rezolvarea ambiguității (de exemplu, English round poate fi un substantiv, adjectiv, adverb, verb sau prepoziție); analiza și traducerea cuvintelor. De obicei, în această etapă, cuvintele cu o singură valoare sunt separate de cuvintele poliseme (având mai mult de un echivalent de traducere în limba țintă), după care cuvintele cu o singură valoare sunt traduse folosind liste de echivalente și pentru a traduce cuvinte polisemantice, așa-numitele sunt folosite dicționare contextuale, ale căror intrări de dicționar sunt algoritmi de interogare a contextului în prezența/absența determinanților contextuali ai sensului.
  • 5. 3. Analiza gramaticală finală, în cadrul căreia se determină informațiile gramaticale necesare ținând cont de datele limbii țintă.
  • 6. 4. Sinteza formelor de cuvinte de ieșire și a propozițiilor în ansamblu în limba țintă. Aici nu veți putea ajunge prin simpla traducere a „nodurilor” arborelui într-o altă limbă. Sintaxa fiecărei limbi este aranjată în felul său: care este subiectul într-o propoziție rusă, într-o altă limbă poate (sau ar trebui) să fie exprimat printr-o adăugare, iar adăugarea, dimpotrivă, trebuie transformată în subiect; ceea ce este notat printr-un grup de cuvinte într-o limbă este tradus în alta printr-un singur cuvânt etc. Această trecere de la structură la o propoziție reală se numește sinteză sintactică.
  • 7. În funcție de caracteristicile morfologiei, sintaxei și semanticii unei anumite perechi de limbi, precum și de direcția traducerii, algoritmul general de traducere poate include și alte etape, precum și modificări ale acestor etape sau ordinea apariției lor, dar variaţiile de acest fel în sistemele moderne sunt de obicei nesemnificative . Pentru a rezolva problema ambiguității cuvântului, se utilizează analiza contextului. Faptul este că fiecare dintre cele mai multe semnificații ale unui cuvânt polisemantic în cele mai multe cazuri este realizat în propriul set de contexte. Adică, fiecare dintre semnificațiile „concurente” (în interpretare) are propriul său set de contexte. Și tocmai această dependență a sensului de mediu este cea care permite ascultătorului să înțeleagă corect afirmația. Pentru o înțelegere corectă a enunțului, este necesar să se țină seama pe deplin de regulile de condiționare a sensului ales de mediul lexical (acționând în interpretarea „frazeologică” a cuvântului), regulile de condiționare a sensului ales de către contextul semantic (așa-numitele legi ale acordului semantic) și regulile de condiționare a sensului ales de context gramatical (morfologic-sintactic).
  • 8. Sistemele actuale de traducere automată, de regulă, se concentrează pe perechi specifice de limbi (de exemplu, franceză și rusă sau japoneză și engleză) și, de regulă, folosesc potriviri de traducere fie la nivel de suprafață, fie la un nivel intermediar. nivel între limbile de intrare și de ieșire. Calitatea traducerii automate depinde de dimensiunea dicționarului, de cantitatea de informații alocată unităților lexicale, de minuțiozitatea compilării și de testare a funcționării algoritmilor de analiză și sinteză și de eficacitatea software-ului. Hardware-ul și software-ul modern permit utilizarea unor dicționare mari care conțin informații gramaticale detaliate. Informațiile pot fi prezentate atât sub formă declarativă (descriptivă), cât și procedurală (ținând cont de nevoile algoritmului).
  • 9. În practica traducerii și în tehnologia informației, există două abordări principale ale traducerii automate. Pe de o parte, rezultatele traducerii automate pot fi folosite pentru a vă familiariza pe scurt cu conținutul unui document într-o limbă necunoscută. În acest caz, poate fi folosit ca informații de semnal și nu necesită o editare atentă. O altă abordare implică utilizarea traducerii automate în loc de traducerea umană obișnuită. Aceasta implică editarea și personalizarea atentă a sistemului de traducere pentru un anumit domeniu. Completitudinea dicționarului, concentrarea sa pe conținutul și setul de mijloace lingvistice ale textelor traduse, eficiența metodelor de rezolvare a ambiguității lexicale, eficiența algoritmilor de extragere a informațiilor gramaticale, găsirea corespondențelor de traducere și algoritmii de sinteză joacă aici un rol important. În practică, traducerea de acest tip devine rentabilă din punct de vedere economic dacă volumul de texte traduse este suficient de mare (cel puțin câteva zeci de mii de pagini pe an), dacă textele sunt suficient de omogene, dicționarele de sistem sunt complete și permit extinderea ulterioară și software-ul este convenabil pentru post-editare.

SUBIECTUL, OBIECTUL ȘI SARCINI ALE TEORIEI LINGVISTICE A TRADUCERII

În prezent, teoria lingvistică a traducerii este ferm stabilită ca disciplină științifică independentă. Cu toate acestea, o serie de probleme fundamentale care determină statutul teoriei traducerii rămân încă nerezolvate. Una dintre aceste întrebări este problema subiectului și obiectului teoriei traducerii.

În literatura de specialitate au fost exprimate puncte de vedere diverse, adesea opuse, cu privire la ceea ce ar trebui să fie considerat subiectul și obiectul teoriei traducerii. Astfel, I. I. Revzin și V. Yu. Rosenzweig susțin că obiectul traducerii este procesul de traducere însuși, în timpul căruia se face o tranziție de la un sistem de semne la altul și care poate fi descris în termeni semiotici 86. Acești autori fac o distincție fundamentală între procesul de traducere și rezultatul traducerii. Ele pornesc de la faptul că în mod tradițional știința traducerii a fost construită ca o știință normativă, ale cărei obiective principale erau stabilirea rezultatului traducerii și elaborarea criteriilor de evaluare a calității traducerii. Teoria normativă a traducerii a fost construită empiric, pe baza unei analize comparative a originalelor și a traducerilor. Principiile teoretice au fost împrumutate din lexicologie, gramatică, stilistică și critica literară. Cu această abordare, conform lui I.I.Revzin și V.Yu.Rosenzweig, nu se poate realiza o înțelegere teoretică a procesului de traducere. Știință care caută să descrie

„Revzin I. I., Rosenzweig V. Yu. M.: Mai sus. scoala, 1964. P.21.


68 V.V. Sdobnikov, O.V. PetrovaTEORIA TRADUCERII

Traducerea ca proces nu ar trebui să fie normativă, ci teoretică. Adică, ar trebui să descrie nu ceea ce ar trebui să fie, ci ceea ce este inerent naturii însăși a fenomenului 87.

A.D. Schweitzer nu a fost de acord cu acest punct de vedere și consideră că un contrast atât de puternic între abordările teoretice și cele normative nu este justificat. Excluderea rezultatelor procesului de traducere din considerație restrânge în mod nejustificat subiectul teoriei traducerii și contribuie cu greu la identificarea esenței acesteia. Potrivit lui A.D. Schweitzer, traducerea este o activitate cu scop care îndeplinește anumite cerințe și standarde și este axată pe obținerea unui anumit rezultat. Aceste norme reflectă orientarea valorică a traducătorului, fără de care logica deciziilor de traducere nu poate fi explicată satisfăcător 88 . Astfel, A.D. Schweitzer include în tema teoriei traducerii atât procesul de traducere în sine, cât și rezultatul procesului de traducere.



Se pare că cercetătorii în traducere, încercând să definească subiectul teoriei traducerii, nu au luat în considerare pe deplin faptul că traducerea este un fenomen complex, complex, care este influențat de mulți factori diverși. Înțelegerea acestei împrejurări se realizează într-o măsură mai mare în lucrările lui V.N. Komissarov, care notează pe bună dreptate că nu este deloc legitim să contrastăm procesul de traducere cu rezultatul său. Este rezultatul traducerii care reprezintă acea realitate direct observabilă, pe baza analizei căreia se poate judeca indirect modul în care a decurs procesul de traducere, care este inaccesibilă observării directe.

„Revzin I. I., Rosenzweig V. Yu. Fundamentele traducerii generale și automate. M.: Mai sus. scoala, 1964. P.21.

„Schweitzer A.D. Teoria traducerii: statut, probleme, aspecte. M: Nauka, 1988. P.7.


PARTEA II. Teoria traducerii ca disciplină științifică 69

Teoria lingvistică a traducerii se ocupă atât de textele în limba sursă (SL) și în limba țintă (TL), cât și de procesul însuși de conversie a textului original în textul țintă. Dar această abordare nu este complet suficientă. Activitățile de traducere, prin definiție, sunt de natură intermediară. Traducerea oferă posibilitatea comunicării interlingve. Aceasta înseamnă că, pentru a crea o traducere cu drepturi depline, traducătorul trebuie să țină cont de caracteristicile autorului mesajului original și ale destinatarilor acestui mesaj, cunoștințele, experiența acestora, precum și particularitățile percepției oamenilor. cui este destinată traducerea etc. toate celelalte aspecte ale comunicării interlingve care afectează cursul și rezultatul procesului de traducere. Aceasta înseamnă că subiectul teoriei traducerii este complex și nu se limitează doar la procesul de traducere și la rezultatul acestuia. Teoria lingvistică a traducerii consideră traducerea în cadrul larg al comunicării interlingvistice și studiază toate aspectele și factorii determinanți ai acesteia, atât lingvistici propriu-zis, cât și externi limbii, dar influențând direct sau indirect alegerea unităților lingvistice în procesul de traducere 89 .

Din această prezentare a problemei reiese că nu există o unitate între cercetătorii în traducere în ceea ce privește terminologia utilizată. În primul rând, se atrage atenția asupra lipsei unei distincții clare între conceptele de subiect al cercetării științifice și obiect al cercetării științifice. Apropo, nici analiza definițiilor oferite de dicționarele de limbă rusă nu aduce o mai mare claritate acestei probleme. De exemplu, subiect Cercetarea științifică este definită ca „o temă, ceva care servește ca conținut al gândirii, al vorbirii, spre ce se urmărește activitatea cognitivă sau creativă.

89 Komissarov V.N. Teoria traducerii (Aspecte lingvistice). M.: Mai sus. şcoală..., 1990. P.40-41.


70 V.V. Sdobnikov, O.V. PetrovaTEORIA TRADUCERII

Activități” 99. Un obiect este definit ca „ceea ce se confruntă cu subiectul, spre care se îndreaptă activitatea sa obiectiv practică și cognitivă” 100. După cum vedem, ambele concepte sunt definite ca ceva către care se îndreaptă activitatea practică, cognitivă și creativă a subiectului de cercetare. În același timp, ar fi indicat să se considere ca obiect de cercetare ceea ce aparține cu adevărat cercului fenomenelor materiale ale lumii, iar ca subiect de cercetare - o anumită problemă, a cărei soluție se vizează de fapt cercetarea științifică. . Bazat pe acest lucru, ca obiect al teoriei lingvistice a traducerii vom înțelege activitatea de traducere intermediară în cadrul comunicării interlingve, reprezentată atât direct (proces), cât și indirect, adică reflectată în rezultatele procesului de traducere. Subiectul teoriei traducerii este studiul legilor procesului de traducere, factorii care influențează cursul procesului de traducere și determinând rezultatul traducerii.

V.N.Komisarov 101 formulează următoarele sarcini Teoria lingvistică a traducerii:

1) dezvăluie și descrie sistemul lingvistic general
traduceri noi, de ex. indicați ce trăsături ale limbii
sisteme logice și modele de funcționare
limbile stau la baza procesului de traducere
sa, faceți posibil acest proces și determinați
caracterul și limitele sale;

2) definiți traducerea ca obiect lingvistic
cine cercetează, indicați diferența față de ceilalți
tipuri de mediere lingvistică;

3) elaborarea bazei pentru clasificarea tipurilor de ep
activități de reproducere;

99 Dicționar al limbii ruse în 4 volume. Volumul III. M.: Limba rusă, 1983. P.366. ""Dicționar al limbii ruse în 4 volume. Volumul 11. M: Rus. lang., 1983. P.579. 101 K o m i s s a r o v V.N. Teoria traducerii (Aspecte lingvistice). M.: Superior şcoală..., 1990. P.35-36.


PARTEA II. Teoria traducerii ca disciplină științifică 71

4) dezvăluie esența echivalenței traducerii ca bază pentru echivalența comunicativă a textelor originale și cele de traducere;

5) să dezvolte principii și caracteristici generale
construirea unor teorii private și speciale ale traducerii
da pentru diverse combinații de limbi;

6) elaborarea principiilor generale ale inventarului științific
înțelegerea procesului de traducere ca acțiuni ale traducătorului
la conversia textului original în text rescris
apă;

7) dezvăluie impactul asupra procesului de traducere
factori pragmatici și sociolingvistici;

8) definiți conceptul de „normă de traducere” și cum
principii de lucru pentru evaluarea calității traducerii.

Cursul nostru de teoria generală a traducerii va fi structurat în conformitate cu aceste sarcini. Dar mai întâi ar trebui să luăm în considerare problema compoziției aproximative a studiilor de traducere și teoria lingvistică a traducerii.

Studiile de traducere ca disciplină științifică sunt mai ample decât teoria traducerii și includ mai multe discipline științifice sau secțiuni. Studiile de traducere includ teoria traducerii, istoria activității de traducere, critica traducerii, lexicografia traducerii, didactica traducerii (metode de predare a traducerii). După cum vedem, teoria lingvistică a traducerii este doar una dintre secțiunile studiilor traducerilor, dar, în același timp, este de natură complexă și include următoarele secțiuni:

Teoria generală a traducerii- o secțiune a teoriei lingvistice a traducerii care studiază cele mai generale modele lingvistice de traducere, indiferent de perechea specifică de limbi implicate în procesul de traducere, de metoda de desfășurare a acestui proces și de caracteristicile individuale ale unui anumit act de traducere .

Teoria specială a traducerii- o secțiune a teoriei lingvistice a traducerii care studiază trăsăturile procesului de traducere a textelor de diferite tipuri și influențe


72 V.V. Sdobnikov, O.V. PetrovaTEORIA TRADUCERII

Acest proces este influențat de formele de vorbire și de condițiile de implementare a acestuia. Se pot distinge mai multe teorii speciale ale traducerii: teoria traducerii literare, teoria traducerii științifice și tehnice, teoria traducerii orale, teoria traducerii automate etc.

Teoria specială a traducerii- o secțiune a teoriei lingvistice a traducerii care studiază aspectele lingvistice ale traducerii dintr-o limbă dată într-o altă limbă dată. Pot exista multe teorii specifice traducerii: teoria traducerii din engleză în rusă, teoria traducerii din germană în japoneză, teoria traducerii din franceză în swahili etc.

RELAȚIA TEORIEI TRADUCERII CU ALTE DISCIPLINE LINGVISTICE

Teoria lingvistică a traducerii este strâns legată de discipline lingvistice precum lingvistica contrastivă, sociolingvistica, psiholingvistica și lingvistica textului.

Teoria traducerii si lingvistica contrastiva

Lingvistica contrastivă este o direcție de cercetare în lingvistica generală, al cărei scop este studiul comparativ a două, sau mai rar mai multe limbi, pentru a identifica asemănările și diferențele lor la toate nivelurile structurii lingvistice 102. După cum notează A.D. Schweitzer, problema relației dintre lingvistica contrastistă și teoria traducerii continuă să fie un subiect de dezbatere. În trecut, adesea nu exista o diferențiere clară

102 Dicţionar enciclopedic lingvistic. M: Sov. enciclopedie, 1990. P.239.


. Teoria traducerii ca disciplină științifică 73

Recunoașterea acestor discipline. J.I. Retzker scria încă din 1950 că „traducerea... este de neconceput fără o bază lingvistică solidă. O astfel de bază ar trebui să fie un studiu comparativ al fenomenelor lingvistice și stabilirea unor corespondențe între limba originală și limba țintă. Aceste corespondențe în domeniul vocabularului, frazeologiei, sintaxei și stilului ar trebui să formeze baza lingvistică a teoriei traducerii” 103. Astfel, compararea limbilor și a fenomenelor lingvistice a fost de fapt identificată cu teoria lingvistică a traducerii.

Uneori teoria traducerii se identifică nu cu lingvistica contrastivă în general, ci cu una dintre secțiunile sale, și anume: cu stilistica comparativă. Această tradiție a fost fondată prin lucrarea lui J.-P. Vinet și J. Darbelne „Stilistica comparată a limbilor franceze și engleze” (1958), în care autorii au echivalat de fapt conceptele de stilistică comparată și teoria traducerii. Această trăsătură a cercetării traducerii lingvistice a fost acordată mai târziu atenție atât de I.I. Revzin, cât și de V.Yu. Rosenzweig: „Recunoscând valoarea lucrărilor din această direcție pentru teoria traducerii, ... nu se poate nu observa confuzia din ele. a conceptelor de stilistică și teoria traducerii.” 104. Și totuși, chiar și un deceniu mai târziu, unii cercetători au susținut că „teoria lingvistică a traducerii nu este altceva decât „lingvistica comparată a textului”, adică studiul comparativ al textelor multilingve identice din punct de vedere semantic” 105.

Legătura strânsă dintre lingvistica contrastivă și teoria traducerii este indicată de însăși descrierea metodei.

103 Sh veytser A. D. M:
Știință, 1988. SY.

104 R e v z i n I. I., Rozentsveyg V. Yu. Fundamentele generale și ale mașinii
traducere. M.\
Superior scoala, 1964. P.32.

105 B a r h u d a r o v L. S. Limba și traducerea (Aspecte generale și specifice
teoria traducerii). M.:
Intl. relaţii, 1975. P.28.


74 V.V. Sdobnikov, O.V. PetrovaTEORIA TRADUCERII

Învățarea comparativă a limbilor străine. Principiile descrierii comparative sunt formulate de A.V. Fedorov astfel: „Ceea ce este specific unei anumite limbi nu este sensul exprimat pe care îl are în comun cu o altă limbă, ci categoriile formale în care se exprimă, trăsăturile structurale. Dintr-o categorie formală, ca de la un obiectiv dat (de exemplu, dintr-un anumit tip de cuvinte, modele de formare a cuvintelor, din ordinea cuvintelor, din propoziții în două părți cu un anumit tip de subiect etc.), cercetătorul merge la determinați-i semnificațiile într-o limbă și apoi la cele care exprimă aceste semnificații la mijloacele formale ale unei alte limbi (potrivire sau tipuri diferite de cuvinte, aceeași ordine sau ordine diferită a cuvintelor, propoziții din două părți sau dintr-o singură parte etc.). Desigur, cu această metodă de analiză, materialul de traducere este foarte recunoscător...” 106. Din această definiție a metodei de cercetare rezultă că lingviștii, în interesul cercetării comparative a limbilor, au folosit metoda de a compara lucrări specifice de vorbire în diferite limbi, care sunt de fapt originale și traduceri. Aceasta este pe deplin în concordanță cu afirmația lui E. Coseriu că lingvistica contrastivă la nivelul normei lingvistice, care studiază utilizarea efectivă a unităților funcționale, acoperă tocmai sfera în care se desfășoară procesul de traducere și coincide cu aceasta. Potrivit lui E. Coseriu, zona cea mai apropiată de teoria traducerii este tocmai acea zonă a lingvisticii contrastive, care se concentrează pe limbajul în acțiune. La fel ca teoria traducerii, această zonă se ocupă cu implementările de vorbire ale structurii limbajului, cu zona de funcționare a limbajului în vorbire și, ca și teoria traducerii, este unidirecțională (de exemplu, problema găsirii

106 Citat. de: RevzinI. I., RosenzweigV. YU. Fundamentele traducerii generale și automate. M.: Mai sus. scoala..., 1964. P.33


PARTEA //. Teorie traducerea ca disciplină științifică 75

Corespondența cu gerunzii este relevantă numai pentru traducerea din rusă și pentru lingvistica contrastivă, a cărei limbă sursă este rusă) 107.

Datele din lingvistica contrastiva sunt, fără îndoială, utile pentru teoria lingvistică a traducerii. Explorând relația dintre unitățile funcționale ale limbii A și ale limbii B, lingvistica contrastiva creează fundamentul necesar pentru construirea unei teorii a traducerii. De fapt, multe transformări ale traducerii care alcătuiesc „tehnologia” traducerii se întorc în cele din urmă la diferențele funcționale și structurale dintre limbi care „se ciocnesc” unele cu altele în procesul de traducere. Lingvistica contrastantă într-o serie de cazuri răspunde la întrebarea de ce se realizează cutare sau cutare operație în traducere 107 . Unul dintre motivele utilizării transformărilor de traducere este prezența într-una dintre limbile care interacționează a așa-numitelor „forme neechivalente”, a căror identificare este facilitată de datele lingvisticii contrastive.

Putem spune că teoria traducerii are nevoie de lingvistică contrastivă ca sursă de date inițiale. Aceste date, care pun în lumină discrepanțele dintre tipurile structurale, sistemele și normele de limbi, servesc ca punct de plecare pentru analiza traducerii propriu-zisă 108.

În ciuda legăturii strânse dintre lingvistica contrastivă și teoria traducerii, acestea nu pot fi echivalate între ele. Sarcina lingvisticii contrastive este de a compara limbile și de a identifica asemănările și diferențele lor. Teoria traducerii, la rândul său, studiază traducerea ca tip specific de comunicare interlingvistică, medierea lingvistică. Scopul său este de a identifica esența, traducerea, ei

107 Sh veytser A. D. Teoria traducerii: statut, probleme, aspecte M:
Știință, 1988. SP.

108 Ibid. P.12.


76 V.V. Sdobnikov, O.V. PetrovaTEORIA TRADUCERII

Mecanisme, metode de implementare, factori lingvistici și extralingvistici care o influențează. Teoria traducerii, pe lângă textele sursă și finale, ia în considerare diferențele socioculturale și psihologice dintre comunicanții multilingvi, precum și o serie de alți factori socioculturali și psiholingvistici determinanți ai procesului de traducere. Se ține cont de faptul că traducerea nu este o simplă schimbare a codului limbii, ci și o adaptare a textului pentru perceperea lui prin prisma altei culturi.

Traducerea automată, sau mai degrabă traducerea computerizată, este și o traducere scrisă, deoarece ca rezultat primim un text scris. Cu toate acestea, nu este realizat de un traducător, ci de un program special de calculator. Programele moderne de traducere pe calculator sunt destul de avansate, dar încă nu pot rezolva cea mai dificilă sarcină a procesului de traducere: alegerea unei opțiuni necesare din punct de vedere contextual, care în fiecare text este determinată de mai multe motive. În prezent, rezultatul acestui tip de traducere poate fi folosit ca o versiune nefinalizată a viitorului text, care va fi editată de traducător și, de asemenea, ca mijloc de a vă face o idee generală despre subiectul și conținutul textului în situații extreme în care nu există traducător.

O sarcină și mai dificilă este traducerea textului vorbit folosind programe de calculator, deoarece problema recunoașterii vorbirii vorbite se află abia în stadiul inițial al soluționării acesteia. Până acum, un obstacol de netrecut este colorarea individuală a sunetului unui segment de vorbire - în orice limbă, un astfel de discurs este slab formalizat.

Editarea preliminară a structurii sintactice poate include:

· împărțirea unei propoziții extra-lungi (mai mult de 40 de cuvinte) în câteva mai scurte, adăugând (dacă este necesar) elemente de conjuncție;

· introducerea articolelor în textul englez atunci când este necesar sau justificat din punct de vedere gramatical;

· repetarea elementelor în legătura coordonatoare a frazelor dintr-o propoziție;

· introducerea de conjuncții atunci când se folosesc conexiuni neuniuni între propoziții;

· eliminarea construcțiilor dintre paranteze în mijlocul unei sintagme nominale sau în mijlocul unei propoziții;

· înlocuirea abrevierilor ocazionale cu nume complete sau introducerea de caractere speciale care nu permit traducerea acestora;

· eliminarea elipselor lexicale și logice, a construcțiilor informale și a metaforelor;

· aducând într-o formă unică construcții sau cuvinte complexe care pot apărea în text în scriere continuă, cu cratime și libere.

Textul editat manual este apoi procesat automat în sistemul MP.

25. Schema generală a traducerii automate.

Peste tot în lume, utilizarea sistemelor de traducere automată, în ciuda tuturor slăbiciunilor lor, a fost de mult timp un element al muncii profesionale a unui traducător, care trebuie să fie capabil să folosească un computer nu numai ca mașină de scris. Conceptul de stație de lucru a unui traducător automat, care include un complex de dicționare rezidente, tezaure, sisteme de verificare ortografică, sisteme de accesare a informațiilor prin diverse rețele de date, ar trebui să devină o cunoaștere comună pentru un filolog.

Un sistem de traducere automată (MT) pentru texte poate fi utilizat ca parte a unei astfel de stații de lucru de traducător automat, oferind traduceri de înaltă calitate, care se concentrează strict pe un domeniu specific, sarcinile utilizatorului și tipul de documentație. În plus, un astfel de sistem poate ajuta un utilizator care nu cunoaște o limbă străină foarte rapid și la costuri reduse să obțină o traducere aproximativă (grundală) a textelor din domeniul cunoașterii care îl interesează, traducere suficientă pentru a înțelege informațiile transmise de text într-o limbă străină.

Cerințe generale pentru sisteme practice

traducere automată (MT)

· Stabilitatea sistemului. Sistemul MP ​​ar trebui să producă un rezultat care poate fi utilizat chiar și în cazul defectelor materialului sursă și al vocabularului incomplet.

· Replicarea sistemului. Sistemul ar trebui să aibă software și instrumente lingvistice destul de simple pentru a extinde domeniul de aplicare.

· Adaptabilitatea sistemului. Sistemul MP ​​trebuie să aibă mijloacele pentru a-l personaliza la nevoile utilizatorilor specifici și la caracteristicile documentelor în curs de procesare.

· Parametri optimi de sincronizare. Viteza de traducere a textului trebuie să corespundă fie cu volumul de informații primite pe unitatea de timp, fie cu standardele de lucru ale utilizatorului.

· Confortul utilizatorului. Facilitățile de service ale sistemului trebuie să asigure confortul utilizatorului în toate modurile de operare posibile în sistem.

Când lucrați cu un anumit sistem de traducere automată, trebuie să vă amintiți că traducerea se realizează la mai multe niveluri subordonate ale implementării sistemului.

În general, aceste niveluri includ:

· nivelul de preeditare automată a textului;

· nivelul de analiză lexico-morfologică;

· nivelul de analiză contextuală și de grup;

· nivelul de analiză a segmentelor funcționale;

· nivelul analizei propunerii;

· nivelul de sinteză a textului de ieșire;

· nivelul de post-editare automată.

  • DE-1. Fundamentele structurii și proprietăților materialelor. Transformări de fază.
  • DE-2.Principii de bază ale tratamentului termic și călirii suprafețelor aliajelor
  • Cursul 13. Traducerea automată a textului. Dicționare de limbaj computerizat

    Bazele traducerii automate

    Traducere este un tip de mediere lingvistică care se concentrează pe originalul în limba străină. Traducerea este considerată ca o formă străină de existență a mesajului conținut în original. Comunicarea interlingvă realizată prin traducere reproduce în cea mai mare măsură procesul de comunicare directă prin vorbire, în care comunicanții folosesc aceeași limbă.

    Traducere automată este extragerea automată a cunoștințelor și a textelor scrise în limbaj natural folosind programe de calculator bazate pe suport lingvistic.

    Proces de traducere automată- Acestea sunt acțiunile unui computer de a converti text într-o limbă naturală în text echivalent în conținut într-o altă limbă, precum și rezultatul unei astfel de acțiuni.

    Sistem automat de înțelegere a textului, pornește din faptul că un text în limbaj natural, construit în conformitate cu dicționare, gramatici și algoritmi de limbaj natural, pe baza unei rețele semantice, cadre și tezaure, este înțeles de utilizator datorită faptului că are cunoștințe lingvistice - sintactice. -structuri semantice, precum și cunoștințe de specialitate.

    Majoritatea sistemelor de procesare automată a limbajului urmăresc să analizeze textele care au fost pre-împărțite în propoziții. Cu toate acestea, datele lingvistice ne sunt disponibile cel mai adesea sub formă de texte împărțite în paragrafe, capitole și alte unități mai mari. Prin urmare, pentru analiza lor automată eficientă, sunt necesari algoritmi de segmentare corespunzători.

    Sarcini la crearea unui sistem pentru înțelegerea automată a textului:

    · analiza textului natural sursă, care asigură construirea unor structuri lingvistice, inclusiv diverse structuri semantice, complete, parțiale, comprimate, urmărind prezentarea conținutului textului sub formă de baze de date,

    · compararea structurilor lingvistice ale textului cu cunoștințe speciale sau individuale, prezentate și sub forma unei baze de date

    · generalizarea textelor pe baza informațiilor conținute în baze de date relaționale tradiționale, precum și în structuri conceptuale de text sau în baze de date individuale.

    Pentru implementarea traducerii automate Un program special este introdus în computerul care implementează algoritm de traducere, care este înțeles ca o secvență de acțiuni clar și strict definite asupra textului pentru a găsi corespondențe de traducere într-o anumită pereche de limbi pentru o anumită direcție de traducere (de la o anumită limbă la alta). Există, de asemenea, sisteme separate de traducere automată concepute pentru a traduce în trei sau mai multe limbi, dar acestea sunt în prezent experimentale.

    Traducerea automată modernă sau automată se realizează cu ajutorul unei persoane: un pre-editor, care într-un fel sau altul preprocesează textul de tradus, un inter-editor, care participă la procesul de traducere sau o postare. -editor, care corectează erorile și omisiunile din textul tradus automat.

    Sistemul de traducere automată include dicționare bilingve dotate cu informațiile gramaticale necesare (morfologice, sintactice și semantice), care asigură transmiterea corespondențelor de traducere echivalente, variante și transformaționale, dicționare explicative și tematice speciale, precum și instrumente de analiză gramaticală algoritmică care implementează orice a gramaticilor formale adoptate pentru prelucrarea automată a textului.

    Cel mai comun este următorul succesiune de operații formale, furnizarea de analiză și sinteză într-un sistem de traducere automată:

    · introducerea textului și căutarea formelor de cuvinte introduse în dicționarul de introducere cu analiză morfologică însoțitoare, în timpul căreia se stabilește apartenența unei forme de cuvânt date la un anumit lexem. În procesul de analiză, informațiile legate de alte niveluri de organizare a sistemului lingvistic pot fi obținute și din forma unui cuvânt.

    · traducerea de fraze idiomatice, unități frazeologice sau clișee dintr-o anumită arie de subiect, determinarea caracteristicilor gramaticale de bază ale elementelor de text introduse, rezoluția omografiei, analiza lexicală și traducerea lexemelor. De obicei, în această etapă, cuvintele cu o singură valoare sunt separate de cele polisemantice, după care cuvintele cu o singură valoare sunt traduse folosind liste de echivalente, iar pentru traducerea cuvintelor polisemantice se folosesc așa-numitele dicționare contextuale, ale căror intrări de dicționar sunt algoritmi pentru interogarea contextului pentru prezența/absența calificatorilor de sens contextual.

    · Analiza gramaticală finală, în cadrul căreia se determină informațiile gramaticale necesare ținând cont de datele limbii țintă.

    · Sinteza formelor de cuvinte de ieșire și a propozițiilor ca întreg în limba țintă.

    Analiza și sinteza pot fi efectuate atât frază cu frază, cât și pentru întregul text introdus în memoria computerului; în acest din urmă caz, algoritmul de translație prevede identificarea așa-numitelor conexiuni anaforice.

    Calitatea traducerii automate depinde de:

    · volumul dicționarelor,

    · cantitatea de informații atribuită unităților lexicale,

    · minuțiozitate în compilarea și verificarea funcționării algoritmilor de analiză și sinteză,

    · eficiența software-ului.

    Cu toate acestea, niciunul dintre programe nu poate fi încă de așteptat să ofere o traducere literară „corectă” a unui text constând din fraze complexe.

    Hardware-ul și software-ul modern permit utilizarea unor dicționare mari care conțin informații gramaticale detaliate. Informațiile pot fi prezentate după cum urmează: declarativ(descriptive) și procedural(ținând cont de nevoile algoritmului) form.

    Îmbunătățirea programelor de traducere automată este legat de conceptul de înțelegere soft text, conform căruia diferiți utilizatori își extrag informațiile și sensul lor individual din același text. Model de înțelegere a textului soft constă în capacitatea de a genera diferite interpretări semnificative ale obiectului original în funcție de diferite condiții și componente ale percepției acestuia.

    Mai multe „mașini” private pentru a ajuta traducătorul și editorul - acestea sunt dicționare automate și baze de date terminologice, tezaure de calculator, instrumente de editare a ecranului, sisteme de ortografie, terminologie și corectare gramaticală a textelor.

    Traducerea automată modernă ar trebui să se distingă de utilizarea computerelor pentru a ajuta traducătorii umani. În acest din urmă caz ​​ne referim dicţionar automat, care ajută o persoană să selecteze rapid echivalentul de traducere dorit. Deși în ambele cazuri computerul lucrează împreună cu o persoană (traducător sau editor), conținutul termenului „traducere automată” include ideea că partea principală a muncii de traducere și găsire a echivalentelor de traducere și a corespondențelor de traducere este realizată de către ei înșiși, lăsând persoana doar să controleze și să corecteze greșelile.

    Dicționar de calculator pentru a ajuta o persoană - acesta este un ajutor pentru găsirea rapidă a potrivirilor de traducere; În același timp, în astfel de dicționare, unele funcții inerente sistemelor de traducere automată pot fi implementate într-o măsură limitată.

    În tehnologia informației există diferențe 2 abordări principale ale traducerii automate:

    · familiarizarea superficială cu conținutul unui document într-o limbă necunoscută

    · utilizarea traducerii automate în locul celei obișnuite „umane”. Aceasta implică editarea și personalizarea atentă a sistemului de traducere pentru un anumit domeniu.

    Completitudinea dicționarului, concentrarea sa pe conținutul și setul de mijloace lingvistice ale textelor traduse, eficiența metodelor de rezolvare a ambiguității lexicale, eficiența algoritmilor de extragere a informațiilor gramaticale, găsirea corespondențelor de traducere și algoritmii de sinteză joacă aici un rol important.

    Ca tip de activitate lingvistică traducerea afectează toate nivelurile limbajului - de la recunoașterea grafemelor (și fonemelor atunci când traduceți vorbirea orală) până la transmiterea sensului enunțurilor și textului. În plus, traducerea automată oferă posibilitatea de a testa ipotezele teoretice despre structura anumitor nivele de limbaj și eficacitatea algoritmilor propuși.

    Nevoie de îmbunătățire traducerea automată este în continuă creștere, deoarece aceasta este cea mai importantă condiție pentru asigurarea comunicării interlingve, al cărei volum crește în fiecare an.

    Alte metode de depășire a barierelor lingvistice în calea comunicării - dezvoltarea sau adoptarea unei limbi comune, precum și studiul limbilor străine - nu se pot compara cu traducerea în ceea ce privește eficacitatea.

    Data nașterii traducerea automată ca domeniu de cercetare este în general considerată martie 1947; Atunci specialistul în criptografie Warren Weaver, în scrisoarea sa către Norbert Wiener, a pus pentru prima dată problema traducerii automate, comparând-o cu problema decriptării.

    Se ocupă de problemele de traducere automată lingvistică computațională, care s-a născut în ianuarie 1954, când s-a desfășurat primul experiment public din lume de traducere automată la Universitatea Georgetown (SUA). În același timp, sub conducerea remarcabilului matematician și cibernetic Alexei Lyapunov, la Moscova a început munca activă privind traducerea automată. La începutul anului 1956, primul sistem intern de traducere automată din franceză în rusă a început să funcționeze la Institutul de Matematică Aplicată MV Keldysh (IPM).

    Liderii printre programele moderne de traducere automată din Rusia sunt sistemul PROMT (dezvoltat de compania PROMT, www.e-promt.ru) și sistemul SOKRAT (dezvoltat de compania Arsenal, www.ars.ru).

    Cea mai recentă versiune a PROMT a introdus o funcționalitate fundamental nouă, „Memorie asociată”. Mecanismul „Memorie asociată” vă permite să antrenați sistemul. Cu ajutorul acestuia, puteți salva o traducere de text care vă satisface în baza de cunoștințe și puteți utiliza ulterior fragmentele acesteia atunci când traduceți texte similare.

    SOCRATE încearcă să găsească o soluție lipsită de ambiguitate și nu oferă variații în termeni: un cuvânt care nu se află în dicționar rămâne în scrierea inițială. PROMT oferă de obicei mai multe opțiuni de traducere pentru cuvinte și expresii.

    Traducerea automată, care a trecut prin mai multe etape de dezvoltare, se concentrează în prezent asupra ideea de a modela acțiunile unui traducător uman. Procesul de traducere este foarte dificil, iar utilizarea corectă a avantajelor software-ului determină în mare măsură calitatea traducerii. Sistemele moderne de traducere automată includ multe dicționare suplimentare. Pe baza caracteristicilor soluțiilor arhitecturale pentru algoritmi lingvistici, sistemele sunt împărțite în două tipuri - „Transfer” și „Interlingua”. Programele de traducere automată sunt construite în conformitate cu această diviziune. Deci, de exemplu, programul „Socrate” se traduce mult mai bine decât, să zicem, „Magic Guddi”, deoarece suportul lingvistic al primului program este mult mai puternic, iar dicționarele sunt mult mai mari ca volum.

    Rezultatele traducerii automate trebuie întotdeauna editate. De exemplu, programul Pars oferă o funcție pentru conectarea suplimentară a dicționarelor pe diverse subiecte. La urma urmei, calitatea traducerii produse de mașină depinde și de calitatea software-ului. Dar chiar și reglarea fină a sistemului la vocabularul textului tradus nu ține cont de toate caracteristicile acestuia, prin urmare cuvintele traduse care au mai multe sinonime sunt marcate cu un asterisc sau sunt date între paranteze ca opțiune.

    tehnologii de internet a oferit noi dezvoltări traducerii automate și a ajutat-o ​​la o nouă etapă de dezvoltare. Traducerea automată este un instrument eficient pentru vizualizarea și căutarea informațiilor într-o limbă străină, iar această funcție este cea principală atunci când lucrați pe Internet. Starea actuală a traducerii automate ne permite să obținem traduceri de text relativ corecte ale paginilor web din majoritatea limbilor. Deși nu este posibilă traducerea complet automată, de înaltă calitate, este deja disponibil un software care facilitează procesul de traducere.

    Ca rezultat al personalizării la domeniul subiectului și al integrării cu alte programe de procesare a documentelor, traducerea automată vă permite să automatizați producția de text tradus.

    Problema principala Toate programele de traducere automată necesită selectarea corectă a dicționarului tematic, precum și construcția dicționarelor auxiliare.

    Traducerea depinde parțial de nivelul de pregătire al utilizatorului (cunoașterea limbii, abilitățile de lucru cu programe, simțul limbajului) și, de asemenea, într-o măsură mai mare, de capacitatea acestuia de a lucra corect cu un editor de text, utilități auxiliare, dicționare și cărți de referință frazeologică. Opțiunile pentru traduceri realizate cu conectarea dicționarelor tematice sunt oferite de o traducere bună, alegerea corectă a sensului cuvântului și utilizarea expresiilor în text. Acest lucru se explică prin faptul că aparatul își configurează dicționarul pentru a selecta acele sinonime care ar fi mai în concordanță cu subiectul limbii de intrare și s-ar traduce în conformitate cu subiectul limbii de ieșire.

    2 abordări ale problemei dezvoltării traducerii automate:

    · instalare pe utilizarea unui limbaj universal al sensului, o abordare directă a traducerii, transformarea textului original în textul țintă

    instalare pe un limbaj intermediar, modelând competența limbajului uman

    Problema este că sensul unui text într-o limbă naturală depinde nu numai de propoziție în sine, ci și de context, care este asociat cu polisemia cuvintelor și structurilor sintactice, imposibilitatea practică a unei descrieri globale a structurii semantice. a lumii chiar și într-un domeniu limitat și lipsa unor descrieri eficiente de metode formale ale modelelor lingvistice.

    Probleme nerezolvate traducerea automată este

    · rezolvarea ambiguității analizei sintactice formale a propozițiilor text izolate

    · depășirea incompletității structurale și semantice a secțiunilor (fragmentelor) de text

    · organizarea conexiunii flexibile a diferitelor domenii

    · necesitatea înțelegerii textului ca o entitate întreagă

    Programele de traducere automată sunt mai bune la procesarea textelor științifice, tehnice și educaționale care se caracterizează printr-o prezentare strictă a materialului.

    Stilul colocvial și jurnalistic, în care există multe expresii specifice, dar majoritatea cuvintelor sunt folosite în sens literal, sunt potrivite pentru traducerea educațională, dar editarea manuală este necesară pentru a obține un text de ieșire competent. Traducerea rezultată este un fel de text introductiv, în care este transmis doar focalizarea tematică generală a textului.

    Traducerea ficțiunii și a poeziei nu îndeplinește cerințele mașinii. Sensul unui text bazat pe expresii alegorice este distorsionat în timpul traducerii automate și este inaccesibil chiar și pentru revizuire. Mașina nu înțelege polisemia, care la rândul ei duce la o interpretare incorectă a textului tradus, care se transformă în prostii.

    Puteți încerca să minimizați astfel de neînțelegeri observând urmând reguli:

    · construirea corectă a dicționarelor tematice

    · verifica textul original în etapa de pre-pregătire a traducerii acestuia

    · editați în etapa finală a traducerii

    · utilizați corect programele de dicționar

    · cunoștințe bune de gramatică și vocabular, precum și a subiectului textului sursă

    · utilizați corect vocabularul, clișeele și formele de cuvinte

    · actualizați în timp util dicționarele speciale cu termeni noi

    Introducere

    Traducere automată- procesul de traducere a textelor (scrise și, în mod ideal, orale) dintr-o limbă naturală în alta folosind un program special de calculator. Acesta este și numele direcției de cercetare științifică legată de construcția unor astfel de sisteme.

    În loc de „mașină” se folosește uneori cuvântul automat, ceea ce nu afectează sensul. Cu toate acestea, nu trebuie să confundați traducerea automată cu traducerea automată; aceasta are un sens complet diferit - cu ea, programul pur și simplu ajută o persoană să traducă texte.

    Ideea utilizării calculatoarelor electronice (calculatoare) pentru traducere a fost exprimată în 1947 în SUA, imediat după apariția primelor computere. Prima demonstrație publică de traducere automată a avut loc în 1954. În ciuda caracterului primitiv al sistemului, acest experiment a primit o rezonanță largă.

    La mijlocul anilor 1960, două sisteme de traducere rusă-engleză au fost furnizate pentru utilizare practică în Statele Unite:

    • MARCĂ
    • GAT

    Comisia ALPAC, creată pentru a evalua astfel de sisteme, a ajuns însă la concluzia că, din cauza calității scăzute a textelor traduse automat, această activitate este nerentabilă în Statele Unite. Deși comisia a recomandat continuarea și aprofundarea dezvoltărilor teoretice, în general concluziile sale au condus la o creștere a pesimismului, o scădere a finanțării și, adesea, la încetarea completă a lucrărilor pe această temă.

    Cu toate acestea, cercetările au continuat într-un număr de țări, ajutate de progresul constant al tehnologiei informatice. Un factor deosebit de semnificativ a fost apariția mini-calculatoarelor și computerelor personale și, odată cu acestea, dicționarul și sistemele de căutare din ce în ce mai complexe, concentrate pe lucrul cu date în limbaj natural. Nevoia de traducere în sine a crescut și din cauza creșterii relațiilor internaționale. Toate acestea au dus la o nouă ascensiune în acest domeniu. A sosit momentul pentru utilizarea practică pe scară largă a sistemelor de traducere și a apărut o piață pentru dezvoltări comerciale pe această temă.

    Cu toate acestea, traducerea de înaltă calitate a textelor pe o gamă largă de subiecte este încă de neatins. Cu toate acestea, nu există nicio îndoială că munca traducătorului va fi mai rapidă atunci când se utilizează sisteme de traducere automată.

    1. Partea principală

    Sistemele de traducere automată se împart în trei categorii:

    • -sisteme bazate pe reguli gramaticale(Traducerea automată bazată pe reguli, RBMT),
    • -sisteme statistice(traducere automată statistică, SMT)
    • -sisteme hibride, combinând avantajele ambelor (sunt cele mai promițătoare)

    Traducere automată bazată pe reguli este un termen general care se referă la sisteme de traducere automată bazate pe informații lingvistice despre limbile sursă și țintă. Ele constau din dicționare și gramatici bilingve care acoperă modelele semantice, morfologice și sintactice de bază ale fiecărei limbi. Această abordare a traducerii automate este, de asemenea, numită clasic. Pe baza acestor date, textul sursă este transformat secvenţial, propoziţie cu propoziţie, în textul ţintă. Principiul de funcționare al unor astfel de sisteme este legătura dintre structura propozițiilor de intrare și de ieșire. traducere pe calculator

    Sistemele RBMT sunt împărțite în trei grupuri:

    • · sisteme de traducere cuvânt cu cuvânt;
    • · sisteme de transfer (Transfer) - transformă structurile limbajului de intrare în structuri gramaticale ale limbajului de ieșire;
    • · sisteme interlingvistice (Interlingua) - un limbaj intermediar pentru descrierea sensului.

    Principalul avantaj al sistemelor bazate pe transfer este completitatea ridicată a acoperirii textului cu un nivel acceptabil de calitate a traducerii, precum și nivelul scăzut al costurilor pentru dezvoltarea și modernizarea inițială.

    Componentele unui RBMT tipic:

    • · Baze de date lingvistice: - dicționare bilingve; - fisiere de nume, transliterare; - tabele morfologice.
    • · Modul de traducere: - reguli gramaticale; - algoritmi de traducere.
    • · Avantajele sistemelor RBMT:
      • - acuratețea sintactică și morfologică;
      • - stabilitatea si predictibilitatea rezultatului;
      • - abilitatea de a se personaliza la domeniul subiectului.
    • · Dezavantajele sistemelor RBMT:
    • - intensitatea muncii și durata dezvoltării;
    • -necesitatea de mentinere si actualizare a bazelor de date lingvistice;
    • - „accent de mașină” la traducere.

    Traducere automată statistică- un tip de traducere automată, în care traducerea este generată pe baza unor modele statistice, ai căror parametri sunt derivați din analiza corpurilor de text bilingve (corpuri de text).

    Traducerea automată statistică este în contrast cu sistemele de traducere automată bazate pe reguli, traducerea automată bazată pe reguli (RBMT) și traducerea automată bazată pe exemple, MT bazată pe exemple (EBMT).

    Primele idei pentru traducerea automată statistică au fost publicate de Warren Weaver în 1949. „Al doilea val” - începutul anilor 1990, IBM. „Al treilea val” - ​​Google, Microsoft, Language Weaver, Yandex.

    Modele de traducere statistică:

    • · în funcție de cuvinte (Traducere bazată pe cuvinte - WBT)
    • · prin fraze (traducere bazată pe fraze - PBT)
    • · după sintaxă (traducere bazată pe sintaxă - SBT)
    • · prin fraze ierarhice (Hierarchical phrase-based translation - HPBT)

    Avantajele SMT:

    • · Instalare rapida
    • ·Ușor de adăugat noi direcții de traducere
    • · Netezimea traducerii

    Dezavantajele SMT:

    • · „Lipsa” clădirilor paralele
    • · Numeroase erori gramaticale
    • · Instabilitatea traducerii

    Pentru a îmbunătăți calitatea, dezvoltatorii de sisteme de traducere automată introduc câteva reguli „end-to-end”, transformând astfel sistemele pur statistice în Traducere automată hibridă. Adăugarea unor reguli, adică crearea unor sisteme hibride, îmbunătățește oarecum calitatea traducerilor, mai ales dacă cantitatea de date de intrare folosită pentru a construi indexul traductorului automat este insuficientă.

    Traducere automată hibridă- integrarea diferitelor abordări de traducere automată din posibilele opțiuni MT:

    • · Traducere automată bazată pe reguli (RBMT) - Traducere automată bazată pe reguli.
    • · Traducere automată bazată pe corpus (CBMT) - Traducere automată folosind corpuri de text.
    • · Traducere automată bazată pe exemple (EBMT) Traducere automată folosind exemple.
    • · Traducere automată statistică (SMT) - Traducere automată statistică.

    Este de așteptat ca cu ajutorul unei arhitecturi hibride să fie posibilă combinarea avantajelor acestor abordări.

    Tehnologia de traducere hibridă presupune utilizarea metodelor statistice pentru a construi automat baze de date de dicționar pe baza corpurilor paralele, formarea mai multor traduceri posibile, atât la nivel lexical, cât și la nivelul structurii sintactice a propoziției din limba țintă, utilizarea post- editarea în mod automat și selectarea celor mai bune (cel mai probabil) traduceri posibile pe baza unui model de limbă construit dintr-un corpus specific al limbii țintă.

    Statistical MT caută să utilizeze date lingvistice, în timp ce sistemele cu o abordare „clasică” bazată pe reguli utilizează metode statistice. Adăugarea unor reguli „end-to-end”, adică crearea de sisteme hibride, îmbunătățește oarecum calitatea traducerilor, mai ales atunci când cantitatea de date de intrare folosită pentru a construi fișiere index pentru stocarea informațiilor lingvistice ale unui traducător automat bazat pe N-grame este insuficientă.

    Arhitectura tehnologiei hibride „SMT și RBMT”[

    Sistemul RBMT este completat cu două componente: un modul de post-editare statistică și un modul de modele de limbaj. Post-editarea statistică vă permite să netezi traducerea RB, apropiindu-l de limbajul natural, păstrând în același timp o structură clară a textului sintetizat. Modelele de limbaj sunt folosite pentru a evalua netezimea și corectitudinea gramaticală a variantelor de traducere generate de sistemul hibrid.

    Arhitectură tipică HMT:

    • · Corp paralel;
    • · Educație;
    • · Model lingvistic;
    • · Date pentru post-editare;
    • · Reguli de sinteză;
    • · Dicționar de terminologie.

    Avantajele traducerii hibride:

    • · Configurare automată rapidă bazată pe Memoriile de traducere ale clientului;
    • · Acuratețea terminologică a traducerii, precum și unitatea de stil;
    • · Obținerea de date suplimentare utile – un dicționar terminologic bilingv.

    Concluzie

    Principalul avantaj al traducerii automate este că vă permite să faceți față rapid unor volume foarte mari de text și, prin urmare, uneori se dovedește a fi mai rentabil decât traducerea manuală. Trebuie amintit că calitatea traducerii automate va fi întotdeauna inferioară traducerii umane. Prin urmare, este recomandabil să îl utilizați numai în anumite cazuri.

    Multe tipuri de materiale nu sunt destinate, în principiu, traducerii automate. Astfel, nu poți avea încredere într-o mașină cu texte în care traducerea incorectă poate pune în pericol sănătatea umană, performanța unui dispozitiv complex sau un contract mare - timpul economisit aici nu justifică riscul. Orice documente care implică răspundere legală necesită control uman. Traducerea automată nu este potrivită pentru materialele de marketing, unde textul este în esență reinterpretat într-un nou context cultural și creat din nou.

    O calitate acceptabilă poate fi de așteptat la traducerea textelor tehnice strict formalizate, în timp ce textele literare și publicitare nu pot fi traduse automat.

    Când recurgeți la traducerea automată, este important nu numai să înțelegeți clar rezultatul dorit și să înțelegeți limitele acestei metode, ci și să luați în considerare încă un factor. Sistemele MP necesită, de obicei, configurații și modificări individuale complexe, inclusiv „instruire” pe o anumită temă - fără aceasta, ele arată rezultate mult mai proaste. În acest sens, este logic să folosiți traducerea automată numai dacă trebuie să traduceți volume uriașe de texte similare. În acest caz, va fi fezabil din punct de vedere economic să petreceți ceva timp pentru instruirea sistemului, apoi să aplicați traducerea automată și să obțineți textul de ieșire potrivit pentru posteditare. Dacă vorbim de câteva zeci de pagini, încercarea de a implementa traducerea automată este inutilă și pur și simplu neprofitabilă.

    Astfel, traducerea automată cu post-editare poate fi cu adevărat benefică dacă tipul potrivit de texte sunt traduse în volume foarte mari. Întrucât volume mari de traduceri trec prin companii de traduceri, care sunt adesea specializate în domenii specifice, introducerea unor sisteme de traducere automată de ultimă generație destul de eficiente, dar costisitoare, este justificată din punct de vedere economic în astfel de companii: nici furnizorii de conținut, chiar mari, nici individuali. traducătorii pot folosi în mod independent traducerea automată.

    Cărți uzate

    • 1. http://www.logrus.ru
    • 2. http://www.moluch.ru/
    • 3. https://www.academia.edu
    • 4. http://study-english.info/