Eventi

Sfatare i miti della traduzione automatica

Non sorprende che la traduzione automatica sia un ambito in cui abbondino miti, mezze verità e fraintendimenti: a quanto pare, infatti, l'esperienza con questa tecnologia per molti attori del settore della traduzione non va oltre i tool di traduzione disponibili online, utilizzati alla stregua di un momentaneo passatempo. Nella speranza di fare chiarezza a riguardo, qui di seguito verranno passati in rassegna i miti più comuni relativi alla traduzione automatica. Quasi ogni settimana, mi capita di leggere articoli in cui si sostiene che la traduzione automatica è, e sarà, sempre una vera e propria perdita di tempo oppure che la traduzione automatica, pur essendo adesso una perdita di tempo, in effetti potrebbe risultare utile in un dato momento in un futuro remoto.


Mito: la traduzione automatica proprio non serve
Con i servizi gratuiti di traduzione online presenti in tutto il Web, chiunque può far passare un testo attraverso un motore di traduzione automatica (TA) e poi rendere noto i risultati, a riprova del fatto che tale sistema, oltre a essere, naturalmente, una fonte inesauribile di spasso, non è in grado di fare molto altro se non svolgere le traduzioni più elementari fornendo una versione approssimativa (il cosiddetto gisting).

Il problema centrale con i ‘testi' così ottenuti è che, usando uno degli ambienti di traduzione gratuiti ondine, si ha solo una visione parziale del reale potere di un sistema professionale di traduzione automatica di tutto rispetto. Ad esempio, il tipico servizio di traduzione online non consente di selezionare un campo tematico o di aggiungere la terminologia dell'utente, men che meno di impostare le preferenze stilistiche. In effetti, molti, se non quasi tutti, gli strumenti gratuiti di traduzione testi disponibili in rete consentono solo di specificare la combinazione linguistica e il testo di partenza senza supportare altri parametri di traduzione. Non c'è da stupirsi, quindi, se le traduzioni prodotte da questi siti Web di traduzione automatica rasentino il ridicolo in quanto del tutto fuorvianti.

Realtà: la traduzione automatica migliora la produttività e l'uniformità dei traduttori umani

Ogni volta che viene creato un nuovo testo di partenza per un progetto, tale testo prima o poi dovrà essere tradotto. Anche se si opera in ciò che è considerato un globalization environment all'avanguardia, ossia un sistema integrato del flusso di lavoro di traduzione e gestione dei contenuti, ci si ritroverà sempre con una certa percentuale di frasi con scarsa o nessuna corrispondenza (low match o no match).

In un progetto di globalizzazione ben pianificato e ben gestito in cui gli autori, nonché gli sviluppatori software utilizzano un apposito glossario completo per il progetto e adottano una guida di stile volta a favorire la leggibilità/comprensibilità, le frasi con scarsa o nessuna corrispondenza possono essere pre-trattate in un sistema di traduzione automatica prima di essere modificate dai traduttori umani.

Vantaggi della pre-traduzione generata automaticamente

  • I traduttori hanno sempre una proposta su cui lavorare invece di iniziare una nuova traduzione dal nulla. Un case study rappresentativo condotto di recente presso Symantec indica che la produttività dei traduttori umani può essere raddoppiata se le frasi non note sono 'pre-trattate' in un sistema di traduzione automatica.
  • Benché la maggior parte delle traduzioni debba essere editata e molte addirittura riscritte, è corretto attendersi che una percentuale considerevole di traduzioni generate automaticamente risulti perfetta (ciò avviene in particolare con brevi istruzioni, titoli, leggende e testi simili).

Il minimo che si può ottenere è che i termini chiave siano tradotti in maniera corretta e uniforme, e non solo. Nella maggioranza dei casi i termini saranno anche coniugati come si deve e compariranno correttamente al singolare o al plurale (provate a farlo con la vostra memoria di traduzione!)

Realtà: la traduzione automatica consente la traduzione di materiale che altrimenti non verrebbe tradotto

Sono pochissime le organizzazioni che attualmente traducono tutto il materiale utili in tutte le lingue parlate dai loro clienti esistenti o futuri. La ragione principale è che per molte tipologie di documenti, specialmente nell'ambito del post-vendita, manca semplicemente il budget per una traduzione umana su larga scala.

Un certo numero di organizzazioni ricorre a soluzioni basate sulla traduzione automatica al fine di rendere accessibile ai clienti grandi volumi di testo nella rispettiva lingua locale senza però coinvolgere i traduttori umani nel processo. La Microsoft Knowledge Base, che contiene oltre 200.000 documenti in inglese, è un celebre esempio di archivio testi in cui il numero di documenti tradotti automaticamente supera di gran lunga quello tradotto dalle persone.

Mito: i sistemi di traduzione automatica possono gestire solo una traduzione parola per parola

La convinzione che la traduzione automatica sostanzialmente si limiti a una sostituzione in sequenza di parole nella lingua di partenza con parole in quella d'arrivo è ampiamente sostenuta ed errata al tempo stesso. Tutti i noti sistemi di traduzione automatica, tra cui i servizi gratuiti di traduzione online quali systransoft.com, translate.google.com e windowslivetranslator.com utilizzano algoritmi altamente sofisticati che sono il risultato di anni di ricerca e sviluppo.

Realtà: non c'è una, ma tante tecnologie di traduzione molto diverse fra loro e tutte in grado di produrre ottimi risultati traduttivi nell'ambiente giusto

La traduzione automatica è stata lanciata oltre 50 anni fa e nell'arco di mezzo secolo è stata sviluppata una vasta gamma di tecnologie di TA, ad es. basate su dizionari, regole, esempi e statistiche, nonché infinite forme ibride. Seguirà ora una breve discussione delle tre tecnologie di traduzione automatica più importanti oggi nelle applicazioni commerciali.

Traduzione automatica basata su regole

La traduzione automatica basata su regole, nota anche come traduzione automatica basata sul principio del trasferimento, è oggi il paradigma prevalente per la TA. Systran, Babelfish, promt, per citarne alcuni, sono tutti sistemi basate su regole. I sistemi di questo genere utilizzano un processo di traduzione suddiviso in tre fasi:

1. Fase di analisi: esegue il parsing della frase di partenza per trasformarla in una struttura sintattica ad albero.

2. Fase di trasferimento: converte l'albero sintattico per la lingua di partenza nel corrispondente albero della lingua d'arrivo.

3. Fase di generazione: popola l'albero d'arrivo con le parole corrispondenti per creare una frase nella lingua d'arrivo.

Benefici della traduzione automatica basata su regole

  • La tecnologia e matura e comprovata e può essere implementata rapidamente e a costi relativamente ridotti.
  • Vi sono molti sistemi commerciali disponibili che coprono molte combinazioni linguistiche.
  • Sono altamente personalizzabili a livello di impostazioni dei dizionari e degli stili (alcuni sistemi supportano anche la personalizzazione della base di regole).

I sistemi di traduzione automatica basati su regole da anni sono usati in ambienti commerciali, ad es. presso Autodesk, Daimler e il Servizio di traduzione della Commissione Europea. Si individuano principalmente due punti deboli nella TA basata su regole: innanzitutto, la base di regole di qualsiasi sistema è necessariamente limitata, nel senso che per ottenere risultati migliori, gli autori devono adeguare il loro stile di scrittura e, in secondo luogo, sebbene i pacchetti commerciali di traduzione automatica basata su regole siano disponibili per dozzine di combinazioni linguistiche, molte lingue non sono ancora attivate.

Traduzione automatica statistica

La traduzione automatica statistica (statistical machine translation, SMT) in questi giorni sta suscitando enorme attenzione da parte dei media, soprattutto dopo che Microsoft ha annunciato di utilizzare un sistema di SMT proprietario per tradurre l'immenso archivio di documenti della Knowledge Base e anche Google, con il proprio motore di traduzione automatica statistica, ha vinto una competizione su larga scala volta a valutare la traduzione automatica.  I sistemi di traduzione automatica statistica in genere presentano due componenti principali:

  • Modello di traduzione: genera proposte di traduzione sulla base delle corrispondenti sequenze di parole in banche dati allineati lingua di partenza / lingua di arrivo.
  • Modello di lingua: seleziona la migliore proposta di traduzione sulla base delle banche dati solo nella lingua d'arrivo.

La nota positiva riguardante la traduzione automatica statistica è che, una volta che un sistema SMT è stato impostato su dati specifici del cliente, si ha a disposizione la tecnologia di TA che dovrebbe assicurare la maggiore qualità a livello traduttivo. Il rovescio della medaglia è che lo sforzo di preparazione richiede un corpus sostanzioso di traduzioni esistenti: Language Weaver, il fornitore di punta di sistemi di traduzione automatica statistica, consiglia un corpus bilingue di due milioni di parole o superiore per ogni combinazione linguistica. Per via degli elevati requisiti di istruzione, cui si unisce un prezzo ufficiale tendenzialmente superiore per i sistemi di traduzione automatica statistica rispetto ad alcuni sistemi basati su regole, questa tecnologia di TA è usata principalmente da agenzie governative, in particolare nel mondo dei servizi segreti, e da grandi aziende.

Traduzione automatica diretta

Nella sua forma più primitiva, l'unica funzione del sistema di traduzione automatica diretta consiste nel sostituire le parole nella lingua di partenza con un termine corrispondente in quella d'arrivo – nella stesso ordine e senza analisi o elaborazione linguistica. L'unica risorsa usata dalla traduzione automatica diretta è un dizionario bilingue, ragion per cui questa tecnologia di TA è anche nota come traduzione automatica basata sui dizionari.

Trattandosi di una tecnologia non particolarmente elaborata, la traduzione automatica diretta da anni è considerata obsoleta e quasi non esiste più alcun prodotto in commercio che utilizzi tale sistema.

Malgrado presenti capacità limitate, credo fermamente che la traduzione automatica diretta abbia ancora un posto nell'odierno 'arsenale' di strumenti di traduzione assistita. Per una serie di applicazioni reali comuni, la sostituzione parola per parola o sintagma per sintagma è tutto ciò che ci vuole per una traduzione riuscita. Basti pensare agli ambiti in cui il vocabolario e la sintassi sono ambedue standardizzati, come nel caso delle previsioni del tempo, dei profili finanziari e di molte applicazioni di e-commerce.

In una recente implementazione, Medtronic, un grande produttore di dispositivi medicali, ha usato la traduzione automatica diretta per tradurre in più lingue una nutrita banca dati di prodotti [4]. La traduzione umana non era tra le opzioni di questo progetto per via dei timori relativi ai costi e, ebbene sì, alla qualità (da un'analisi dei precedenti progetti affidati a traduttori professionisti emergeva un tasso di errore di entità non accettabile per quanto riguarda i valori numerici, tra cui codici prodotto e dimensioni). Inoltre, i test iniziali avevano dimostrato che le memorie di traduzione e i sistemi di traduzione automatica basata su regole avevano prodotti scarsi risultati con testi aventi le seguenti caratteristiche:

  • bassa o nessuna ripetizione a livello di frase;
  • elevata ripetizione a livello di parola/sintagma;
  • stile telegrafico/ellittico, ad es. ‘venti da- direzione meridionale, velocità che raggiunge 55 km/h', ‘American Technology Associates (AMTA) forte acquisizione, Avion (AVIO) superiore alla media di mercato', o ‘piastra 2456dr15 ad angolo retto, fessurata, 15 ea'.

Questo tipo di progetto di traduzione è certamente tra quelli di cui potrebbe fare tranquillamente a meno qualsiasi traduttore umano dotato di amor proprio. E dal momento che la traduzione automatica diretta non richiede il post-editing umano nel migliore dei casi, l'utilizzo della TA in questo genere di ambiente per una volta potrebbe esse ben accolto dai traduttori (i quali potrebbero non amare questo tipo di traduzioni) e dagli acquirenti della traduzione (che potrebbero gradire, invece, l'idea di traduzioni quasi istantanee e quasi gratuite).

Mito: la traduzione automatica è solo per le grandi organizzazioni

Sì, è vero: se leggete di qualche success story di traduzione automatica, di solito provengono dai Caterpillar, Microsoft e Symantec. Ma lo stesso può dirsi di molte, anche se non della maggioranza, delle tecnologie emergenti. Altrettanto vero è che alcuni dei sistemi più potenti di traduzione automatica in uso al giorno d'oggi sono il risultato di programmi di ricerca e sviluppo milionari che solo i giganti dell'industria possono permettersi. Tuttavia, ciò non significa che si devono spendere grosse cifre per mettere in piedi una soluzione basata sulla traduzione automatica.

Realtà: accessibili economicamente e di facile utilizzo, molti pacchetti di traduzione automatica sono disponibili anche per le imprese di dimensioni più ridotte, compresi i liberi professionisti

Basterà fare una breve ricerca per scoprire che molti pacchetti commerciali di traduzione automatica rientrano nella stessa fascia di prezzo dei loro omologhi riguardanti la traduzione assistita. Il più delle volte ciò si riscontra nelle soluzioni per postazioni di lavoro per singoli utenti e soluzioni client-server per molti utenti. E non è più un segreto che mentre tra le versioni per le grandi aziende e le piccole imprese possono esserci differenze di diversa misura, il motore centrale di traduzione in genere è lo stesso in ambedue i prodotti. In altri termini, quando si tratta della qualità di una traduzione pre-confezionata, in genere c'è poca, se non alcuna differenza,, tra la versione professionale da 1.000 dollari e la versione aziendale da 50.000 dollari di un determinato prodotto di traduzione automatica.

Va aggiunto che gli sviluppatori dei sistemi commerciali di traduzione automatica hanno investito enormemente per rendere i loro prodotti i più intuitivi possibile. Non a caso, direi che è persino più facile, e certamente più veloce, produrre la prima traduzione con un prodotto tipo di TA che con un tipico strumento di memoria di traduzione.

Ulteriori spunti di riflessione:

- Molti prodotti di traduzione automatica di basso prezzo sono dotati di un modulo incorporato per la memoria di traduzione (TM), al fine di migliorare l'efficienza del processo di post-editing (‘non correggere mai lo stesso errore due volte'), e pochi sistemi di TA come promt Expert sono perfettamente integrati con il sistema di memoria di traduzione di SDL Trados.

Una serie di fornitori di tool di traduzione, quali Across, che serve piccole e medie imprese, offre pacchetti di sistemi di TM-TA e/o l'integrazione di TA attraverso l'API.

La formazione degli utenti e la personalizzazione del  sistema di TA (ad es. realizzazione di dizionari), che sono i principali fattori nel conseguire i migliori risultati possibili nella traduzione, spesso sono più facili da ottenere in organizzazioni più piccole che in quelle più grandi.

In sintesi

Sin dagli esordi, la traduzione automatica è una tecnologia altamente controversa e, probabilmente, continuerà ancora ad esserlo per qualche tempo. La questione per lo più è alimentata da false presunzioni su ciò che la traduzione automatica può fare e su chi potrebbe ottenere beneficio dall'uso di questo tipo di tecnologia. Posso affermare apertamente che in generale i sistemi commerciali di traduzione automatica disponibili attualmente non possono rimpiazzare i traduttori umani, specialmente se tali sistemi di TA vengono utilizzati da chi non ha alcuna formazione linguistica. Tuttavia, se l'obiettivo è migliorare l'efficienza del processo traduttivo da parte di persone o creare traduzioni comprensibili in ambienti in cui la traduzione umana non è contemplata, e se tali sistemi vengono impiegati da traduttori professionisti preparati e motivati, la traduzione automatica è ed è stata una soluzione molto efficace.

Uwe Muegge è terminologo presso la società Medtronic, un produttore nel campo delle tecnologie medico-terapeutiche. È membro del Comitato Tecnico ISO 37 SC3 Applicazioni informatiche per la Terminologia e insegna Gestione della terminologia e Traduzione assistita presso il Monterey Institute of International Studies a Monterey, California.