Eventi

Gestione terminologica gratuita, l'alternativa migliore?

Calc, OmegaT, xmlglossary e Wikipedia

In progetti come "Wikipedia", il lavoro collaborativo necessita anche di un linguaggio comune. Questo aspetto rappresenta uno dei motivi per cui è stato creato "Wiktionary" o "Wikiwoerterbuch". La comunità open source sembra dunque indirizzata verso lo sviluppo di idee per la gestione terminologica e per la sua implementazione.

Molti fra coloro che si occupano di realizzare le guide utente, i manuali operativi o le guide online basate su strumenti open source e che applicano standard come "DocBook" o traducono con sistemi TM come "OmegaT" non amano essere costretti ad acquistare un programma commerciale per la gestione terminologica. Dopo aver studiato questo campo operativo possiamo proporre un'analisi di tre progetti distinti.


Software liberi si, ma non necessariamente gratuiti

Il concetto di open source è sinonimo di gratuito, ma semplicemente di "libero" e "aperto". I software open source possono essere usati, distribuiti e personalizzati in ogni modo possibile, in base alle preferenze personali. In contrasto con il solito concetto di "copyright", l'idea di base è invece quella di "copyleft", che garantisce la libertà di usare il software concessa dalla licenza GNU [1]. A questo scopo, anche il codice sorgente deve essere messo a disposizione di tutti liberamente. Chiunque modifichi le applicazioni deve però fornire anche la licenza per la nuova versione, come previsto dalla GNU General Public License (GPL) o, in alternativa, dalla GNU Lesser General Public License (LGPL) [2]. Allo stesso modo, gli autori possono fornire una licenza per le documentazioni di tali programmi o per i contenuti di un database open source come Wikipedia e quindi distribuirla liberamente, secondo quando previsto dalla GNU Free Documentation License (FDL).

Un vantaggio significativo dei software open source è rappresentato dalla grande comunità di sviluppatori che testano le nuove versioni, al fine di migliorarle da ogni punto di vista. Il rovescio della medaglia è che per tali programmi non è possibile garantire la piena funzionalità o la presenza di un supporto tecnico che permetta di risolvere eventuali problemi.

Un'alternativa a Excel, Access & Co: OpenOffice

Il pacchetto OpenOffice, considerato un'alternativa a Word, Excel e Access di Microsoft Office, copre un'ampia gamma di applicazioni, tra cui "Writer", per l'elaborazione testi, "Calc", per la creazione di fogli di calcolo e "Base", per la gestione dei database [3]. Il lavoro terminologico, inteso come alternativa per la gestione dei glossari multilingue o per gli elenchi delle abbreviazioni di Excel o Access, è possibile anche con gli applicativi "Calc" o "Base". In 'technical communication', Vol. 2/2005 [4], il saggio "Terminologie mit Hausmitteln" (terminologia fai-da-te) descrive le problematiche relative all'uso di tali applicazioni. Va inoltre ricordato che molti dei documenti realizzati con il pacchetto OpenOffice possono essere successivamente tradotti con altri strumenti open source come "OmegaT", "OoXLate", "ForeignDesk" o "Wordfisher", solo per citarne alcuni.

La terminologia nelle memorie di traduzione: OmegaT & Co

Nonostante lo sviluppo di programmi come ForeignDesk sia stato sospeso, al momento [6] sono ancora molti i programmatori e le comunità di utenti che continuano a dedicarsi a un sistema TM denominato OmegaT [5].

Così come avviene nei sistemi commerciali come STAR, SDL o Across, anche i sistemi open source includono, oltre a un editor e a una memoria di traduzione, un componente terminologico che memorizza le coppie di frasi (ovvero i segmenti di traduzione) per poterle riutilizzare. Il componente terminologico mostra al traduttore le definizioni nella lingua di partenza insieme ai relativi equivalenti nella lingua di arrivo.


Fig. 1: l'interfaccia di OmegaT

Il componente terminologico di OmegaT consiste in una tabella a 3 colonne. Nella prima colonna vengono raccolti i termini nella lingua di partenza, mentre nella seconda colonna quelli nella lingua di arrivo. La terza colonna presenta informazioni aggiuntive. È possibile utilizzare anche ulteriori colonne, ma verranno comunque ignorate da OmegaT.

OmegaT consente inoltre l'utilizzo di glossari creati con la funzione di esportazione testo di MultiTerm (Trados). L'unico requisito richiesto è che presentino l'estensione "*.tab" per il nome del file e che le colonne con la lingua di partenza e di arrivo corrispondano ai primi campi. I glossari di OmegaT presentano la codifica UTF8. Verrà presto supportato anche il formato TBX, standard XML.

All'interno di un progetto di traduzione, l'utente può visualizzare varie voci provenienti da glossari diversi. A differenza degli strumenti disponibili in commercio, non possono essere elencate le forme flesse ma soltanto le voci con una corrispondenza esatta. Se nel testo di partenza sono presenti più forme flesse, le voci saranno proporzionalmente inferiori nel componente terminologico. In fase di traduzione, i nuovi termini nella lingua straniera possono essere aggiunti al file del glossario tramite un qualunque editor di testi. Una volta riavviato il progetto, i nuovi termini verranno riconosciuti automaticamente. Dopo aver presentato il componente terminologico piuttosto elementare presente in OmegaT, vale la pena di passare ad analizzare la soluzione "xmlglossary", un open source divenuto realtà nel corso del progetto AXitd.

xmlglossary: per la creazione di HTML e PDF

L'applicazione xmlglossary sfrutta Excel come interfaccia di input [7]. Nell'applicazione standard è presente un elenco Excel con dati relativi a cinque lingue: tedesco, inglese, francese, spagnolo e italiano. Xmlglossary dà la possibilità di includere e pubblicare definizioni, forme abbreviate, nomi dei tester, elementi grafici e istruzioni.


Fig. 2: una scheda di xmlglossary in formato HTML

È possibile aggiungere ulteriori campi, sarà però necessario aggiornarli anche nei relativi file. Relativamente a questo aspetto, il pacchetto risulta ben documentato, per quanto riguarda invece l'applicazione, si richiede all'utente una serie di conoscenze pregresse. I dati presenti in questo elenco Excel possono essere esportati tramite macro in formato HTML (XLS R XML-XSLT R HTML) o PDF (XLS R XML-XSLT R XLS:FO R PDF).

È inoltre disponibile una macro per lo standard TMX, usato per lo scambio di dati all'interno di sistemi TM. Nel caso in cui sia necessario inserire i propri dati terminologici direttamente in formato XML, basterà usare lo schema DTD fornito insieme al pacchetto.

Un valore aggiunto indiscutibile di xmlglossary è rappresentato dalla possibilità di pubblicare facilmente i propri documenti in formato HTML e PDF. L'utente può rendere visibili all'intera azienda i risultati del proprio lavoro terminologico, in modo rapido e senza difficoltà.

Wiki dictionary: Database con MySQL e PHP

Attualmente, Wikipedia rappresenta un qualcosa di unico nell'ambito delle enciclopedie presenti in Internet. Tutti possono contribuire alla sua espansione, sia aggiungendo nuove voci sia modificando quelle esistenti.

Il progetto si basa su un database MySQL in cui vengono memorizzate le informazioni contenute nelle voci enciclopediche, pubblicate su Internet sfruttando un webserver Apache e il linguaggio di scripting PHP. Le fondamenta della piattaforma database sono costituite da MediaWiki, un'applicazione database open source.

Oltre al progetto "Wikipedia", si stanno portando avanti anche i progetti "WikiQuote", una raccolta di citazioni, "WikiSource", una collezione di fonti e "Wiktionary", un dizionario. Il "Wikiwoerterbuch", l'equivalente in lingua tedesca del Wiktionary inglese, è stato creato nel maggio del 2004 e presenta già più di 15.000 voci [8]. Grazie ad alcuni modelli è possibile standardizzare la struttura di ogni voce.

Il Wikiwoerterbuch non è soltanto un dizionario ma anche un database terminologico. Per un sostantivo come Zitrone (limone) è possibile indicare la parte del discorso, il genere, la pronuncia, il significato, l'abbreviazione e l'etimologia, oltre a sinonimi, categorie e immagini.


Fig. 3: la voce Zitrone (limone) in Wiktionary


Uno dei principali vantaggi di Wikiwoerterbuch è rappresentato dalla documentazione relativa ai processi di coordinazione e modifica. Tutti gli iscritti hanno a disposizione la sezione "Discussione" per proporre suggerimenti e modifiche prima di implementare dei cambiamenti. Le modifiche alle voci vengono memorizzate in modo automatico insieme alla data, alle informazioni sull'autore e ai motivi della modifica. Grazie al software soggiacente MediaWiki è possibile assegnare agli utenti attributi di lettura e scrittura diversificati. Un altro punto di forza è rappresentato dalla strategia di collegamento. Un link ad altre schede esistenti è di colore blu, mentre un link a schede non ancora disponibili è rosso.

Al momento, un gruppo di esperti sta lavorando a un progetto per convogliare tutti i Wiktionary multilingue in un unico database. Una volta sviluppato il progetto, chiamato "Ultimate Wiktionary" [9], gli utenti potranno scegliere liberamente la lingua dell'interfaccia, così come avviene per i database terminologici in commercio. Inoltre, gli utenti potranno anche scegliere direttamente la lingua di partenza e di arrivo.

Conclusioni e previsioni

All'interno dell'ambito della gestione terminologica, la comunità open source è impegnata nella ricerca di soluzioni che potranno diventare presto "accettabili". Tuttavia, per il momento non esiste alcun progetto open source che possa contare appieno su tutti quei requisiti di base richiesti in fatto di database terminologici, capacità multilingue e orientamento terminologico. Anche esaminando i programmi disponibili in commercio, l'evoluzione iniziale da un punto di vista incentrato su un sostantivo a una visualizzazione focalizzata sul termine dei dati terminologici rappresenta ancora un processo di apprendimento a lungo termine [10]. Per quanto riguarda le applicazioni gratuite, sta a noi consentire allo sviluppo di compiere un ulteriore passo in avanti.

Dr. phil. Rachel Herwartz (36), linguista, insegna presso la Fachhochschule (Facoltà di scienze applicate) di Furtwangen ed è docente del Tecteam, Bildungsinstitut für Technische Kommunikation di Dortmund, in Germania. Vanta otto anni di esperienza nei settori della Documentazione tecnica, della Terminologia e del Translation Management. Nel 2004 ha fondato TermSolutions, un'azienda con sede a Langenargen, nella regione del Lago di Costanza.

Traduzione fornita da Ic.Doc srl