Antibabel meertalige vertaling software
Antibabel, dagboek
3 oktober 2004
Ik keek even naar de pagina-aantal. 7400 bezoeken in minder dan een week. Misschien was het titel "Koorts van woede" dat de lezers nieuwsgierig maakte. Maar de reactie bleef gering. Als we op 1% hadden gerekend, zou ik 74 e-mails moeten hebben ontvangen. We zijn verre van dat aantal. Maar dat is niet het probleem. We hebben ons besluit genomen. Er gaat iets gebeuren. Een van ons gaat een forum starten, dat hij zal beheren. Meteen duidelijk: een werkforum, geen praatgrage. ANTIBABEL is een groot idee, die we nog maar aan het verkennen zijn. Maar we gaan er lichaam en vlees aan geven. Betekent dit dat we, op basis van een klein team, een softwareprogramma voor automatische meertalige vertaling zullen maken dat eindelijk goed presteert, dus slagen waar zoveel mensen hebben gefaald?
Ja en nee. Het is zeker dat zo’n hulpmiddel een enorme inspanning vereist. Het doel is om een beweging op gang te brengen. De oplossing was niet Esperanto. Ik ontving een bericht van een lezer die simpelweg zei:
- Maar waar ligt het probleem? Mensen spreken steeds meer Engels. In vliegvelden is dat de standaard.
Natuurlijk, de wereld bestaat uit aaneengesloten vliegvelden, dat is bekend.
Ik kreeg ook andere opmerkingen van die strekking:
- Maar wat ga je doen met het Koreaans?
Doe maar, als we al iets presterend zouden kunnen realiseren voor de twintig of dertig "gewone" talen die in het Westen worden gebruikt, zou dat al een goede start zijn.
Tussen ons allen zijn er e-mails uitgewisseld die een behoorlijk geanimeerd brainstoring vormden. We hopen niet op passieve reacties. De logische reactie van de lezers van deze rubriek is onthouding. Iedereen moet zich afvragen: "Maar wat willen ze nou eigenlijk zeggen met dat ding?"
Het is waar dat dit project in het algemeen niet goed lijkt te worden begrepen, omdat het zich sterk onderscheidt van de klassieke aanpak van linguïsten. Ik schrijf nu. Ik zet tekens van links naar rechts op een regel. Mijn boodschap is lineair. Maar — en dit idee is niet van mij — in dit dossier ANTIBABEL, dat tien jaar oud is, had ik alleen maar een schema overgenomen waarin een zin meer lijkt op een molecuul, met een structuur, al was het dan niet driedimensionaal, dan toch tweedimensionaal, dan op een lineair object. Dat is punt één.
Wat de mensen die ons lezen waarschijnlijk niet hebben doorgehad, is dat we van plan zijn om alle mogelijkheden van de moderne informatietechnologie te benutten. Denk er eens over na. Binnenkort zullen centrale geheugens van computers waarden bereiken die de verbeelding te boven gaan. Hetzelfde geldt voor harde schijven, dankzij een vooruitgang in de manier waarop de elementen die op de schijf de gegevens opslaan, worden geplaatst. Deze externe geheugens zullen dus binnen een ongelooflijk korte tijd in ... terabytes, in ... miljoenen megabytes uitgedrukt worden. We kunnen dus alles doen, alles voorstellen.
Maar wat zouden we dan moeten doen? Beelden, animaties, geluid. De taal zal een fantastische databank worden, die niemand nu kan voorstellen. Ik speel vooruit. Als ooit een softwareprogramma van het type ANTIBABEL werkt, zal het tekstgedeelte, dat veel talen verwerkt, een schamele ruimte innemen in het geheugen. Misschien één procent. De rest zal worden ingenomen door beelden, animaties, geluidssequenties.
We gaan op zoek naar signalen, al zijn ze niet universeel, dan toch gemeenschappelijk voor een groot aantal aardse etniciteiten.