Traduction non disponible. Affichage de la version française.

Antibabel mnohojazyčný překladový software

En résumé (grâce à un LLM libre auto-hébergé)

  • Deník Antibabel popisuje iniciativu na vytvoření výkonného mnohojazyčného překladového software.
  • Projekt má využít technologický pokrok pro zpracování velkých objemů jazykových dat.
  • Cílem je spustit pohyb, nikoli pouze technický nástroj, prostřednictvím zkoumání ne lineárních struktur jazyka.

Antibabel multijazykový překladový software

Antibabel, denník

  1. října 2004

Podíval jsem se na počítadlo stránek. 7400 návštěv za méně než týden. Možná byl titulek „Rozruch“ zajímavý pro čtenáře. Ale odpověď zůstala slabá. Pokud bych čekal 1 %, měl bych dostat 74 e-mailů. To je daleko. Ale to není problém. Rozhodli jsme se. Něco se bude dít. Někdo z nás otevře fórum, kterému se bude věnovat. Je třeba okamžitě určit fórum pracovní a ne jen náhodné rozhovory. ANTIBABEL je velký nápad, který jen zkoumáme. Ale dám mu tvar. Znamená to, že vytvoříme na základě týmu několika lidí softwaru pro automatický multijazykový překlad, který bude konečně výkonný, tedy úspěšný tam, kde tolik lidí selhálo?

Ano a ne. Je jisté, že takový nástroj představuje obrovskou práci. Cílem je spustit pohyb. Řešením nebyl esperanto. Dostal jsem zprávu od čtenáře, který mi jen řekl:

- Ale kde je problém? Lidé mluví stále více anglicky. V letištích je to standard.

Samozřejmě, svět je tvořen společnými letišti, to je známo.

Měl jsem jiné poznámky podobného druhu:

- Co budeš dělat s korejštinou?

Proboha, pokud bychom mohli už nyní dosáhnout něčeho výkonného pro desítku běžných jazyků v západním světě, bylo by to už skvělé začátky.

Mezi námi všemi byly e-maily, které tvořily velmi zajímavé brainstormingy. Nečekáme reakce pasivní. Logickou reakcí čtenářů této sekce je očekávání. Všichni si řeknou „co to vlastně chtějí říct tím tím?“

Je pravda, že tento projekt není v celku dobře pochopen, protože se zásadně liší od klasického přístupu lingvistů. Píšu. Řadím znaky zleva doprava, na řádku. Můj text je lineární. A, a myšlenka není moje, v tomto souboru ANTIBABEL, starém deset let, jsem jen zopakoval schéma, podle kterého věta vypadá spíše jako molekula, se strukturou, alespoň 2D, než jako lineární objekt. To je první bod.

To, co čtenáři, kteří nás čtou, pravděpodobně nepostřehli, je, že plánujeme využít všechny možnosti, které nabízí současná informatika. Zvažte. Brzy paměťové čipy počítačů dosáhnou hodnot, které odporují představivosti. Stejně tak pevné disky, kvůli pokroku v způsobu ukládání prvků zajišťujících paměť na disku. Tyto externí paměti tak v neuvěřitelně blízké budoucnosti dosáhnou hodnot ... terabajtů, ... milionů megabajtů. Můžeme tedy všechno si dovolit, všechno si můžeme představit.

Ale co si dovolit? Obrazy, animace, zvuk. Jazyk se stane fantastickou databází, kterou nikdo dnes nemůže představit. Předpokládám. Pokud by někdy softwaru typu ANTIBABEL fungoval, část textu, která spravuje velké množství jazyků, zabírala by zanedbávaný prostor v paměti. Možná jeden procent. Zbytek by byl obsazen obrazy, animacemi, zvukovými sekvencemi.

Budeme hledat signály, alespoň společné pro velké množství zemských etnií, nebo alespoň univerzální.