多语言翻译软件 Antibabel

En résumé (grâce à un LLM libre auto-hébergé)

  • 《反巴别日记》记载了一项旨在开发高性能多语言翻译软件的举措。
  • 该项目旨在利用技术进步来处理大量语言数据。
  • 其目标是推动一场运动,而不仅仅是一个技术工具,通过探索语言的非线性结构来实现。

多语言翻译软件 Antibabel 日志

2004年10月3日

我查看了一下页面访问量统计,一周内访问量已超过7400次。也许是因为标题《愤怒一击》引起了读者的好奇心。但回应却十分冷淡。如果按1%的预期转化率计算,我本应收到74封邮件,而实际远未达到。但这并非问题所在。我们已经做出决定:某人将启动一个论坛,并负责管理它。必须立即明确,这是一个“工作论坛”,而非空谈闲聊。ANTIBABEL是一个宏大的构想,我们目前仅在探索阶段。但我们将赋予它实质内容。这是否意味着我们将依靠少数几个人,基于团队力量,开发出一款真正高效的多语言自动翻译软件,从而实现那些曾失败无数人的目标?

是,也不是。毫无疑问,这样的工具需要巨大的工作量。我们的目标是发起一场运动。解决方案并非世界语。我收到一位读者的留言,他简单地说:

“但问题在哪里?人们越来越使用英语,机场里早已成为标准。”

当然,世界由相互连接的航空领域构成,这众所周知。

我还收到过类似评论:

“那你们打算怎么处理韩语?”

天啊,如果能先在西方常用的二十几种语言中实现高效翻译,就已经是很好的开端了。

我们所有人之间曾通过邮件进行了相当热烈的头脑风暴。我们并不期待被动的反应。这一板块读者的自然反应是观望。所有人都会想:“他们到底想表达什么?”

确实,这个项目整体上似乎并未被充分理解,因为它彻底偏离了语言学家的传统思路。我正在写作,从左到右在一行中排列字符,我的信息是线性的。然而,这个观点并非我首创——在已有十年历史的ANTIBABEL项目中,我仅是沿用了一种构想:一句话更像一个分子,具有结构,即便不是三维的,至少也是二维的,而非线性物体。这是第一点。

读者们可能没有意识到的是,我们正计划充分利用当代计算机技术所能提供的一切可能性。请思考一下:不久之后,计算机主存容量将突破想象极限;硬盘容量也将因存储元件技术的突破而飞速增长。这些外部存储设备将在一个令人难以置信的短时间内,达到……拍字节,或……数百万兆字节的级别。因此,我们可以拥有任何东西,可以设想任何可能。

但我们要拥有什么呢?图像、动画、声音。语言将变成一个空前庞大的数据宝库,今天无人能想象其规模。我先做些预测:如果某天ANTIBABEL类软件真的运行成功,文本部分——管理多种语言——在内存中所占空间将微不足道,可能仅占1%。其余空间将被图像、动画和声音序列占据。

我们将开始寻找信号,即便不是普适的,至少是地球上众多民族共通的信号。