다국어 번역 소프트웨어 앤티바벨, 일지
2004년 10월 3일
페이지 조회 수를 확인해 보았다. 일주일 만에 7,400회 조회였다. 아마도 '분노의 한 방'이라는 제목이 독자들의 호기심을 자극한 것일지도 모른다. 그러나 반응은 매우 미약했다. 1%의 반응률을 기대했다면 74건의 메일을 받아야 했을 텐데, 그마저도 훨씬 못 미쳤다. 그러나 그게 문제는 아니다. 우리는 이미 결심했다. 무언가가 시작될 것이다. 우리 중 누군가가 작업용 포럼을 열고 관리하게 될 것이다. 명확히 밝혀야 할 점은, 이것은 말다툼을 위한 포럼이 아니라, 실질적인 작업을 위한 포럼라는 점이다. 앤티바벨은 거대한 아이디어이며, 우리가 지금까지 탐색하고 있는 것일 뿐이다. 그러나 이제 우리는 그 아이디어에 실체를 부여할 것이다. 이 말이 곧, 몇몇 사람들의 소규모 팀이 출발점이 되어, 드디어 성능이 뛰어난 다국어 자동 번역 소프트웨어를 만들어내고, 수많은 사람들이 실패한 곳에서 성공을 거두겠다는 뜻인가?
네, 그렇기도 하고 아닐 수도 있다. 분명히 이런 도구는 엄청난 작업량을 필요로 한다. 그러나 목표는 운동을 시작하는 것이다. 해결책은 에스페란토가 아니었다. 한 독자로부터 단순한 메시지를 받았다.
- "그런데 문제가 어디 있죠? 사람들은 점점 더 영어를 쓰고 있잖아요. 공항에서는 이미 표준이에요."
물론, 세계는 서로 연결된 공항들의 집합체로 이루어져 있다. 이건 잘 알려진 사실이다.
다른 독자들도 비슷한 반응을 보였다.
- "그럼 한국어는 어떻게 하실 건가요?"
글쎄, 지금이라도 서유럽에서 흔히 쓰이는 약 20개 언어에 대해 성능이 뛰어난 결과를 얻을 수만 있다면, 이미 훌륭한 시험주기라 할 수 있겠다.
우리 모두 사이에선 열정적인 브레인스토밍을 위한 메일 교환도 있었다. 우리는 수동적인 반응을 기대하지 않는다. 이 항목을 읽는 독자들의 자연스러운 반응은 기다림일 것이다. 모두가 이렇게 생각할 것이다. "이런 걸 뭐라고 하는 거지?"
사실 이 프로젝트는 전반적으로 잘 이해되지 않는 듯하다. 왜냐하면 언어학자들의 전통적인 접근 방식에서 완전히 벗어나기 때문이다. 나는 지금 글을 쓰고 있다. 왼쪽에서 오른쪽으로 한 줄에 글자를 나열하고 있다. 내 메시지는 선형적이다. 그러나, 이 아이디어가 나의 것이 아니라는 점을 밝혀야 한다. 이 앤티바벨 문서는 10년 전부터 존재해 왔고, 나는 단지 문장이 선형적인 대상보다는, 구조가 있음은 물론 3차원이 아니더라도 2차원적인 분자처럼 보인다는 틀을 되풀이한 것뿐이다. 이것이 첫 번째 점이다.
읽는 사람들이 아마도 인지하지 못한 것은, 우리가 현대 컴퓨터 기술이 제공하는 모든 가능성을 동원하려 한다는 점이다. 생각해 보라. 곧 컴퓨터의 주기억장치 용량이 상상도 할 수 없는 수준에 도달할 것이다. 하드디스크 역시 디스크에 정보를 저장하는 방식의 혁신으로 인해 마찬가지로 놀라운 성장을 보일 것이다. 이러한 외부 기억장치는, 믿기 힘들 정도로 가까운 미래에 테라바이트, 수백만 메가바이트 단위로 측정될 것이다. 따라서 우리는 무엇이든 가능하고, 무엇이든 상상할 수 있다.
그러면 무엇을 상상할 수 있을까? 이미지, 애니메이션, 음성. 언어는 지금은 누구도 상상할 수 없을 정도로 놀라운 데이터 베이스가 될 것이다. 나는 예측한다. 언젠가 앤티바벨 유형의 소프트웨어가 작동하게 된다면, 텍스트 부분은 메모리 공간에서 거의 무시할 수 있을 정도로 작을 것이다. 아마도 1% 정도일 것이다. 나머지 공간은 이미지, 애니메이션, 음성 시퀀스로 채워질 것이다.
우리는 이제, 보편적이지는 않더라도 지구상의 많은 민족들에게 공통된 신호를 찾아 나설 것이다.