영문학과 학생으로 제일 부끄러울 때가 있다면, 영어로 쓴 레포트나 한국어로 쓴 레포트나 붉은 볼펜으로 맞춤법이 틀림을 지적하는 평가를 받았을 때이다. '이것도 저것도 아닌' 공부를 했다는 생각이 든다. 물론, 둘 다 공부를 해야하고, 꾸준히 문법과 맞춤법 공부를 하고 있다. 최근 온라인이나 디지털 매체에서 한글을 쓰는 일이 많아 지면서 맞춤법에 대한 우려와 논란이 계속되고 있다. 나는 결코 이것이 디지털 시대의 폐해라기 보다는 글을 쓰는 일이 많아 지면서 생기는 자연스러운 현상이라는 생각이 든다. 아래아한글 맞춤법 검사가 학생들의 맞춤법 실력을 낮췄다고만 할 수 있을까? 오히려 맞춤법에 대한 인식을 더 넓혀서 더 많은 사람들이 글을 정확하게 쓰도록 하는 게 나을 것이다.
국어의 디지털시대를 준비하기 위해서 필요한 것은, 디지털 환경에서 한글을 쓰는 방법에 대한 데이터베이스를 광범위하게 축적하는 것이다. 그것도 구글식으로 개방적으로 풀어야 할 것이다.
1. 국어 위키
국어 위키는 기본 맞춤법이나 국어 교육에 필요한 자료를 바탕으로, 다양한 사용자들의 사례등을 수집하고 공유할 수 있는 모델로 만들어야 한다. 특히 국립국어원의 자료나 각 방송사의 캠페인 자료라던지 하는 공익적 자료를 하나의 데이터베이스로 만들어서 찾아보기 쉽게 하는 게 중요할 것이다. 학교 학생들도 참고서로 활용할 수 있고, 틀린 예의 경우도 다양한 Q&A사례를 통해서 정보를 축적하는 게 중요하다.
2. 국어 샘플
국어의 샘플은 인터넷을 통해 연결할 수 있는 방대한 양의 데이터를 분석하고 정리하는 기술을 통해 구축할 수 있을 것이다. 구글같이 검색엔진에 이용할 수 있는 언어분석도구를 이용해서 온라인 상에서 자주 이용되는 언어적 패턴을 분석해야 한다. 자주 틀리는 말이나, 시대에 따라 변해가는 어법에 대한 자료도 수집할 수 있을 것이다.
3. 국어 엔진
위키나 샘플을 기반으로 맞춤법이나 국어 사용법에 대한 엔진을 구축해서 API형태로 공개를 하는 방법이 최종이 될 것이다. 맞춤법이나 바른 우리말 사용법을 제공하는 엔진은 레포트 작성이나 블로그 엔트리 포스팅이나 댓글, 이메일 등 글을 전달할 때 사용될 수 있다.
4. 매쉬업
언어를 분석해서 샘플을 만들고 위키를 만드는 과정은 국어 엔진을 이용하는 다양한 텍스트를 분석해서 추가할 수도 있다. 이런 과정에서 어떤 맞춤법이 자주 틀리는 지, 특정 표현이 맞춤법에는 어긋나지만 다수가 사용을 하는 지에 대한 자료도 얻을 수 있다. 이런 자료를 바탕으로 향후 맞춤법 교육에 어떤 점을 강조할 지도 방향을 수립할 수 있을 것이다. 그리고, 빈도상 자주 등장하지 않지만 중요한 맞춤법이나 좋은 말의 경우도 추천할 수 있는 근거를 찾을 수 있다.
5. 활용
국어를 처리하는 기술의 발달은 자연적으로, 기계가 우리말을 이해하는 데 중요한 단서를 제공한다. 개방된 기술과 다양한 매시업으로 사용이 되는 엔진이 있다면 우리말 기반의 인공지능 기술에도 상당한 도움이 될 것이다. 그리고, 이런 언어 분석 기술을 기반으로 DB에 근거한 레포트나 논문의 표절도 가려내는 것도 가능할 것이고, 텍스트 기반의 저작권 자료에 대한 보호도 이루어 질 수 있을 것이다. 또 휴대폰 한글 자동완성이나 음성 인식등의 특수한 언어 입력환경에 대한 기술이나 샘플도 공유될 수 있을 것이다.
이런 기술의 발달은 또한 국어의 체계화를 가져 오기 때문에, 자동 번역 엔진의 개발에도 응용될 수 있다. 외국어가 어떤 방식으로 한국어로 바뀌는 지에 대한 자료도 축적되어 공유된다면, 한국어와 다른 외국어간의 번역과 통역에도 영향을 줄 것이다.
구글의 온라인 워드프로세서와 지메일은 스펠링 체크를 지원한다. 아무 조건없이 어떤 플랫폼에서도 사용할 수 있는 이런 기술은 한국에서는 아래아 한글과 윈도+MS워드 환경이 아니면 사용하기가 힘들다. 그런 와중에 네이버 스마트 에디터가 구현한 맞춤법 검사 기능은 포털 사이트의 이익을 위한 것이긴 하지만, 사용성에 얼마나 많은 공을 들였는지를 느낄 수 있는 부분이다. 스마트 에디터라는 범용 에디터 엔진의 기술 개발은 검색을 제공하고 키워드에 따른 광고를 집행하는 포털사이트로서 공익도 실현하고 이익을 얻는 방식의 하나일 것이다.
국립국어원의 웹사이트는 방대한 국어관련 자료를 보유하고 있다. 오픈오피스용 맞춤법 검사 플러그인이나 태터툴즈용 플러그인에도 이용되는 DB가 구축되어 있기도 하다. 국립국어원을 중심으로 국어 처리를 해야 하는 교육기관이나 기업에서 공동으로 구축한 국어기술 관련 기관이 생기는 상황을 상상해 본다. 어디까지나 상상인 이유는 아무래도 이런 일이 한국에서 일어날 것 같지는 않기 때문이다.
항상 맞춤법이 틀린다고, 지금 세대는 공부하지 않고 게으르다는 핑계로 훈계만 할 게 아니라, 지금 시대에 맞는 기술을 갖추는 게 중요하다. 블로그와 싸이월드에 상당량의 글을 올리는 네티즌들에게 무료로 제공되는 국어 엔진이 교육에 역효과를 줄 일은 결코 없을 것이기 떄문이다. 언어의 경쟁력은 그럴 듯한 캠페인도 중요하지만 이런 기술적인 뒷받침도 중요하다.
온라인으로 무료로 맞춤법 체크를 받으려고 네이버 블로그에서 스마트 에디터를 띄웠다. 아직까지 스프링노트도 티스토리도, 다음도 이런 기능을 제공하고 있지 않기 때문이다. 그렇다고 네이버가 이런 기술을 공유할 것 같지도 않고, 구글이 한국어 맞춤법 기술을 갖출 것 같지도 않다. 그래서 더더욱 안타까운 마음에 이런 글을 쓴다. 만일, 내가 쓴 글에서 맞춤법에 어긋나는 말이 있다면, 제발 미래에는 내가 이렇지 않도록 범용 국어 엔진을 개발하는 데 많은 사람들이 힘을 써 주었으면 한다.
컴퓨터 기술의 발달로 언어의 기계 처리에 대한 관심이 더 높아질 것이다. 인공지능이나 인터페이스 등에 많은 도움이 될 언어 처리 기술은 결국 한 나라의 언어를 과학적으로 체계화 시키는 방법의 하나이기도 하다. 그리고 미래의 어느 시점에 '범용 문법(Universal Grammar)'이 발견된다면, 가장 체계적으로 운영되고 있는 언어가 경쟁력을 얻을 것이다.
미국의 문법 수업에서 미국 영어에 대한 표현 중에 인상깊었던 것이 하나 있다. 미국 영어는 "사생아 언어(a bastard language)"라는 것이다. 영국의 언어에 뿌리를 두고 지금은 전세계의 단어를 흡수해서 팽창해가는 국제적인 언어가 된 것을 비유하는 적절한 말이다. 그리고 이런 미국 영어의 복합성(Hybridity)은 언어에 대한 연구를 전세계에서 하고 그 자료가 공유되는 결과를 가져 왔다. 구글의 기술은 그런 언어를 기계가 빨리 이해하는 데 도움을 주고 있고, 인공지능의, 획기적 사용성의 시대에 맞춰 더 진화해 나갈 것이다.

