|
||||
|
자유토크 | ||||||||
'음성인식' 기술발전에 사투리가 문제 울랄라 | 2011.09.13 | 조회 12,388 | 추천 2 댓글 1 |
||||||||
음성인식기를 개발하면서 서울 사람이 돼 버렸죠. 사투리를 쓰면 컴퓨터가 못 알아들어요.”
삼성종합기술원에서 음성인식 엔진을 개발하는 최인정(31) 박사의 말에서는 눈곱만치도 경상도 사투리를 느낄 수 없다. 그의 고향은 경북 상주. 대학 입학 직전까지 그는 고향에서 학교를 다녔다. 하지만 8년 동안 음성인식 기술을 개발하면서 자신도 모르는 사이에 표준말이 몸에 배어버렸다. 삼성종합기술원의 음성연구팀 30명 가운데 경상도 출신은 최 박사를 포함해 2명뿐. 대부분은 서울 경기 사람들이다. 이 팀의 책임자 김상용 박사는 사투리 쓰는 사람을 차별하지 않을 수 없다고 솔직히 말한다. 지방 출신들은 자신의 발음이 틀린지 모르는 경우가 허다하고, 테스트에서도 표준말을 쓰는 사람들보다 2배 이상 인식 실패율이 높다는 것이다. 김 박사는 “표준말을 쓰는 사람은 국민의 절반이지만, 이들의 구매력은 전체의 80%를 차지해 사투리 음성인식 프로그램은 시장성이 거의 없다”고 말한다. 음성인식 프로그램이 컴퓨터 가전제품 전화 어디에나 쓰이기 시작하면서 사투리를 쓰는 사람들이 원하지 않게 ‘컴맹’이 될 가능성이 높아지고 있다. 더 중요한 사실은 음성인식 기술이 최인정 박사의 경우처럼 아예 사투리를 멸종시킬지도 모른다는 점이다. 텔레비전과 라디오에서 표준말이 쏟아져 나와도 지방에서는 아랑곳없이 사투리를 쓴다. 귀로 표준말을 들을 뿐이지, 얘기할 때는 언제나 사투리로 말하기 때문이다. 하지만 음성인식기는 ‘사투리 킬러’이다. 음성인식 프로그램이 내장된 기계를 불편 없이 쓰려면 표준말로 말하지 않으면 안되기 때문이다. 음성인식은 산소처럼 생활의 필수품이 될 전망이다. 음성 다이얼 휴대폰, 음성 명령컴퓨터가 이미 시판됐고, 한국통신은 음성인식 증권 정보 서비스를 제공하고 있다. 머지 않아 대화형 자판기, 로봇, 자동차가 등장할 것이다. 일기예보와 홈쇼핑, 자동 예약, 전자 메일, 문서작성도 컴퓨터와 대화로 하게 될 전망이다.
마우스와 키보드가 사라질 징조는 벌써 나타나고 있다. 이번 달 디앤엠테크놀로지는‘보이스 익스플로어러’란 이름의 음성인식 웹브라우저를 내놨다. 이 브라우저의 이용자는 마우스 없이 오직 음성만으로 웹사이트를 항해할 수 있다. 하지만 디앤엠테크놀로지는 이 브라우저에 쓸 4백 명의 음성을 채집하면서 지방 사람들은 제외시켰다. 외국계 기업인 L&H사도 올해 안에 최초의 한국어 구술 프로그램을 내놓을 예정이어서 40개가 넘는 국내 음성관련 기업들이 바짝 긴장하고 있다. 이 프로그램을 이용하면 말로 문서를 작성하고 이메일도 써서 보낼 수 있다. 이 회사도 수천 명의 음성을 채집해 음성인식 엔진용 데이터베이스를 만들었다. 목소리 채집 대상에 다행히 지방사람들을 포함시켰지만, 이 회사는 이들에게 사투리가 아닌 표준말로 발음을 하게 했다. 그래도 사투리 억양이 심하면 데이터베이스에서 제거했다. 삼성종합기술원 최승호 박사는 음성인식 소프트웨어 개발업체들이 사투리하면 진저리를 치는 기술적 이유로 세 가지를 든다. 첫째 음성인식 프로그램에 사투리를 포함할 경우 단어의 숫자가 기하급수적으로 늘어나 컴퓨터가 감당을 못한다. 둘째 사투리는 표준말과 문법 체계도 달라, 프로그램이 매우 복잡해지고 문법끼리 충돌하기도 한다. 가장 중요한 것은 셋째 이유다. 프로그램에 사투리 억양을 모두 담을 경우 발음들 사이의 경계가 모호해져 프로그램의 인식률이 크게 낮아진다는 점이다. 특히 경상도 사람들은 복모음을 발음하지 못하기 때문에 인식률이 가장 떨어진다. 서울 사람들은 ‘경제’를 실제로는 ‘겨엉제’ 하지만, 복모음을 발음 못하는 경상도에서는 ‘갱제’한다. 또 ‘쌀’을 ‘살’로 발음한다. 디엔엠테크놀로지 대표 정익주 강원대 교수는 “정부가 나서서 사투리 음성데이터베이스를 구축해 개발업체가 공유할 수 있게 하는 등 공익적 차원의 지원이 필요하다”고 말했다. 독특한 억양과 어휘 그리고 정서까지도 간직한 언어의 보고 ‘사투리’가 21세기에도 생명을 이어갈 수 있을지는 정부의 손에 달린 것 같다 |
||||||||
|
||||||||
|
||||||||
|
||||||||
|
||||||||