Warning: mkdir(): Permission denied in /home/virtual/lib/view_data.php on line 81 Warning: fopen(/home/virtual/audiology/journal/upload/ip_log/ip_log_2024-04.txt): failed to open stream: No such file or directory in /home/virtual/lib/view_data.php on line 83 Warning: fwrite() expects parameter 1 to be resource, boolean given in /home/virtual/lib/view_data.php on line 84 Availability of Korean Monosyllabic Words for Speech Discrimination Test Materials
Korean J Audiol Search

CLOSE


Speech perception and produciton
Korean Journal of Audiology 2006;10(1):12-15.
Availability of Korean Monosyllabic Words for Speech Discrimination Test Materials
Sung Wan Byun
Department of Otolaryngology, College of Medicine, Ewha Womans University, Seoul, Korea
어음명료도 검사의 단음절어음표 작성에 필요한 한국어 단음절어 어휘의 확보
변성완
이화여자대학교 의과대학 이비인후과학교실
Abstract

Background and ObjectivesMonosyllabic words lists are used in speech discrimination test. According to the recent phoneme frequency studies, the preexisting test material need to be revised. This study aims to answer following questions. (1) How many monosyllabic words are there in Korean language? (2) Is it practically possible to find several appropriate monosyllabic words combinations from all combinations with robust computer algorithm?

Materials and Methods:There can be 11,172 characters in Korean alphabet. Computer-generated 11,172 queries with single character were sent one by one to the popular online dictionary services (Empas and Naver).

Results:There are 961 monosyllabic words in Korean language. Excluding exclamations, adverbs, archaics, suffixes, postpositions, pre-nouns which are inappropriate for speech discrimation test materials, 733 monosyllabic words are available. Four or two lists (200 or 100 monosyllabic words, respectively) are required for the test. In the selection of 200 or 100 from 733 words, about 1.23×10^185 or 2.92×10^125 combinations are possible, respectively.

Conclusions : It is practically impossible to check all monosyllabic words combinations even with robust computer algorithm. However, 733 words from this study would be valuable data for the revision of the test materials.

Keywords: Speech audiometry;Speech discrimination test.

교신저자:변성완, 158-710 서울 양천구 목동 911-1
교신저자:전화) (02) 2650-5156, 전송) (02) 2648-5604, E-mail:byunsw@ewha.ac.kr

서     론


어음청력검사의 어음명료도검사(speech discrimina-tion test)에서는 단음절어음표(monosyllabic word list)를 이용한다. 이 단음절어음표는 친숙한 어음으로 일상 회화에서 사용하는 어음의 빈도와 같은 구성을 가져야 한다.1)
한국어 일상 회화에서 사용하는 어음 음소의 빈도에 대하여 Park이 77,898음절에 대한 빈도를 조사하여 보고하였으며,2) Byun도 171,824음절3) 및 2,312,651음절에4) 대한 조사 결과를 보고한 바 있다. 이러한 빈도 조사에 따라 빈도가 다소 상이한 기존 어음표의 수정, 보완 또는 학회의 통일안 작성의 필요성이 대두되었다.
현재 사용되는 단음절어음표는 대부분 의미가 있는 단음절어 50개로 구성된 표 4개로 200개의 단음절어로 구성되어 있었다.5) 가장 많이 사용되는 함태영(1962) 어음표도6) 같은 구성이었다.5)
기존의 어음표를 수정, 보완하거나, 재작성하는 경우 두 가지 접근 방법이 가능하다. 첫째는 컴퓨터를 이용하는 처리 방법으로, 모든 한국어 단음절어 중에서 200개를 선택하는 모든 조합에서 원하는 음소 빈도로 구성된 조합을 몇 개 얻어내고, 어음의 친숙도 등에 따라 최선의 조합을 선택하는 방법이다. 두 번째는 기존의 어음표를 만든 것과 같은 수작업 방법으로, 결정된 빈도에 따라 적절하고 친숙한 단음절어를 하나씩 넣어가면서 빈도를 맞춰나가는 방식이다.
첫째 방법이 모든 조합을 검색하여 적절한 음소 빈도로 구성된 조합을 찾아내는 것이므로, 단음절어음표를 작성하는 가장 이상적인 방법이 될 것이지만, 이 이상적인 방법이 현실적으로 가능할 지가 궁금하였다.
본 연구는 다음을 알아보고자 하였다. (1) 한국어에는 과연 몇 개의 단음절어가 존재하는가? (2) 한국어에 n개의 단음절어가 존재한다면, n개에서 200개를 선택하는 수많은 조합 중 우리가 원하는 빈도를 가진 조합을 선택하는 것이 현실적으로 가능한가? 즉, 현재 상용중인 컴퓨터의 실행 속도가 두 가지 접근 방법 중 전자(컴퓨터를 이용하는 처리 방법)를 만족시킬 수 있는가?

재료 및 방법

사전의 내용을 다 가진 디지털 파일에서 단음절어를 고르는 방법이 가장 직접적인 방법이겠지만, 현실적으로 그러한 파일을 얻기 어려우며, 10여만 개 이상의 표제어 중 단음절어만을 골라내는 효과적인 검색 방법을 찾기에도 어려움이 있다.
최근 주요한 인터넷 검색 엔진들이 온라인 국어 사전을 운용하고 있다. 2005년 12월 현재 인터넷 웹(WWW,World Wide Web)에서 이용할 수 있는 온라인 국어사전으로 엠파스 국어사전(http://kordic.empas.com)과 네이버 국어사전(http://krdic.naver.com)이 있고, 두 온라인 사전 모두 16만 단어를 수록한 동아 새국어사전의 자료를 사용하고 있었다. 예를 들어‘강(江, river)’이란 단음절어에 대해 검색하는 경우, 엠파스 국어사전의 경우 다음과 같이 질의(query)하면 결과를 얻을 수 있었다.
http://kordic.empas.com/sw/show.tsp/?q=강
네이버 국어사전의 경우는 다음과 같았다.
http://krdic.naver.com/search.naver?query=강
한글에서 가능한 초성은 19개, 중성은 21개, 종성은 28개(종성없는 경우까지 포함)이므로 조합될 수 있는 문자는 19×21×28=11,172 문자이다(Table 1). 자동으로 각 문자에 대하여 질의, 즉 11,172회의 질의를 하는 프로그램을 작성하여 실행하였다(Fig. 1). 실제 실행 결과 네이버 국어사전은 일정 횟수 질의 답변 후 중단되었고, 엠파스 국어사전은 끝까지 실행되었다. 엠파스 국어사전의 자료로 작업하였다.

결     과

11,172개의 질의 중 사전에 내용이 존재하는 표제어로 인식되어 결과가 돌아온 것은 961개 였다. 즉, 엠파스 국어사전(동아 새국어사전)에는 961개의 단음절어가 수록되어 있었다. 이 중 단음절어음표의 구성으로 적합하지 않다고 판단한 감탄사(앗, 얏 등), 의태어 또는 의성어의 부사(꾹,쌩 등), 옛말(슷,솝 등), 접미사(껏,꾼 등), 조사(를,는 등), 관형사 등을 제외한 733개의 단음절어를 얻을 수 있었다(Table 2 and 3).

고     찰

733개의 단음절어 중 200개의 단음절어를 선택하는 조합의 개수는 조합의 공식

nCr= n!/ (n-r)!ㆍr!에서

n=733, r=200인 경우이다. 733!, 533!, 200!은 현재 상용하는 32비트 컴퓨터 연산의 한계를 벗어나는 큰 수치이므로, 직접 계산할 수 없었다. 상용로그(log)로 변환하여 덧셈 후, 10의 지수승을 이용하여 역변환하는 방법으로 크기를 측정하면, 733! / 533! 200! = 약 1.23×10185이 된다. 대략 현재의 32비트 컴퓨터가 초당 1000번의 조합의 음소빈도를 검정하므로, 이 검정 작업을 100년(약 3.15×109초) 실행하더라도 약 3.15×1012개의 조합에 대해서만 검정 가능할 것이다.
50 단음절어 표를 4개 대신 2개로 줄여도, 733개의 단음절어 중 100개의 단음절어를 선택하는 조합의 개수는 733!/633! 100!=약 2.92×10125이 된다. 역시, 현실적으로 컴퓨터를 이용하는 처리 방법으로는 불가능한 큰 경우의 수이다.
비록 이상적인 조합 방법은 현실적으로 불가능하다는 결론을 얻었지만, 733개의 단음절어 목록은 향후의 관련 연구나 단음절어음표 수정, 보완, 재작성에 중요한 자료를 제공한 것이라 생각한다.

결     론

한국어에는 어음표에 사용될 수 있는 단음절어가 733개 있었다. 733개의 단음절어에서 200개 또는 100개를 선택한 모든 조합의 음소 빈도를 검정하는 것은 현실적으로 컴퓨터로도 불가능하다. 이는 수작업 방법으로 단음절어음표 수정, 보완, 재작성에 임하여야 함을 의미한다.


REFERENCES

  1. Pendrod JP. Speech threshold and word recognition/ discrimination testing. In: Katz J. Handbook of clinical Audiology. 4th ed. Baltimore: Williams & Wilkins;1994. p.147-64.

  2. Park CI. Audiologic studies of Korean speech sounds part I: Analysis of frequencies and structures of Korean speech sounds. Korean J Otolaryngol 1971;14:1-8.

  3. Byun SW. Frequencies of Korean phonemes and reliability of Korean phonetically balanced word lists. Korean J Otolaryngol 2001;44:485-9.

  4. Byun SW, Kim JK, Lee SS, Bae JH. Excessive Post-Obstruent Tensing in Korean Spondee Word List: Comparison between the Colloquial Korean Language and Hahm's List. Korean J Otolaryngol 2005;48:596-600.

  5. Byun SW, Chung SM, Kim HS, Go YM. A Survey of Phonetically Balanced Words Lists Used in Training Hospitals in Korea. Korean J Otolaryngol 2005;48:1086-90.

  6. Hahm TY. Articulation function on the Korean speech in patients with hearing impairment. Catholic Med College J 1962;5:31-8.



ABOUT
ARTICLES

Browse all articles >

ISSUES
TOPICS

Browse all articles >

AUTHOR INFORMATION
Editorial Office
The Catholic University of Korea, Institute of Biomedical Industry, 4017
222, Banpo-daero, Seocho-gu, Seoul, Republic of Korea
Tel: +82-2-3784-8551    Fax: +82-0505-115-8551    E-mail: jao@smileml.com                

Copyright © 2024 by The Korean Audiological Society and Korean Otological Society. All rights reserved.

Developed in M2PI

Close layer
prev next