유령 문자

덤프버전 :


파일:漢.svg[[파일:漢_White.svg 한자
[ 펼치기 · 닫기 ]
서체와 자형
갑골문 · 금문 · 전서 · 예서 · 해서 · 행서 · 초서 · 정자(표준자형) · 간체자 · 신자체(목록 · 변화 규칙) · 본자 · 속자 · 약자 · 이체자 · 한중일 한자
성질과 분류
획(필순) · 구조 · 파자 · 육서 · 상형자 목록 · 훈음 · 부수 · 부수(중국) · 부수(설문해자)
표준화
상용한자(한문 교육용 기초 한자 · 당용한자 · 일본의 상용한자 · 학년별한자배당표 · 통용규범한자표) · 한자검정시험 · 어문회 급수 · 인명용 한자표
주음·표음화·한자음
반절 · 주음부호 · 병음 · 한어병음 · 훈독 · 음독 · 속음 · 한국 한자음 · 일본 한자음 · 상고음 · 중고음 · 양안 간의 독음 · 광동어 정음 운동 · 문백이독 · 다음자
옥편
자전 · 설문해자 · 강희자전 · 옥편 · 이아 · 운서 · 광운 · 절운 · 집운 · 오음편해 · 한어대사전 · 대한화사전 · 중문대사전 · 이체자자전
색인
부수별 · 음별 · 획수별
나라별 사용
한자문화권 · 한문 · 백화문 · 한국의 한자 사용 · 한자어(한국식 한자어 · 중국식 한자어 · 일본식 한자어 · 베트남식 한자어) · 언어간 동형이의 한자어(고유명사) · 언어간 이형동의 한자어 · 한한대사전 · 우리말 새김
파생 문자
한글 전 한국어 표기 · 국자 · 이두 · 향찰 · 구결 · 가나(히라가나 · 가타카나 · 만요가나) · 측천문자 · 방언자 · 쯔놈 · 고장자 ·거란 문자 · 여진 문자
입력 · 검색
중국어/입력기 · 창힐수입법 · 사각호마검자법
전산화
KS X 1001 · KS X 1002 · KPS 9566 · GB 2312 · JIS X 0208 · Big5 / 유니코드: 한중일 통합 한자 · BMP(통합 한자 · 통합 한자 확장 A · 호환 한자) · SIP(통합 한자 확장 B~F) · TIP(통합 한자 확장 G) · 한자 모양 설명 문자
기타
고사성어 · 천자문 · 한시 · 어조사 · 음역 · 서예 · 올해의 사자성어 · 올해의 한자 · 국한문혼용체(논쟁) · 국한문병용체 · 한자 교육 찬반 논쟁 · 중복 한자 · 벽자 · 갖은자 · 한자오자 · 미상 한자 · 유령 문자 · 특이한 한자 · 닮은꼴 한자 · 국호 · 주기율표 · 한자문화권 고유명사 표기 · 자주 틀리는 한자어 · 훈을 혼동하기 쉬운 한자 · 부수를 혼동하기 쉬운 한자 · 한자를 혼동하기 쉬운 단어 · 발음이 여럿인 한자어 · 한국의 성씨(인구분포 · 지역별) · 후리가나 · 창작한자


1. 개요
2. 역사
3. 수와 종류



1. 개요[편집]


幽霊文字(ゆうれいもじ

일본컴퓨터 환경에서 입력할 수 있는 한자 중 그 유래나 출처, 상세한 쓰임이 밝혀지지 않은 미상 한자들을 일컫는 단어. 니코니코 대백과에서는 말 그대로 유령을 나타내는 한자라고 서술하고 있다.


2. 역사[편집]


일본의 통상산업성(現 경제산업성)은 일본어 표기에 쓰이는 문자들을 컴퓨터에서 표현하기 위해 1978년에 JIS 기본 한자(JIS X 0208, 당시 JIS C 6226)를 규정하였다.

그런데 JIS 규격의 한자 집합을 제정하는 과정에서 출처를 알 수 없는 글자들이 등록되었다. 이는 한자에 대한 지식이 부족한 작업자가 착각했거나 미세한 획을 잘못 입력하는 등 전산화 작업에서의 사소한 오류로 인해 발생했다고 여겨진다.

이 문제가 부상하면서 일본 국립 국어 연구소(国立国語研究所)의 사사하라 히로유키(笹原宏之) 등이 조사를 시작해 이 한자들이 지명으로 사용되거나 자료를 전사하던 중에 발생한 착오라고 여겨진다는 사실을 판명했다. 이 연구 결과는 JIS X 0208:1997의 부록 7에 정리되어 있다.

1997년의 JIS 한자 개정의 일환으로 사사하라 히로유키를 비롯한 연구진이 유령 문자에 대한 조사를 벌였다. 그러나 이 시기에는 이미 유니코드에 JIS 한자가 수록되었기 때문에 JIS를 섣불리 개정할 수 없었다.[1] 일본은 2000년에 JIS X 0208을 확장한 일본어 문자 집합인 JIS X 0213을 만들었는데, 여기서도 JIS X 0208 부분은 건드리지 않고 그대로 뒀기 때문에 최신 일본어 문자 집합 JIS X 0213에도 유령 한자는 그대로 남아 있다. 사실 아래의 연구 결과를 보면 알 수 있듯 착오로 만들어진 진짜 유령 문자는 총 8자로(穃, 墸, 壥, 妛, 挧, 暃, 袮, 彁) 문자 집합을 함부로 건드릴 정도로 심각하진 않다.


3. 수와 종류[편집]


1997년 당시로서는 이런 글자가 얼마나 되는지 정확히 추산할 수 없었다. 지명·인명용 한자로 국자가 쓰이는 경우는 한국에서도 乭이나 乷 등이 쓰이는 등(예 : 이세돌 李世, 살미면 味面) 한자문화권에서는 일반적인 일이었기 때문에 자전에 나오지 않는다고 무작정 없는 한자라고 단정할 수는 없었기 때문이다.[2][3] 최초연구가 시작될 때는 대개 60자에서 100자 정도로 추산되었다.

이후 연구에서 역시 대부분이 연구 결과 폐번치현 이전 혹은 현재도 쓰이는 지명·인명용 한자임이 밝혀졌고, 열두 자를 제외하고는 대부분 그 출처가 확인되면서 유령 한자가 아님이 드러났다. 대표적으로 이 과정에서 밝혀진 글자들은 다음과 같다.
과거 혹은 현재에도 지명·인명으로 사용되는 한자로 밝혀진 경우

すくも(스쿠모)라고 읽는 지명용 국자임이 확인되었다. 여전히 히로시마현 아키타카타시에는 糘地(すくもぢ(스쿠모지)라는 지명이 있고, 오카야마현 츠야마시에는 糘山(すくもやま(스쿠모야마)라는 산이 있다.

ゆき(유키)라고 읽는 지명용 국자임이 확인되었다. 과거 구마모토현 미나마타시膤割(ゆきわり(유키와리)라는 지역이 있었다.[4]

うるち(우루치)라고 읽는 지명용 국자임이 확인되었다. 과거 후쿠시마현 시라카와시粫田(うるちだ(우루치다)라는 지명이 있었다. 현재는 糯田(もちだ(모치다)로 변경되었다.

ほう(호)라고 읽는 지명용 국자임이 확인되었다. 아이치현 토요타시垉六(ほうろく(호로쿠)라는 지역이 있다.[5]

이 글자의 경우 일본에서 やま(야마)라고 읽는 지명용 한자임이 확인되었다. 교토부 교토시 사쿄구広岾(ひろやま(히로야마)라는 지명이 존재했었다. 현재는 広帖(こうちょう(코쵸)로 변경. 또한 이 글자는 한국에서도 비슷한 의미로 사용되는데, 옥편에는 '땅 이름 점[6], 고개 재'[7] 2가지로 등록되어 있다.

だる(다루)라고 읽는 지명용 국자로 확인되었다. 시즈오카현 시즈오카시 아오이구石橸(いしだる(이시다루)라는 지역이 있는 것이 확인되었다.

ぬた(누타)라고 읽는 지명용 국자(한국에서도 국자로 취급된다)로 확인되었다. 야마나시현 카이시大垈(おおぬた(오누타), 후에후키시藤垈(ふじぬた(후지누타)라는 지명이 있다. 다만 특이하게도 한국에서는 이게 아주 많이 쓰이는 글자여서[8] 어문회 기준 2급 한자라는 급수가 부여되어 있다.

ぬた(누타)라고 읽는 메이지 시대에 지명에 사용되었던 국자였다. 고치현 시만토초汢の川(ぬたのかわ(누타노카와)라는 지명에 사용되었는데, 현대에는 삼수변이 이수변으로 바뀐 또 다른 국자를 사용 중이다. 이 冫土는 반대로 JIS에 없으며[9] 심지어 유니코드에도 아직 없다. 결국 이러한 이유로 인해 해당 지명은 2002년 다시 汢の川로 표기가 바뀌었다(...)[10]. 한국 옥편에는 '물 이름 토' 자로 등록되어 있다.

せき(세키), ひろ(히로)라고 읽는 인명용 한자로 확인. 碩의 이체자로, 실제로 현대에도 이 한자를 쓰는 사람이 현존함이 확인되었다.[11][12]

ぬか(누카)라고 읽는 지명용 한자로 확인. 아키타현 아키타시粐蒔沢(ぬかまきざわ(누카마키자와)라는 지역이 존재한다.

어디서 나온 오자(誤字)인지 명백하게 밝혀진 경우.

오키나와현 오키나와시榕原(ようばる(요바루)의 榕이 잘못 전사된 것으로 확인. 두 글자의 변을 보면 벼 화(禾)와 나무 목(木)은 딱 한 획 차이라서 다른 한자의 구성 요소로 쓰일 경우 혼동하기 쉽다. 원래 글자 榕의 한국식 훈독은 "벵골보리수 용".
그러나 조사 후에도 열두 자는 한동안 출처가 밝혀지지 않았다. 이러한 글자들은 강희자전 등 주요 자전에 실려 있지 않는 등 출처를 파악할 수 없었으며 어디에서 쓰이는지조차 알려져 있지 않았고 어떻게 읽어야 하는지도 알 수가 없었다.

墸 壥 妛 彁 挧 暃 椢 槞 蟐 袮 閠 駲

추가 연구를 통해 이 열두 자 중 한 자를 제외한 열한자도 어디서 발생한 오자인지 혹은 어디서 쓰이는지 밝혀졌는데 연구 결과는 다음과 같았다.

출전은 알 수 없으며, 堵의 오자(誤字)로 추정된다.

㕓의 부수를 쉽게 찾을 수 없자 土변을 넣은 글자...라고 알려져 있었으나 몽구집주(蒙求集注)[13]라는 책에 밭을 세는 단위를 나타내는 글자로 쓰인 것이 확인되었다. 여기에서 Ctrl+F로 壥을 찾을 수 있다.

𡚴(⿱山女)의 오자로 추정된다. 𡚴(⿱山女)는 あけび(아케비)라고 읽는 일본 국자인데, 한 책에서 이를 妛로 잘못 표기한 것이 유래로 확인되었다.[14]

국토지리협회 국토행정총람지에서 등장한 글자로, 栩의 오자다.

국토지리협회 국토행정총람지에서 皐, 星, 早, 毘, 昆, 犀, 韮, 晃, 昌, 昇 등 매우 많은 한자들의 오자로 사용되었다.[15]

토쿠시마현 나루토시椢原(くにはら(쿠니바라), 이바라키현 다이고마치에도 해당 글자를 쓰는 椢内(�ぎうち(쿠누기우치)라는 지역이 있다. 따라서 지명용 국자.[16]

櫳의 약자로 확인되었다.[17]

인명에 쓰였던 한자로 확인되었다. 음독은 トウ(토), ドウ(도), ジョウ(조), 훈독은 かまきり(카마키리)[18], もみ(모미).

돗토리현 돗토리시祢宜(ねぎ(네기)라는 지명의 示변이 衣변으로 착각된 한자.[19]

일본에 전해진 광운상에 통자 관계로 설명되어 있다. 閏의 속자.[20]

'말꼬리 주'라고 하는 인명용 한자. 강희자전에는 누락되어 있으나 사성음이 존재하며[21], 일본 음독은 シュウ(슈)로 확인되었다.

결국 '최후의 유령한자'라고 불리는 '彁' 한 자만 남게 되었는데, 몇십년 후 본 한자를 이름으로 하는 곡이 유명해지면서 본 한자가 무엇의 오자인지 밝혀졌다.


아사히 신문의 1923년 2월 23일자 기사 중 사이타마 자강회(埼玉自彊会)의 彊(굳셀 강) 자가 뭉개져 찍혀 彁로 보이게 된 것으로 확인되었다.#[22]


유령문자 자원(字源) 풀이


파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-12-11 19:28:34에 나무위키 유령 문자 문서에서 가져왔습니다.

[1] 심지어 한국에서도 이미 유령 문자를 한컴 2바이트 코드 시절인 한/글 97 기능강화판부터 입력 가능했다.(대개 변환을 누르면 입력할 수 없고 문자표에서만 쓸 수 있는 문자. 물론 후술하듯이 변환해도 입력할 수 있는 문자도 있다.) 지금도 밑에 있는 유령 한자를 아래아 한글에 복붙하여 신명조와 같은 몇몇 아래아 한글 전용 폰트로 바꾸면 글꼴이 바뀌는 것을 볼 수 있다.[2] 한자는 기본적으로 열린 집합이다. 제작 원리만 알면 누구나 당장 새 한자를 만들 수 있다. 실제로 鿫(⿹气奥, 오가네손 오, 파일:Rf-Og_zh-hans.png) 등의 새로이 만들어진 한자들이 있다.[3] 역사적으로는 측천문자가 대표적인 예.[4] 그러나 해당 지명이 정확히 어디를 가리키는 지는 불명인 것으로 보인다. 한편 미나마타학 연구센터에서는 예로부터 미나마타 제2소학교 일대를 일컫는 지명이라고 소개하고 있으며, 읽는 방법도 すねわり(스네와리)로 제시하고 있다.[5] 한국 옥편에는 '캘 포' 자로 등록되어 있다.[6] 인천광역시 강화군 하점면(河岾面)의 '점'자가 바로 이것이다.[7] 고개를 뜻하는 '재'는 순우리말인데 한자로 표현하기 위해 이 글자를 사용한 듯하다. 재를 뜻하는 다른 한자로는 고개 치, 고개 령(嶺) 등이 있다.[8] 서울 낙성대(落星垈) 등의 지명에도 쓰이거니와 한국 부동산등기부에서 토지의 사용 목적을 나타낼 때 사용하는 축약어(지목) 중 주택용지(또는 사무용 건물 필지)를 나타내는 것이 바로 垈(대)이다. 단국대학교 한국한자어사전에 따르면 원래는 代를 집터란 뜻으로 가차하여 사용하였으나, 밑에 土를 덧붙여 의미를 더 확실히 했다고 한다.[9] JIS 한자 코드(JIS漢字コード)는 일본 공업 규격의 한자 등의 문자 코드이다. 쉽게 말해서 옛날에는 삼수변(氵)을 썼는데 현대에 이수변(冫)으로 바뀌어서 쓰이고 있다. 그런데 막상 이수변(冫)과 흙 토(土)로 된 문자(冫土)는 인터넷상의 문자에 없다는 것이다.[10] 바뀐 데에는 컴퓨터로 입력하기 불편하단 이유 외에도 본래 汢 쪽을 사용했고 공신력 있는 사전인 다이칸고린에서도 삼수변이 붙은 한자를 사용했다는 이유도 있었다.[11] 덧붙여 이런 식으로 인명용으로 쓰인 국자는 한국에도 상당히 많다. 각 집안 족보에 들여다보면 제법 찾을 수 있을 정도. 하지만, 후대 연구 등에서 나타날 경우 전공자들의 머리를 쥐어뜯게 만드는 경우가 된다.[12] 한국 한자음으로는 어째선지 "석"이 아닌 "정"으로 등록되어 있다. 이체자가 아닌 형성자 원리에 따라 石+貞으로 보아 "정"으로 임의로 붙인 듯하다.[13] 몽구(蒙求)는 중국 당나라 이한(李翰)이 지은 어린이들의 문자 교육을 위한 아동용 교재이고 몽구집주는 사고전서에 수록된 책으로 논어집주와 마찬가지로 후대의 학자가 주석을 달아놓은 책.[14] 한국 옥편에는 '더러울 치' 자로 등록되어 있는데 보통 '치'자는 위에 山이 아니라 屮의 형태이다. 하지만 山으로 나온 문헌도 있긴 하다. #[15] 한국 옥편에는 '떠날 비' 자로 등록되어 있다.[16] 한국 옥편에는 '광주리 밑바닥 귀', '광주리 괴' 자로 등록되어 있다. 옥편에 따라서는 槶를 올린 다음 椢를 槶의 약자로 풀이하였을 것이다.[17] 이 용 룡()의 약자다.[18] 사마귀라는 뜻인데 같은 뜻의 한자로 사마귀 당(螳)이 있다. 이 글자의 오기로 보인다.[19] 示가 변으로 쓰일 때는 가타카나 ネ(네)와 같은 모양(礻)으로 쓰이기도 하는데 衣가 변으로 쓰인 모양(衤)과 비슷해서 착각하기 쉽다. 한편, 한국 옥편에는 '꿰맬 치' 자로 등록되어 있으며, 참고로 祢는 '아비 사당 녜/니' 자로 등록되어 있다. 히라가나 ね의 뿌리이기도 하다.[20] 대한민국에서도 같은 용례로 쓰인다. 옥편에도 당연하다는 듯 '윤달 윤'으로 등록되어 있다. 특히 潤(젖을 윤)이 이름자로 들어간 많은 사람들이 氵閠의 형태로 쓴다.[21] zhou로, 우변의 고을 주에서 파생된 것으로 보인다.[22] 유령 문자들 중에서 제일 오랜 기간 동안 그 출처가 밝혀지지 않았던 문자였다. 2011년 아사히 신문 디지털 매거진에서 처음 확인되었는데, 근 10년이라는 기간 동안 이 주장이 묻혔다가 동명의 악곡이 유명해진 다음에야 이 사실이 재발굴되었다.