메뉴 건너뛰기


Computer Science > Language Processing
 
1. 일본 문자들의 정렬
 
- 히라가나와 카타가나는 가나 음절의 순서로 정렬된다.
- 영문 글자들은 알파벳순으로 정렬될 것이다. 대문자와 소문자 간의 구별을 하지 않는다.
- 숫자들은 내림차순으로 정렬된다. (?)
- 반각과 전각 문자들과 심볼문자들을 구별하지 않는다.
- 그밖의 칸지(한자)와 심볼 등등은 그들의 Shift-JIS 코드들의 순서로 정렬된다.
- 장모음(ー)은 앞 음절의 모음과 같이 취급한다. 예를 들어 “データベース(데-타베-스)”는 “データベース(데에타베에스)”로 취급한다.
- 반복 기호(々)는 선행문자와 같은 것으로 취급한다. 예를 들어 " :namespace prefix = v /> :namespace prefix = o />"은 " ".으로 취급한다.
- 탁음(Voiced), 청음(unvoiced)은 다음의 순서로 정렬된다. : 청음(unvoiced), 탁음(Voiced), 반탁음(semi-voiced)
- 히라가나와 전각 가타가나 그리고 반각 가타가나는 구별하지 않는다.


 
 
Creative Commons License
Creative Commons License이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-동일조건변경허락 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
Copyright 조희창(Nicholas Jo). Some rights reserved. http://bbs.nicklib.com