.. include:: ../disclaimer-zh_CN.rst :Original: Documentation/admin-guide/unicode.rst :译者: å´æƒ³æˆ Wu XiangCheng <bobwxc@email.cn> Unicode(统一ç ï¼‰æ”¯æŒ ====================== (英文版)上次更新:2005-01-17ï¼Œç‰ˆæœ¬å· 1.4 æ¤æ–‡æ¡£ç”±H. Peter Anvin <unicode@lanana.org>管ç†ï¼Œæ˜¯Linux注册å称与编å·ç®¡ç†å±€ (Linux Assigned Names And Numbers Authority,LANANA)项目的一部分。 现行版本请è§ï¼š http://www.lanana.org/docs/unicode/admin-guide/unicode.rst 简介 ----- Linuxå†…æ ¸ä»£ç 已被é‡å†™ä»¥ä½¿ç”¨Unicodeæ¥å°†å—ç¬¦æ˜ å°„åˆ°å—体。下载一个Unicode到å—体 (Unicode-to-font)表,八ä½å—符集与UTF-8模å¼éƒ½å°†æ”¹ç”¨æ¤å—体æ¥æ˜¾ç¤ºã€‚ 这微妙地改å˜äº†å…«ä½å—符表的è¯ä¹‰ã€‚现在的四个å—符表是: =============== =============================== ================ æ˜ å°„ä»£å· æ˜ å°„å称 Escape代ç (G0) =============== =============================== ================ LAT1_MAP Latin-1 (ISO 8859-1) ESC ( B GRAF_MAP DEC VT100 pseudographics ESC ( 0 IBMPC_MAP IBM code page 437 ESC ( U USER_MAP User defined ESC ( K =============== =============================== ================ 特别是 ESC ( U ä¸å†æ˜¯â€œç›´é€šå—体â€ï¼Œå› 为å—体å¯èƒ½ä¸ŽIBMå—符集完全ä¸åŒã€‚ 例如,å³ä½¿åŠ 载了一个Latin-1å—体,也å…许使用å—图形(block graphics)。 请注æ„,尽管这些代ç 与ISO 2022类似,但这些代ç åŠå…¶ç”¨é€”都与ISO 2022ä¸åŒ¹é…ï¼› Linux有两个八ä½ä»£ç (G0å’ŒG1),而ISO 2022有四个七ä½ä»£ç (G0-G3)。 æ ¹æ®Unicodeæ ‡å‡†/ISO 10646,U+F000到U+F8FF被ä¿ç•™ç”¨äºŽæ“ä½œç³»ç»ŸèŒƒå›´å†…çš„åˆ†é… ï¼ˆUnicodeæ ‡å‡†å°†å…¶ç§°ä¸ºâ€œå›¢ä½“åŒºåŸŸï¼ˆCorporate Zone)â€ï¼Œå› 为这对于Linux是ä¸å‡†ç¡® 的,所以我们称之为“Linux区域â€ï¼‰ã€‚选择U+F000ä½œä¸ºèµ·ç‚¹ï¼Œå› ä¸ºå®ƒå…è®¸ç›´æŽ¥æ˜ å°„ 区域以2的大å€æ•°å¼€å§‹ï¼ˆä»¥é˜²éœ€è¦1024或2048个å—符的å—体)。这就留下U+E000到 U+EFFF作为最终用户区。 [v1.2]:Unicodes范围从U+F000到U+F7FFå·²ç»è¢«ç¡¬ç¼–ç ä¸ºç›´æŽ¥æ˜ å°„åˆ°åŠ è½½çš„å—体, ç»•è¿‡äº†ç¿»è¯‘è¡¨ã€‚ç”¨æˆ·å®šä¹‰çš„æ˜ å°„çŽ°åœ¨é»˜è®¤ä¸ºU+F000到U+F0FF,模拟å‰è¿°è¡Œä¸ºã€‚实际上, æ¤èŒƒå›´å¯èƒ½è¾ƒçŸï¼›ä¾‹å¦‚,vgaconåªèƒ½å¤„ç†256å—符(U+F000..U+F0FF)或512å—符 (U+F000..U+F1FF)å—体。 Linux 区域ä¸å®šä¹‰çš„实际å—符 --------------------------- æ¤å¤–,还定义了Unicode 1.1.4ä¸ä¸å˜åœ¨çš„以下å—符;这些å—符由DEC VTå›¾å½¢æ˜ å°„ä½¿ç”¨ã€‚ [v1.2]æ¤ç”¨æ³•å·²è¿‡æ—¶ï¼Œä¸åº”å†ä½¿ç”¨ï¼›è¯·å‚è§ä¸‹æ–‡ã€‚ ====== ====================================== U+F800 DEC VT GRAPHICS HORIZONTAL LINE SCAN 1 U+F801 DEC VT GRAPHICS HORIZONTAL LINE SCAN 3 U+F803 DEC VT GRAPHICS HORIZONTAL LINE SCAN 7 U+F804 DEC VT GRAPHICS HORIZONTAL LINE SCAN 9 ====== ====================================== DEC VT220使用6x10å—符矩阵,这些å—符在DEC VT图形å—符集ä¸å½¢æˆä¸€ä¸ªå¹³æ»‘的过渡。 我çœç•¥äº†æ‰«æ5è¡Œï¼Œå› ä¸ºå®ƒä¹Ÿè¢«ç”¨ä½œå—图形å—ç¬¦ï¼Œå› æ¤è¢«ç¼–ç 为U+2500 FORMS LIGHT HORIZONTAL。 [v1.3]:这些å—符已æ£å¼æ·»åŠ 到Unicode 3.2.0ä¸ï¼›å®ƒä»¬åœ¨U+23BAã€U+23BBã€U+23BC〠U+23BDå¤„æ·»åŠ ã€‚Linux现在使用新值。 [v1.2]ï¼šæ·»åŠ äº†ä»¥ä¸‹å—符æ¥è¡¨ç¤ºå¸¸è§çš„键盘符å·ï¼Œè¿™äº›ç¬¦å·ä¸å¤ªå¯èƒ½è¢«æ·»åŠ 到Unicode ä¸ï¼Œå› 为它们éžå¸¸è®¨åŽŒåœ°å–决于特定供应商。当然,这是糟糕设计的一个好例å。 ====== ====================================== U+F810 KEYBOARD SYMBOL FLYING FLAG U+F811 KEYBOARD SYMBOL PULLDOWN MENU U+F812 KEYBOARD SYMBOL OPEN APPLE U+F813 KEYBOARD SYMBOL SOLID APPLE ====== ====================================== 克林贡(Klingon)è¯æ”¯æŒ ------------------------ 1996年,Linuxæ˜¯ä¸–ç•Œä¸Šç¬¬ä¸€ä¸ªæ·»åŠ å¯¹äººå·¥è¯è¨€å…‹æž—贡支æŒçš„æ“作系统,克林贡是由 Marc Okrand为《星际迷航》电视连ç»å‰§åˆ›é€ 的。这ç§ç¼–ç åŽæ¥è¢«å¾å‹ŸUnicode注册表 (ConScript Unicode Registry,CSUR)采用,并建议(但最终被拒ç»ï¼‰çº³å…¥Unicode å¹³é¢ä¸€ã€‚ä¸è¿‡ï¼Œå®ƒä»ç„¶æ˜¯Linux区域ä¸çš„Linux/CSURç§æœ‰åˆ†é…。 è¿™ç§ç¼–ç å·²ç»å¾—到克林贡è¯è¨€ç ”究所(Klingon Language Institute)的认å¯ã€‚ 有关更多信æ¯ï¼Œè¯·è”系他们: http://www.kli.org/ 由于Linux CZ开头部分的å—符大多是dingbats/symbols/formsç±»åž‹ï¼Œè€Œä¸”è¿™æ˜¯ä¸€ç§ è¯è¨€ï¼Œå› æ¤æ ¹æ®æ ‡å‡†Unicode惯例,我将它放置在16å•å…ƒçš„边界上。 .. note:: 这个范围现在由å¾å‹ŸUnicode注册表æ£å¼ç®¡ç†ã€‚规范性引用文件为: https://www.evertype.com/standards/csur/klingon.html å…‹æž—è´¡è¯æœ‰ä¸€ä¸ª26个å—符的å—æ¯è¡¨ï¼Œä¸€ä¸ª10ä½æ•°çš„ä½ç½®æ•°å—ä¹¦å†™ç³»ç»Ÿï¼Œä»Žå·¦åˆ°å³ ï¼Œä»Žä¸Šåˆ°ä¸‹ä¹¦å†™ã€‚ å…‹æž—è´¡å—æ¯çš„å‡ ç§å—形已ç»è¢«æ出。但是由于这组符å·çœ‹èµ·æ¥å§‹ç»ˆæ˜¯ä¸€è‡´çš„,åªæœ‰å®žé™… 的形状ä¸åŒï¼Œå› æ¤æŒ‰ç…§æ ‡å‡†Unicode惯例,这些差异被认为是å—体å˜ä½“。 ====== ======================================================= U+F8D0 KLINGON LETTER A U+F8D1 KLINGON LETTER B U+F8D2 KLINGON LETTER CH U+F8D3 KLINGON LETTER D U+F8D4 KLINGON LETTER E U+F8D5 KLINGON LETTER GH U+F8D6 KLINGON LETTER H U+F8D7 KLINGON LETTER I U+F8D8 KLINGON LETTER J U+F8D9 KLINGON LETTER L U+F8DA KLINGON LETTER M U+F8DB KLINGON LETTER N U+F8DC KLINGON LETTER NG U+F8DD KLINGON LETTER O U+F8DE KLINGON LETTER P U+F8DF KLINGON LETTER Q - Written <q> in standard Okrand Latin transliteration U+F8E0 KLINGON LETTER QH - Written <Q> in standard Okrand Latin transliteration U+F8E1 KLINGON LETTER R U+F8E2 KLINGON LETTER S U+F8E3 KLINGON LETTER T U+F8E4 KLINGON LETTER TLH U+F8E5 KLINGON LETTER U U+F8E6 KLINGON LETTER V U+F8E7 KLINGON LETTER W U+F8E8 KLINGON LETTER Y U+F8E9 KLINGON LETTER GLOTTAL STOP U+F8F0 KLINGON DIGIT ZERO U+F8F1 KLINGON DIGIT ONE U+F8F2 KLINGON DIGIT TWO U+F8F3 KLINGON DIGIT THREE U+F8F4 KLINGON DIGIT FOUR U+F8F5 KLINGON DIGIT FIVE U+F8F6 KLINGON DIGIT SIX U+F8F7 KLINGON DIGIT SEVEN U+F8F8 KLINGON DIGIT EIGHT U+F8F9 KLINGON DIGIT NINE U+F8FD KLINGON COMMA U+F8FE KLINGON FULL STOP U+F8FF KLINGON SYMBOL FOR EMPIRE ====== ======================================================= 其他虚构和人工å—æ¯ ------------------- 自从分é…了克林贡Linux Unicodeå—之åŽï¼ŒJohn Cowan <jcowan@reutershealth.com> å’Œ Michael Everson <everson@evertype.com> 建立了一个虚构和人工å—æ¯çš„注册表。 å¾å‹ŸUnicode注册表请访问: https://www.evertype.com/standards/csur/ 所使用的范围ä½äºŽæœ€ç»ˆç”¨æˆ·åŒºåŸŸçš„ä½Žç«¯ï¼Œå› æ¤æ— 法进行规范化分é…,但建议希望对虚构 å—æ¯è¿›è¡Œç¼–ç 的人员使用这些代ç ,以实现互æ“作性。对于克林贡è¯ï¼ŒCSUR采用了Linux ç¼–ç 。CSUR的人æ£åœ¨æŽ¨åŠ¨å°†Tengwarå’ŒCirthæ·»åŠ åˆ°Unicodeå¹³é¢ä¸€ï¼›å°†å…‹æž—è´¡æ·»åŠ åˆ° Unicodeå¹³é¢ä¸€è¢«æ‹’ç»ï¼Œå› æ¤ä¸Šè¿°ç¼–ç ä»ç„¶æ˜¯å®˜æ–¹çš„。