褰揿墠缃戠缁?璇粶寮效父锛屼綘鍙 镆ョ绣缁滆繛鎺ユ儏鍐碉紝绋嶅悗鍐嶈瘯 鎴戠煡阆这是什么意思

2的16次方等于65536,所以UCS-2最多能编码65536个字苻.编码从0到127的字符与ASCII编码的字符一样,比如字母"a"的Unicode编码是0x0061,十进制是97,而"a"的ASCII编码是0x61,十进制也是97,对于汉字的编码,事实上Unicode对汉字支持不怎么好,这也是沒办法的,简体和繁体总共有六七万个汉字,而UCS-2最多能表示65536个,才六万多个,所以Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字也不过七千多個,为了能表示所有汉字,Unicode也有UCS-4规范,就是用4个字节来编码字符,不过现在普遍采用的还是UCS-2只用两个字节来编码,看一下Unicode对汉字的编码:


}

鍘熸爣棰橈細鏂逛究闈㈣繖鏍峰仛锛屼綘缁濆?鎯充笉鍒帮紝鎯虫兂閮芥祦鍙f按

鎴戣?寰楅偅涓?椂鍊欙紝涓轰簡鑷?繁璧炵偣闆剁敤閽憋紝灏变細鍦ㄥ悆楗?笂闈㈢渷涓嬮挶鏉ワ紝涔颁竴鍖呭寳浜?夯杈f柟渚块潰锛岀洿鎺ョ敤琚嬪瓙瑁呯儹姘存场鐔燂紝鎾掍笂璋冩枡鐩存帴鍚冿紝鐜板湪鎯虫兂閮借?娴佸彛姘村憿锛佹柟渚块潰鏄?ぇ澶氭暟浜虹殑閫夋嫨锛岃?屼笖鍑犱箮閮藉悆杩囷紝閭d綘鍚冭繃閭d箞澶氱?鍙e懗鐨勬柟渚块潰錛屾兂涓嶆兂灏濅竴涓嬩粠鏉ユ病鏈夊悆杩囩殑鍙e懗鍛?紵鐢ㄦ柟渚块潰鍋氭垚楂橀?兼牸鐨勬枟榄傛剰闈?紝鏂逛究闈㈣繖鏍峰仛锛屾槸浣犵粷瀵规兂涓嶅埌鐨勶紝鑰屼笖鎬庝箞鍚冮兘涓嶄細鑵伙紝鏂规硶缁欎綘锛屽揩鏉ュ仛鍋氱湅鍚э紒

楂橀?兼牸鏂逛究闈?細鏂楅瓊鎰忛潰

棣欒偁 閫傞噺銆佸ザ閰?涓?灏忓潡銆侀粍娌?涓?灏忕矑銆佹柟渚块潰 閫傞噺銆佺墰濂?300鍏嬨?佹磱钁?閫傞噺銆佺粏棣欒懕 灏戣?

}

我要回帖

更多关于 缃戠缁?璇 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信