关于unicode的学习

这篇博客将陆续写有关unicode , php 和 unicode , 其他语言的unicode 实现的问题

关于unicode的学习》上有7条评论

  1. foreach(unpack(
    ‘n*’,
    mb_convert_encoding(‘你好’, ‘unicode’, ‘gbk’)
    ) as $i) {
    echo ‘\u’,dechex($i);
    }

  2. * 0xxxxxxx (00-7f)
    * 110xxxxx 10xxxxxx (c0-df)(80-bf)
    * 1110xxxx 10xxxxxx 10xxxxxx (e0-ef)(80-bf)(80-bf)
    * 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx (f0-f7)(80-bf)(80-bf)

  3. UTF是一种变长的编码,它的字节数是不固定的,使用第一个字节确定字节数。第一个字节首为0即一个字节,110即2字节,1110即3字节,字符后续 字节都用10开始,这样不会混淆且单字节英文字符可仍用ASCII编码

发表评论

电子邮件地址不会被公开。 必填项已用*标注