- 重点词汇
- UTF-8Unicode 传输格式 8
- andconj. 和;与;而且;于是;然后
- twon. 两个;两个东西;两点钟;一对;
- arevi.(用于第二人称单复数现在时,第一、三人称复数现在时)是;
- theart.这个;指已提到或易领会到的人或事物;指独一无二的、正常的或不言而喻的人或事物;用以泛指;与形容词连用,指事物或统称的人;用于姓氏的复数形式前,指家庭或夫妇;(指特定用途的事物)足够,恰好;每,一;当前的,本,此;(重读,表示所指的为知名或重要的人或事物)
- used for用于;
- severaldet. 几个;数个;一些;
- popularadj.受喜爱的;讨人喜欢的;民众的;受喜爱的,受欢迎的;流行的,当红的;通俗的,大众的,普遍的;民众的,百姓的
- 相关例句
压缩后,UTF-8和UTF-16的大小差不多,不论原始大小相差多少。
互联网摘选
与其他Unicode编码特别是UTF-16相比,在UTF-8中ASCII字符占用的空间只有一半。
互联网摘选
这个方法完全忽略所有可用的编码信息,所返回的字符串总是用UTF-16编码的。
互联网摘选
基于字符的函数可能需要将输入数据字符串转换为一个中间的UNICODE代码页,比如UTF-16或UTF-32,然后才能对它进行处理。
互联网摘选
与UTF-16或其他Unicode编码相比,对于不支持Unicode和XML的系统,UTF-8更不容易造成问题。
互联网摘选
UTF-8被选择为字符数据列的默认格式,其中UTF-16用于图形数据列。
互联网摘选
The character is specified as one or two UTF-16 code units in hexadecimal notation.
这个字符指定为十六进制形式的一个或两个UTF-16编码单元。
互联网摘选
第3小节给出用于编码器的保持系数的定点伪码。一个解决XML解析器对中文数据处理的伪UTF-16编码算法
互联网摘选
Unicode协会还规定了其他一些编码方式(如UTF-16,UTF-32),但UTF-8是国际字符集支持得最好的一种。
互联网摘选
比如,Java™语言中字符串的内部表示采用UTF-16,因此对字符串的索引更快。
互联网摘选
因此这个以手工方式转码的XML字符串的编码属性仍然是“UTF-16”而不是“Big5”。
互联网摘选
The DOMString type is explicitly specified to consist of wide UTF-16 characters.
DOMString类型被显式指定包括宽UTF-16字符。
互联网摘选
Unicode用三种不同的大小定义字符编码UTF-8、UTF-16和UTF-32而传统的字符类型是8位的。
互联网摘选
在文档的开头部分,省略XML声明,并使用UTF-8编码,或者使用UTF-16Unicode字节顺序标记(Byte Order Mark,BOM)。
互联网摘选
Google甚至不允许其他Unicode编码(如UTF-16),更不用说ISO-8859-1这样的非Unicode编码了。
互联网摘选
但即使用UTF-8编码CJK XML,实际的大小可能也比UTF-16小。
互联网摘选
IDENTITY_16BIT collator implements CESU-8 ( An8-bit compatibility encoding scheme for UTF-16).
IDENTITY16BIT排序器实现CESU-8(一种8位的兼容UTF-16的编码方案)。
互联网摘选
另外,还有一种称为UTF-16的编码方案,它也可以用来表示补充字符。
互联网摘选
UTF-16 is a variable-width character encoding, once surrogate pairs are taken into account.
如果考虑到替换对,UTF-16是一种变长字符编码。
互联网摘选