dingsir的个人博客分享 http://blog.sciencenet.cn/u/dingsir

博文

万分之一符号, 千分之一符号 和PPM符号

已有 1312 次阅读 2020-9-3 16:16 |个人分类:软件杂谈|系统分类:教学心得| Unicode, 符号, UTF-8编码, 特殊符号, Unicode

前面博文中有一个很少用的符号,万分之一符(‱),接触基点这个概念之前, 我从来没有见过,更没用过.

既然网页上都能显示出来, 我想它肯定在Unicode编码体系中有自己的编码. 为了查证一下,做了点测试如下:

1)将上面的‱复制到UltraEdit中,切换到十六进制模式查看,得到E2 80 B1. 这是一个UTF8编码. 

2)UTF-8 → Unicode


 生成方法: 根据之前的博文(UTF-8的编码方法), E2 80 B1是三字节的编码, 三字节是编码是这样的.

 将16位的Unicode码值 xxxxxxxx  xxxxxxxx 拆分成24位的如下结构,拆开后填充1110 、10 和10得到1110xxxx 10xxxxxx 10xxxxxx


还原方法: 

 第1步:UTF-8编码还原成Unicode码值, 将E2 80 B1转换为二进制值

11100010 10000000 10110001

第2步: 去除上述粗体的1和0, 得到16位的二进制值, 从前到后8位一个字节处理如下:

00100000 00110001

第3步: 再转换为十六进制为20 31,这就是万分之一符号的Unicode码值.


3)验证方法:

为了验证一下,在Word中新建一个文档,输入2031, 再按一下Alt+X, 出来一个字符,看起来不太清楚, 放大到72号字体一看,就是它!


顺便说一下,在Unicode编码中,千分之一符号的码值是2030,就是万分之一符号的前面. 

我们看一看Unicode标准中对它们是怎么解释的:

Unicode中的解释.png


Unicode标准还定义了百万分之一的符号.一般我们输入时常用三个字母构成的PPM符号, 但实际上还有单个字符的符号㏙--它是一个独立的符号.

由于在Word中比较容易找到这个符号,我先在Word中插入这个符号,复制到UltraEdit中查看十六进制的UTF-8编码, 如法炮制记录如下:

(UTF-8编码)E3 8F 99 → (Hex) 11100011 10001111 10011001 →(去除前缀, 再从到右8位一段进行处理) 00110011 11011001 →(Hex) 33 D9

在Word中输入33D9,按Alt+X就出来这个符号.

以下就是这几个特殊符号.

几个特殊符号(Unicode 2031,2030,33D9).png

其实Unicode中还定义了很多稀奇古怪的符号,PPM所在的附近就有不少, 比如微伏、毫伏、千伏,纳法、微法、皮法等等,有兴趣的可以研究一下,33D9位正是㏙符号。

有些有趣的特殊符号.png

连日历的每一天、一天的每一个小时都做成符号了,真是:

用好Unicode,什么符号都不怕!



http://blog.sciencenet.cn/blog-1213210-1249140.html

上一篇:配方波动范围, 用"百分点"或"基点"表达有独到的好处
下一篇:将SMILES转化为结构式的工具--SMILESDrawer介绍

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-10-25 15:21

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部