dingsir的个人博客分享 http://blog.sciencenet.cn/u/dingsir

博文

一些特殊的字符用法

已有 1059 次阅读 2024-5-31 13:23 |个人分类:软件杂谈|系统分类:教学心得

文本文件中一些特殊的字符用法

过去是怎么弄的?

我们知道,文本文件如记事本中,一般来说,只有简单的记一下文本,格式控制能力除了标点符号之外,其它的控制能力几乎是没有的.

因此,TXT文件一般也就用于记录纯文本.但这种格式有一个很大的好处,由于它格式非常简单,因此也非常容易得到其它软件的支持,可以说任何平台中几乎都是通用的.

如果要实现更复杂一点的格式控制,简单的文本文件就不够用了,这时候就出来了RTF文件(富文本格式),它可以控制文字大小,颜色等,在编辑器时代的早期,RTF格式是比较常用的.如果你打开RTF格式的文件看到,它除了文本之外,还夹杂了一些控制指令.

正是这些控制指令告诉编辑器(或阅读器)如何控制其格式,使得文本开始多样化. 但RTF格式是不支持图片的.

后来发展到更复杂的阶段,WORD、WPS等编辑器由于有特殊的格式与控制指令(它不会向普通用户展示,但确实存储在它的文件如doc,wps等之内),允许在文件中嵌入图片甚至是各类嵌入的对象包,编辑出各种特殊的奇妙和文字或图文混排效果.

这类格式的功能很强大,复杂度高.与此同时,这种数据的格式解析与写入就很复杂,往往控制在开发商手里,外部人员不能随意使用.比如,早期WORD的Doc格式是如何定义的,其规范也不对外部开放,这样国产软件要想兼容doc格式,就得自己摸索解析这个格式,十分费劲.

如果你用十六进制编辑器,或者干脆用记事本打开Doc格式,你会发现它就是一堆你根本看不懂的乱码.

当然,还有一种非常复杂但同时又可以说很简单的格式,HTML文件.虽然源码都是文本,可以轻易读取,但是由于采用了文本格式的控制指令(即规定格式/样式的是文本形式),它可以比较简单,也可以非常复杂.特别是加入了CSS样式与Javascript脚本的功能之后,

HTML格式就变成了连接网络世界的重要格式,同时它也变得越来越复杂,为了解析HTML,相应的浏览器也变得非常非常复杂.现在的浏览器甚至可以做出很多远超过WORD等的格式控制能力.

如果不用Word,WPS这类支持复杂格式的工具,如果想编写一些复杂效果的文件,HTML是首选.即使是最简单的HTML格式也可以实现如上标/下标/字体/字号/颜色等效果.现在的数码设备如电脑/手机/pad等,都有自己的浏览器,能够阅读HTML格式.

纯文本的玩法:

今天说的是更小众一点的用法,用纯文本来实现一些特殊的效果,其中用到的主要是各种特殊符号,超过常用的标点的范围的符号.

首先介绍的是上标符号与下标符号. 主要有  ¹ ² ³ ⁴ ⁵ ⁶ ⁷ ⁸ ⁹ ⁰ ⁺ ⁻ ⁽ ⁾  ⁿ  ⁼ ₐ ₑ ₒ ₕ ₖ ₗ  ₘ ₙ ₚ ₛ ₜ ₓ  ₁ ₂ ₃ ₄ ₅ ₆ ₇ ₈ ₉ ₀ ₊ ₋ ₍ ₎ ₌

注意这些字符本身就是,在右上角或右下角的特殊字符,与常规数字是不同的字符,也不是常规字符在格式指令下显示成这样. 它自己就是这样,不同的字体中都是这样.

使用这些特殊符号,在文本文件如记事本中,也可以编辑一些化学方程式的,大约可以满足初中化学的要求.

比如:

 3Fe + 2O₂ = Fe₃O₄  

 Zn + 2HCl = ZnCl₂ + H₂↑

 Fe³⁺ + 3OH⁻ =Fe(OH)₃ ↓

上面的方程式中,箭头也是一类特殊的符号,这是在键盘上一般不会直接输出的符号,但在很多输入法中可以输出,需要具体情况具体研究.

其实在办公自动化兴趣的早期,甚至是绘制表格的字符也是有定义的,只是现在HTML和WORD等格式中有更便捷的方法,自定义的制表符号也就弃用了(编码还在,不太使用)

现在流行的emoji也是特殊符号,在手机兴起的年代,各种表示符号(表示的范围可以是情绪/性别/事物/标志等等)可以做成字符,通过各种设备而传播.

通行世界的Unicode标准(现在到了Unicode 16.0 alpha)正在收录越来越多的emoji符号,大有要把人类交流的各种字符或形状尽可能收录的想法. 

当然,总有很多复杂的结构肯定是无法作为字符来处理的,毕竟字符允许占用的存储空间要求比较小. 信息量大的事物,比如各种复杂的有机化学结构,建筑结构,各种照片,视频等等,它还是要依赖专业的软件来处理.

一些非常简单的是能够以字符形式被收录的.如化学中的苯环 ⌬ ⏣ 几何形状的⬜ ⬠ ⬡ ⬭ ⬯ 被编制成了字符,但氟苯,硝基苯这种更复杂的结构就不太适合用字符来显示.

比如,一些简单的符号,虽然不在常用的标点符号之内,还是可以字符化的.

% ‰ ‱ ℃ ∈ ≡ ≅  ⋂ ⋃ √ ∛  ∜ ∵ ∴ ⊙ ⌛ 〇(汉字零) ㏗ ㎍ ㎛ ㎷ ㎫ ㏙ ㏖ ㏒

特殊的字符与彩色的字体

很多时候,不是没有这个符号,而是我们不知道字体中有这个符号.

好多人对特殊符号有多少,往往局限在WORD的插入符号中能够找到的,这是一个很大的误导. 其实WORD对能够插入的字符作了很多的删减,许多字符没有列入可选的范围,但你可以复制到WORD中使用,也可以通过输入编码使用Alt+X切换来使用.

有兴趣的关注这方面的,可以去研究一下 unicode的编码表,里面除了大量古汉字外,也有许许多多的你平时想不到的各种特殊符号、各种语言的字符,甚至于麻将牌、八卦字符、扑克牌字符,都有!

另外,要注意的是,目前还没有一个字体能够完全输出所有的Unicode字符. 但更新快的系统,上面的基本都能显示,有些字符甚至能够显示出彩色来(与字体、编辑器是否支持都有关系).

你可以测试一下你的编辑器中,选择不同的字体,下面这些符号能够显示彩色吗?(在Notepad3 + 微软雅黑字体 组合下都是彩色的)

🟥 🟧 🟨 🟩 🟦 🟪 🟫 ❌ 🔺 🔻 🔼 🔽 

我的电脑上检测结果:

WORD打开(按UTF-8编码),字体设为微软雅黑. 全为黑色字符, 前面的方框甚至不能正常识别。

Windows记事本或Editplus ,字体设置为微软雅黑,方框显示为纹理不同的字符,无颜色.

用Chrome打开这个txt文件,会很漂亮的显示出彩色字符效果来. 如果你没有Notepad3,用chrome试一下也可以.

 

 

 



https://blog.sciencenet.cn/blog-1213210-1436349.html

上一篇:机理解释不能太随意
下一篇:几个有意思的成语架构
收藏 IP: 221.227.131.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-8-1 00:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部