||
匹配至少一个空行 (^\s*\n)+
如果要全部删除,替换部分留空;如果保留一个空行, 用\n (不要加^$之类).
对字符串来讲,换行其实就是一个\n 字符或二个字符 \r\n
字符串的开始部分用\A, 末尾用\z
关于无宽空格符,见 博文. 规则就是,用码值 来匹配最好,因为我们看到的十六进制值, 往往是UTF8编码或GBK编码过的.
匹配中文, 主要用 [\u4E00-\u9FFF]+, 更多的Unicode特性参见 博文
最起码的是, 编辑器要支持正则表达式 搜索或替换. EditPlus, Notepad++, UltraEdit, notepad3,Sublime Text 3 或4 都能支持. 但Word不支持(除非用VBA或外挂插件来实现). 不过一般文字编辑器支持的特性有限,很少有完全支持各种正则特性的.
别忘记勾选启用正则表达式, 否则默认往往是普通文本搜索.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-19 03:21
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社