dingsir的个人博客分享 http://blog.sciencenet.cn/u/dingsir

博文

正则匹配备忘几则

已有 1055 次阅读 2021-5-28 11:43 |个人分类:软件杂谈|系统分类:教学心得

  1.  匹配至少一个空行  (^\s*\n)+  

       如果要全部删除,替换部分留空;如果保留一个空行,  用\n (不要加^$之类). 

       对字符串来讲,换行其实就是一个\n 字符或二个字符 \r\n  

       字符串的开始部分用\A, 末尾用\z


  2.  关于无宽空格符,见 博文. 规则就是,用码值 来匹配最好,因为我们看到的十六进制值, 往往是UTF8编码或GBK编码过的.


  3.  匹配中文, 主要用  [\u4E00-\u9FFF]+, 更多的Unicode特性参见 博文 

  4. 最起码的是, 编辑器要支持正则表达式 搜索或替换. EditPlus, Notepad++, UltraEdit, notepad3,Sublime Text 3 或4 都能支持. 但Word不支持(除非用VBA或外挂插件来实现). 不过一般文字编辑器支持的特性有限,很少有完全支持各种正则特性的.

  5. 别忘记勾选启用正则表达式, 否则默认往往是普通文本搜索.



http://blog.sciencenet.cn/blog-1213210-1288591.html

上一篇:我经历的几个有意思的实验
下一篇:Perl处理SQLite数据库示例

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-10-19 19:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部