正则表达式(Regular Expression),又称规则表达式、常规表示法,是计算机科学的一个概念。它是对字符串操作的一种逻辑公式,用事先定义好的一些特定字符及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
logo
正则表达式最初的想法源于 20 世纪 40 年代,神经学家沃伦·麦卡洛克(Warren McCulloch)和数学家沃尔特·皮茨(Walter Pitts)在对人类神经系统如何工作的早期研究中,研究出的一种数学描述方式。1951 年,数学家斯蒂芬·科尔·克莱因(Stephen Cole Kleene)在发表的《神经网事件的表示法》论文中首次提出了正则表达式的概念。1968 年,UNIX 操作系统之父肯尼斯·蓝·汤普森(Kenneth Lane Thompson)将正则表达式应用到了 UNIX 的 QED 编辑器的搜索算法中。
无处不在的正则过滤
到现在为止,正则表达式已经成为文本编辑器和搜索工具的一个重要部分,并被应用到各种编程语言中。 正则表达式主要有 POSIX 标准和 PCRE 流派。不同的流派支持的元字符和这些元字符代表的意义存在着细微的差异,元字符的类型有转义符、字符组、分组、匹配量词、锚点和零宽断言,以及多选结构和嵌入条件等。正则表达式可应用于各种编程语言和文本处理工具中,在数据科学、文本分析、网络爬虫、字符串搜索和替换等领域都有广泛的应用。
2、正则表达式干嘛用的正则表达式有以下常见用法:
正则过滤
1. **验证输入**:检查字符串是否符合特定格式,如电子邮件、电话号码等。 2. **搜索和替换**:在文本中查找特定模式并进行替换。 3. **提取信息**:从文本中提取特定部分的内容。 4. **文本分割**:根据特定模式将文本分割成多个部分。 5. **模式匹配**:判断一个字符串是否符合某种特定模式。3、正则表达式入门字符类匹配规则
量词
POSIX 字符类
4、正则表达式示例字符串基操
常见匹配速记
匹配字符串 出现次数过滤
字符类 或 操作
未完待续,喜欢的点个关注 谢谢。
创作不易 点个关注 谢谢