学习正则匹配的一些经验

正则在爬虫领域使用很普遍,用来把网页中有价值的文本提取出来。这个提取技术就是用正则匹配。
我感受正则匹配就是类型匹配,当你能认识清楚字符里面全部包含的类型和结构,那么你写出正则也就不难了。如何认识清楚文本中会有什么类型,看以下连接
https://www.zhihu.com/question/48219401/answer/742444326
在这篇文章中,我建议你认识好 这些基本的:正则表达式

  • 1.元字符
  • 2.限定符
  • 3.分组
  • 4.条件或

认识完这些基础类型以后,写正则仍是有点难,
建议跟着以下连接,把里面的练习都作一下,我包你会有新的感悟
https://juejin.im/post/6844903648309297166
把练习都作完后,一些正常难度的(初、中级)的正则你都能写了。app

高级或进阶,自行学习吧。
https://deerchao.cn/tutorials/regex/regex.htm#regexoptions工具


工具

拥有一个好的调试工具,会让你能方便快捷的调试你的正则语句,这种及时的反馈感很重要,特别是新手的你。post

bbedit下载地址
https://apps.apple.com/cn/story/跟-bbedit-学正则表达式/id1485320067学习

使用截图:
调试

相关文章
相关标签/搜索