- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Python基础班
教室
讲师:南北
时间:2018年4月
本节知识点
01 知识点一:正则表达式的概念
02 知识点二:元字符
03 知识点三:预定义字符组
04 知识点四:分组元字符
阶段一
正则表达式
概念
正则表达式概念
问题引入
01 问题一:什么是正则表达式 ?
02 问题二:正则表达式主要解决什么问题 ?
03 问题三:我们如何开始正则的学习 ?
正则表达式所面向的问题
01 判断一个字符串是否匹配给定的格式
判断用户 帐号是否满足格式
02 从一个字符串中按指定格式提取信息
抓取页面中的
判断用户提交的邮箱的格式是否正确
r‘^[a-zA-Z0-9]+@[a-zA-Z0-9]+\ $
抓取页面中特定部分数据
注意:
如果正则表达式中使用了括号,
那么findall函数匹配的结果
只会是括号中的内容,
而不是完整的匹配。
因此我们可以利用这种机制来
完整对需要部分的数据提取
咱们从这里开始 !
01 一个函数:re.findall(pattern, string)
02 一些元字符:. * ? + [] () \ ^ $
03 通过 () 来改变 findall 的行为
阶段二
元字符
知识点一问题引入
01 问题一:什么是元字符 ?
本身具有特殊含义的字符
02 问题二:常用元字符有哪些 ?
. ^ $ {} * + ?
| []
03 问题三:能否分类 ?
04 问题四:怎样才能匹配这些字符本身 ?
\
通配元字符 — .
任意一个字符
元字符
定位
锁定行首: ^
文档评论(0)