爬虫-正则使用

1.模块选择
用re模块导入,,最前面加个r,就不用怕转义了
2.模块使用
re.findall
使用

结果是数组方式呈现

re.finditer
把结果变成迭代器,从迭代器类中间取数

re.search
re.search 只能匹配到第一个识别到的内容

re.match

3.推荐写法
先预加载完,就不用每次加载了,节省内存,用obj.引用

分组命名找数据,将id分为一类 ?P<xxxx>


用re模块导入,,最前面加个r,就不用怕转义了
使用

结果是数组方式呈现

把结果变成迭代器,从迭代器类中间取数

re.search 只能匹配到第一个识别到的内容


先预加载完,就不用每次加载了,节省内存,用obj.引用

分组命名找数据,将id分为一类 ?P<xxxx>
