爬虫-正则使用
1.模块选择
用re模块导入,,最前面加个r,就不用怕转义了
2.模块使用
re.findall
使用
结果是数组方式呈现
re.finditer
把结果变成迭代器,从迭代器类中间取数
re.search
re.search 只能匹配到第一个识别到的内容
re.match
3.推荐写法
先预加载完,就不用每次加载了,节省内存,用obj.引用
分组命名找数据,将id分为一类 ?P<xxxx>
用re模块导入,,最前面加个r,就不用怕转义了
使用
结果是数组方式呈现
把结果变成迭代器,从迭代器类中间取数
re.search 只能匹配到第一个识别到的内容
先预加载完,就不用每次加载了,节省内存,用obj.引用
分组命名找数据,将id分为一类 ?P<xxxx>