js逆向实战:爬取淘宝男装商品
目标
网站:https://uland.taobao.com
需求
-
爬取字段'商品名称', '店铺名称', '价格', '发货地址', '已付款人数', '回头客人数', '图片链接'
-
保存图片
-
数据内容写入csv文件
步骤
-
进入网站,打开开发者工具,刷新页面,获取数据包
-
利用关键字搜索,抓取数据包
-
复制数据包的curl(bash),找一个curl转request
-
观察打印数据,看看是否得到响应,状态码是否为200
-
提取打印数据里面的所需内容,比如'商品名称', '店铺名称'等等
-
如果上述操作完成,开始处理分页操作
-
对第一页数据包的载荷,也就是参数进行截图保存,然后点击第二页,获取第二页的数据包,同样截取载荷页面的数据进行保存
-
观察两种图片请求参数有什么不同
-