当前位置：首页 > wzjs >正文

前端电商网站登录界面怎么做凡科做网站技巧

wzjs 2025/9/7 8:59:23

前端电商网站登录界面怎么做,凡科做网站技巧,企业做网站需要的资料,印尼建设银行网站1. 起因， 目的: 继续做新闻爬虫。我之前写过。此文先记录2个新闻来源。后面打算进行过滤，比如只选出某一个类型新闻。 2. 先看效果过滤出某种类型的新闻，然后生成 html 页面，而且，自动打开这个页面。比如科技犯罪…

1. 起因，目的:

继续做新闻爬虫。我之前写过。
此文先记录2个新闻来源。
后面打算进行过滤，比如只选出某一个类型新闻。

2. 先看效果

过滤出某种类型的新闻，然后生成 html 页面，而且，自动打开这个页面。
比如科技犯罪类的新闻。

3. 过程:

代码 1 ，爬取东方网

很久之前写过，代码还能用。
这里虽然是复制一下，也是为了自己方便。

import os
import csv
import time
import requests"""
# home: https://sh.eastday.com/
# 1. 标题, url， 来源，时间
"""headers = {'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/136.0.0.0 Safari/537.36'
}def get_data(pages):file_name = '5.8.400.csv'             # 400个标题。has_file =  os.path.exists(file_name)# 打开文件，写入模式with open(file_name, 'a', newline='', encoding='utf-8') as file:# 创建一个csv.DictWriter对象，用于写入字典数据columns = ['title', 'url', 'time','source']writer = csv.DictWriter(file, fieldnames=columns)# 写入表头if not has_file:writer.writeheader()# 爬取数据. 默认是 20页，每页20条。 每天大概有400个新闻。for i in range(pages):print(f"正在爬取第{i+1} / {pages}页数据")time.sleep(0.5)url = f"https://apin.eastday.com/apiplus/special/specialnewslistbyurl?specialUrl=1632798465040016&skipCount={i * 20}&limitCount=20"resp = requests.get(url, headers=headers)if resp.status_code!= 200:print(f"请求失败：{resp.status_code}")breakret = resp.json()junk = ret['data']['list']for x in junk:item = dict()# print(x)item["time"] = x["time"]item['title'] = x["title"]item["url"] = x["url"]item["source"] = x["infoSource"]# 写入数据writer.writerow(item)# print(item)get_data(pages=20)

代码 2 ，爬取，澎湃新闻

也是很简单。

import os
import csv
import time
import requests
from datetime import datetime, timedelta# 请求头
headers = {'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/136.0.0.0 Safari/537.36','Content-Type': 'application/json',  # 响应头要求 Content-Type'Referer': 'https://www.thepaper.cn/',  # 引荐来源，遵循 strict-origin-when-cross-origin'Origin': 'https://www.thepaper.cn'  # 跨域请求需要 Origin
}def get_thepaper_data(file_name='peng_pai_400.csv', max_pages=100, channel_id='-8'):"""爬取澎湃新闻数据，保存到 CSV 文件参数：file_name: 输出 CSV 文件名max_pages: 最大爬取页数channel_id: 新闻频道 ID"""# 检查文件是否存在has_file = os.path.exists(file_name)# 打开 CSV 文件，追加模式with open(file_name, 'a', newline='', encoding='utf-8') as file:columns = ['title', 'url', 'time', 'source']writer = csv.DictWriter(file, fieldnames=columns)if not has_file:writer.writeheader()# 计算 startTime（当前时间戳）current_time = int(time.time() * 1000)  # 当前毫秒时间戳start_time = current_time  # 使用此时此刻的时间# 爬取数据for page in range(1, max_pages + 1):time.sleep(0.5)  # 请求间隔payload = {'channelId': channel_id,'excludeContIds': [],  # 留空，需根据实际需求调整'province': '','pageSize': 20,'startTime': start_time,'pageNum': page}url = 'https://api.thepaper.cn/contentapi/nodeCont/getByChannelId'resp = requests.post(url, headers=headers, json=payload, timeout=10)if resp.status_code != 200:print(f"请求失败：{url}, 状态码: {resp.status_code}, 页码: {page}")breakret = resp.json()# print(f"页面 {page} 响应：{ret}")news_list = ret['data']['list']for item in news_list:# print(item)news = {}news['title'] = item.get('name', '')news['url'] = f"https://www.thepaper.cn/newsDetail_forward_{item.get('originalContId', '')}"news['time'] = item.get('pubTimeLong', '')news['source'] = item.get('authorInfo', {}).get('sname', '澎湃新闻')# 转换时间格式（如果 API 返回时间戳）news['time'] = datetime.fromtimestamp(news['time'] / 1000).strftime('%Y-%m-%d %H:%M:%S')# 直接写入，不去重writer.writerow(news)print(f"保存新闻：{news}")if __name__ == "__main__":get_thepaper_data(file_name='peng_pai_400.csv', max_pages=20, channel_id='-8')

4. 结论 + todo

1 数据来源，还需要增加。可选项：

- 上观新闻 shobserver.com   与解放日报关联，报道上海本地案件。
- 新浪新闻 news.sina.com.cn  全国性新闻，包含科技犯罪。
- 腾讯新闻 news.qq.com       聚合多种来源，覆盖广泛。

聚合。提取出自己感兴趣的新闻，比如，科技犯罪。

希望对大家有帮助。

文章转载自：

http://tPRBLV1K.mxmdd.cn
http://weQCu9Rf.mxmdd.cn
http://9pNTsa0K.mxmdd.cn
http://VyXIMdbt.mxmdd.cn
http://fyVWLnHV.mxmdd.cn
http://X0ZEdBBg.mxmdd.cn
http://b7e0sPTs.mxmdd.cn
http://6EyJqNOd.mxmdd.cn
http://5tjXx9NH.mxmdd.cn
http://Fp9V0A5O.mxmdd.cn
http://GdLYzB27.mxmdd.cn
http://aUmmMjJ4.mxmdd.cn
http://Q1UEtA8E.mxmdd.cn
http://EKdw8xTg.mxmdd.cn
http://prs8d1Ja.mxmdd.cn
http://7usw0O6d.mxmdd.cn
http://A9eqNZaN.mxmdd.cn
http://urhkWOpa.mxmdd.cn
http://0IJEf0oh.mxmdd.cn
http://UZqr6HUw.mxmdd.cn
http://Cgjz9Yz4.mxmdd.cn
http://tBVsBS6t.mxmdd.cn
http://YdvS7qZ6.mxmdd.cn
http://cqP6YXRt.mxmdd.cn
http://ard9FSRC.mxmdd.cn
http://DR8PamKB.mxmdd.cn
http://wRgI8UXJ.mxmdd.cn
http://7qiVZt6y.mxmdd.cn
http://G8cWdtWs.mxmdd.cn
http://5JJ8O6uC.mxmdd.cn

查看全文

http://www.dtcms.com/wzjs/641166.html

培训制作网站源码小程序开发教程和源码

蛇口网站建设做设计的搜素材上什么网站

滁州哪里做网站分销商城源码

网站公司设计网站首页维护网站需要多少钱

网站建设中提示页面wordpress设置使用旧版编辑器

江苏南京建设局官方网站最好seo的wordpress

企业网站域名注册怎么接推广赚钱

网站盈利模式公司怎么申请免费做网站

怎么做网站建设的ppt成立公司注册资金

广州白云区建站外贸公司洛阳网红打卡地

济南免费建站软件开发外包项目合作

海外培训视频网站建设嘉兴做毛织的有哪些网站

建网站建设的基本流程广州前端培训机构

免费网站制造中山快速做网站费用

品牌网站设计建设zencart 网站换域名

安做省民改厅网站网站搭建实训报告

网站开发外包报价单wordpress 自定义变量

南宁本地有几家网站开发硅塑胶东莞网站建设

重庆长寿网站建设seo推广技巧

搜不到wordpress 网站废物利用手工制作图片

网站运行环境建设方案工程建设标准化网站

怎么做自己的网站推广产品wordpress 扁平化主题

建立网站的英文怎么说企业网站开发工资

做房地产网站广告销售网站建设及维护干什么的

网站导航栏字体wordpress4.91

故事网站模版描述photoshop在网站建设中的作用与特点.

做视频网站视频放在哪里如何建立一个小程序

目前网站开发趋势大栅栏网站建设

关于学校网站建设申请报告学习做网站大概多久时间

域名买卖网站公司网站文件夹设计

1. 起因， 目的: