当前位置：首页 > wzjs >正文

基于PHP网站开发的管理系统设计与开发百度收录比较好的网站

wzjs 2025/8/8 7:25:53

基于PHP网站开发的管理系统设计与开发,百度收录比较好的网站,广州做营销网站公司,大良网站智能推广价格目录准备工作编写爬虫代码运行爬虫查看结果遇到的问题及解决总结前言和效果本文记录了使用 Python 实现一个简单网页爬虫的过程，目标是爬取 quotes.toscrape.com 的名言和作者，并将结果保存到文本文件。以下是完整步骤，包含环境…

准备工作

编写爬虫代码

运行爬虫

查看结果

遇到的问题及解决

总结

前言和效果

本文记录了使用 Python 实现一个简单网页爬虫的过程，目标是爬取 quotes.toscrape.com 的名言和作者，并将结果保存到文本文件。以下是完整步骤，包含环境配置、依赖安装和代码运行。
网站截图：

爬取到的内容截图如下:

准备工作

激活 Anaconda 虚拟环境
我的 Python 环境基于 Anaconda，使用的虚拟环境是 SRCNN（路径：D:\Anaconda\envs\SRCNN）。首先，需要激活该环境：

conda activate SRCNN

运行后，命令行前缀变为 (SRCNN)，表示成功切换到虚拟环境。

安装依赖包
爬虫需要两个库：requests（发送 HTTP 请求）和 beautifulsoup4（解析 HTML）。在 SRCNN 环境中安装：

conda install requests beautifulsoup4

安装报错了，原因是未关闭科学上网，后关闭了这两个包就装好了。报错如下：
关闭科学上网后重新安装

安装完成后，命令行显示安装成功的提示。

验证安装
为确保 beautifulsoup4 正确安装在 SRCNN 环境中，运行以下命令检查：

pip show beautifulsoup4

输出显示模块版本为 4.12.2，安装路径为 D:\Anaconda\envs\SRCNN\Lib\site-packages，确认安装正确。

编写爬虫代码，完整代码：

以下是爬虫代码（pac.py），用于爬取 quotes.toscrape.com 的名言和作者，并保存到 quotes.txt：

import requests
from bs4 import BeautifulSoup# 目标网页
url = "http://quotes.toscrape.com/"try:# 发送 HTTP 请求response = requests.get(url)response.raise_for_status()  # 检查请求是否成功# 解析 HTMLsoup = BeautifulSoup(response.text, "html.parser")# 提取名言和作者quotes = soup.find_all("div", class_="quote")results = []for quote in quotes:text = quote.find("span", class_="text").get_text()author = quote.find("small", class_="author").get_text()results.append({"quote": text, "author": author})# 保存到文件with open("quotes.txt", "w", encoding="utf-8") as f:for item in results:f.write(f"Quote: {item['quote']}\nAuthor: {item['author']}\n\n")print("爬取完成，结果已保存到 quotes.txt")except requests.RequestException as e:print(f"请求错误: {e}")
except Exception as e:print(f"发生错误: {e}")

代码说明：

使用 requests.get 获取网页内容。
用 BeautifulSoup 解析 HTML，提取 class="quote" 的 <div> 元素。
提取每条名言（class="text"）和作者（class="author"），保存到 quotes.txt。

目标网站：
Quotes to Scrape

运行爬虫

在 SRCNN 环境中运行代码：

D:\Anaconda\envs\SRCNN\python.exe D:/YAN/pythonProject/PaChong/pac.py

运行后，程序输出“爬取完成，结果已保存到 quotes.txt”，表示成功。

查看结果

爬取结果保存在 D:/YAN/pythonProject/PaChong/quotes.txt，内容为每条名言及其作者。

遇到的问题及解决

最初运行时，提示 ModuleNotFoundError: No module named 'bs4'，因为 beautifulsoup4 安装在 Anaconda 全局环境（D:\Anaconda\Lib\site-packages）而非 SRCNN 环境。解决方法是激活 SRCNN 环境并重新安装：

conda activate SRCNN
conda install beautifulsoup4

此外，确认 requests 已安装，避免类似错误。

总结

通过以上步骤，我成功实现了一个简单的 Python 爬虫：

激活 SRCNN 虚拟环境。
安装 requests 和 beautifulsoup4。
编写并运行爬虫代码，爬取名言并保存到文本文件。

这个过程熟悉了 Anaconda 虚拟环境管理和爬虫开发，适合初学者参考。未来可扩展功能，如处理多页爬取或应对反爬机制。

查看全文

http://www.dtcms.com/wzjs/242500.html

word做招聘网站建立网站费用大概需要多少钱

外贸网站怎么做seo优化自己建网站怎样建

桐柏网站麒麟seo软件

小零件加工在家做惠州抖音seo策划

新建网站如何推广网络app推广是什么工作

婚恋网站建设技巧家居seo整站优化方案

原阳网站建设哪家好企业网站运营推广

长春网站建设制作seo的作用主要有

响应式网站设计软件中和seo公司

专门做图片的网站cmsseo研究中心怎么样

大学网站建设成都网站优化排名

怎么做钓鱼网站搜狗推广管家

卧龙区2015网站建设价格seo工程师

济南网站哪家做的好广告投放网站

制作公众号的软件谷歌seo关键词排名优化

网站设计在线培训机构网络营销方案例文

河北建设委员会网站首页宁波seo网络推广定制

asp做网站缺点软文广告成功案例

个人网站建设一般流程网络营销的手段有哪些

嘉兴百度网站推广网络搭建教程

福州网站大全百度官网下载安装到桌面上

北京手机网站开发费用武汉seo哪家好

谷歌网站推广排名工具石家庄网络推广

惠州专门做网站360搜索指数

做网站域名空间新手怎么做网页

网站的规划与建设_按时间顺序可以分为哪等五个阶段网络seo培训

做软件与做网站建设有什么区别网络营销工具平台

商城展示网站建设住房和城乡建设部官网

克旗网站制作5229998济南全网推广

学技巧网站制作南宁seo优化

前言和效果

准备工作

编写爬虫代码，完整代码：

运行爬虫

查看结果

遇到的问题及解决

总结

相关文章：