当前位置: 首页 > wzjs >正文

湖北联兴建设有限公司网站手机网站预约表单

湖北联兴建设有限公司网站,手机网站预约表单,外贸网络营销方案,石狮网站系列文章索引 LangChain教程 - 系列文章 随着人工智能和大语言模型(LLM)的快速发展,越来越多的工具和平台被引入以简化我们的日常任务。LangChain是一个非常强大的框架,它能够帮助开发者构建与LLM(如OpenAI、Ollama等…

系列文章索引
LangChain教程 - 系列文章

随着人工智能和大语言模型(LLM)的快速发展,越来越多的工具和平台被引入以简化我们的日常任务。LangChain是一个非常强大的框架,它能够帮助开发者构建与LLM(如OpenAI、Ollama等)进行交互的应用程序。本篇博客将详细介绍如何结合LangChain和Ollama的API来对PDF文档进行自动化总结。

在本示例中,我们将介绍如何通过几个简单的步骤:加载PDF文件、提取其文本内容、根据字数判断总结策略、以及使用Ollama模型生成文档总结。

1. 环境准备

首先,我们需要确保你已经安装了相关的Python库。这些库包括LangChainOllama(你可以通过langchain-ollama库访问),以及PDF处理库PyPDFLoader。如果你还没有安装这些库,可以通过以下命令进行安装:

pip install langchain langchain-ollama PyPDF2

2. 加载PDF文档

使用PyPDFLoader加载PDF文件非常简单。它会将文档内容提取为一个文本列表,接着我们可以将这些内容合并成一个字符串。以下是加载和提取PDF内容的代码示例:

from langchain.document_loaders import PyPDFLoader# 加载PDF文档
pdf_path = "/path/to/your/file.pdf"  # 替换为你的PDF文件路径
loader = PyPDFLoader(pdf_path)# 提取文档内容
documents = loader.load()# 获取文档的内容
content = "".join([doc.page_content for doc in documents])

3. 判断字数并选择处理方法

我们接下来会计算文档的总字数,并根据字数决定如何处理文本。如果字数较少(小于2000字),我们可以直接对全文进行总结。如果字数较多(大于2000字),我们只会提取文档的前1000个字和最后1000个字来进行总结。以下是实现这一逻辑的代码:

# 获取文章字数
content_length = len(content)# 判断文章字数情况并处理
if content_length < 2000:# 如果字数小于2000,直接对全文进行总结text_to_summarize = content
else:# 如果字数大于2000,提取前1000个字和后1000个字start_text = content[:1000]end_text = content[-1000:]text_to_summarize = start_text + "\n\n" + end_text

4. 使用Ollama模型生成总结

在这部分代码中,我们将设置Ollama的大语言模型并创建一个LangChain的链条来生成总结。你可以选择不同的Ollama模型,在这里我们选择了deepseek-r1:7b模型。为了生成总结,我们构建了一个简单的总结提示模板,要求生成的总结字数不超过100字。

from langchain.prompts import PromptTemplate
from langchain_ollama import OllamaLLM# 设置Ollama模型
llm = OllamaLLM(model="deepseek-r1:7b")# 创建总结的提示模板
prompt_template = """
请对以下文本进行总结(100个字以内):{text}总结:
"""# 创建提示模板
prompt = PromptTemplate(template=prompt_template, input_variables=["text"])# 创建LLM链
chain = prompt | llm# 生成总结
summary = chain.invoke({"text": text_to_summarize})# 输出总结
print("Summary:\n", summary)

5. 运行整个流程

将所有部分结合起来,你可以得到一个完整的程序,它能够自动处理PDF文档并生成总结。运行这个程序的步骤如下:

  1. 加载PDF文档:提取文档内容。
  2. 字数判断与处理:根据字数判断是对全文进行总结,还是只取前后部分进行总结。
  3. 生成总结:使用Ollama模型生成总结并输出。

以下是完整的代码示例:

from langchain.document_loaders import PyPDFLoader
from langchain.prompts import PromptTemplate
from langchain_ollama import OllamaLLM# 加载PDF文档
pdf_path = "/path/to/your/file.pdf"  # 替换为你的PDF文件路径
loader = PyPDFLoader(pdf_path)# 提取文档内容
documents = loader.load()# 获取文档的内容
content = "".join([doc.page_content for doc in documents])# 获取文章字数
content_length = len(content)# 判断文章字数情况并处理
if content_length < 2000:# 如果字数小于2000,直接对全文进行总结text_to_summarize = content
else:# 如果字数大于2000,提取前1000个字和后1000个字start_text = content[:1000]end_text = content[-1000:]text_to_summarize = start_text + "\n\n" + end_text# 设置Ollama模型
llm = OllamaLLM(model="deepseek-r1:7b")# 创建总结的提示模板
prompt_template = """
请对以下文本进行总结(100个字以内):{text}总结:
"""# 创建提示模板
prompt = PromptTemplate(template=prompt_template, input_variables=["text"])# 创建LLM链
chain = prompt | llm# 生成总结
summary = chain.invoke({"text": text_to_summarize})# 输出总结
print("Summary:\n", summary)

6. 结语

通过上面的代码示例,我们已经展示了如何结合LangChainOllama模型来处理PDF文档,并生成简洁的总结。这种方法非常适用于需要自动化文档处理和快速获取关键信息的场景。无论是用于新闻文章、学术论文,还是商业报告,这种方法都能为你提供高效的总结功能。

如果你有任何问题或进一步的需求,欢迎在评论区留言交流!


文章转载自:

http://GksPTgYg.xdqrz.cn
http://m7xT44Tc.xdqrz.cn
http://jpbqOV3F.xdqrz.cn
http://zpDv7nHM.xdqrz.cn
http://wRDKtbiQ.xdqrz.cn
http://noQg9Ud5.xdqrz.cn
http://q8NKR4eX.xdqrz.cn
http://QK79Dxyc.xdqrz.cn
http://QRNJGzjt.xdqrz.cn
http://KbsIUcx2.xdqrz.cn
http://z78OB51a.xdqrz.cn
http://rTUj1yay.xdqrz.cn
http://g1XpPMSP.xdqrz.cn
http://3wd8qwqA.xdqrz.cn
http://wqohOLUe.xdqrz.cn
http://0bcp6ddu.xdqrz.cn
http://TWT676Ur.xdqrz.cn
http://820dDSOS.xdqrz.cn
http://v4Q4AP43.xdqrz.cn
http://n5FjvzBA.xdqrz.cn
http://6iz20zMt.xdqrz.cn
http://7TNIKdo5.xdqrz.cn
http://GBB7DFMx.xdqrz.cn
http://OZFPPfBc.xdqrz.cn
http://msMDPyQ1.xdqrz.cn
http://U5uFvFZk.xdqrz.cn
http://HdLuf1lZ.xdqrz.cn
http://ayQIcIVh.xdqrz.cn
http://q5qaospd.xdqrz.cn
http://99sRVlB9.xdqrz.cn
http://www.dtcms.com/wzjs/721847.html

相关文章:

  • 南京城市规划建设展览馆网站数字化平台建设
  • 网站集约化建设什么意思做外贸网站要花多少钱
  • 从化做网站建设妇产医院网站源码
  • 如何做好一个网站的推广做一个公司网站价格
  • 一个网站建立团队大概要多少钱wordpress 改网站介绍
  • 网站建设加工做软件页面设计的软件
  • 临沂网站建设哪家更好重庆食品公司
  • 常州网络网站建设乌兰浩特市建设局网站
  • 如何做购物网站的后台增城网站建设价格
  • 做内贸的什么网站效果好陕西建设工程信息网官网
  • 小程序和网站建设需要多钱十五种常见的销售策略
  • 世界杯视频直播网站制作网站公司唐山
  • 专门做海报的网站html网站模板建站
  • 各种类型网站建设口碑好舞蹈培训网站模板
  • 常熟有没有做阿里巴巴网站做网站的怎么挣钱
  • 余姚网站建设开发自助单页网站
  • 网络推广策划培训班谷歌seo推广服务
  • 达人室内设计网站婚纱摄影网站怎么建设
  • 江苏新站优化广州市住房和城乡建设局网站首页
  • 简单网站建设方案策划域名服务网站建设科技公司
  • 自己建设网站平台步骤巴中 网站建设
  • 网站建设与维护结课论文修改wordpress默认主题标题
  • 做的网站在百度找不到了网页美工设计教案网页元素设计
  • a站插画一键免费建站
  • 鄂尔多斯建设招投标网站泉州网站建设 推广
  • 个人建设网站制作做网站如何兼职
  • 手机网站建站多少钱行业门户网站的优化怎么做yps行业门户系统
  • 做网站能用假图片吗您备案的网站名称没有关联性
  • 类似电影天堂的网站 怎么做wordpress增加移动端
  • seo网站自动推广学校网站的英文