当前位置: 首页 > news >正文

网站开发实践体会网站自然排名工具

网站开发实践体会,网站自然排名工具,百度知道登录,wordpress文章乱码关于普林斯顿大学和Google Research, Brain Team合作的一篇文章, 在语言模型中协同Reasoning推理和Action行动。 论文地址:https://arxiv.org/abs/2210.03629 代码:https://github.com/ysymyth/ReAct.git 其他复现 langchain :https://pytho…


关于普林斯顿大学和Google Research, Brain Team合作的一篇文章, 在语言模型中协同Reasoning推理和Action行动。

论文地址:https://arxiv.org/abs/2210.03629
代码:https://github.com/ysymyth/ReAct.git
其他复现 langchain :https://python.langchain.com/api_reference/langchain/agents/langchain.agents.agent.AgentExecutor.html#

作者们注意到,尽管LLMs在理解和生成方面表现出色,但它们在推理和行动方面的能力通常是分开研究的。他们提出,通过交互式的方式生成推理痕迹(reason)和任务特定行动(act),可以更有效地结合这两种能力,从而提高模型的 interpretability、trustworthiness 和解决复杂任务的能力。

数据:

  • HotpotQA: 多跳问题回答基准,需要模型跨越多个Wikipedia页面进行推理。
  • FEVER: 事实验证基准,模型必须基于Wikipedia页面验证声明的真实性。
    方法:
  • Standard(标准提示):删除ReAct轨迹中的所有思想、行动、观察等步骤。
  • CoT(思想链提示):删除行动和观察,保留思想,并作为仅用于推理的基线。
  • CoT-SC(self-consistency):利用自一致性[1]方法,在推理期间抽样21个CoT轨迹,解码温度为0.7,并采用大多数投票得到答案。
  • Act:仅仅保留Agent提示(Act),它删除了ReAct轨迹中的Thought思维过程,可以初步认为其类似于WebGPT。
  • ReAct:本文的Thought + Action结合的方法。
  • ReAct → CoT-SC:当ReAct未能在给定步骤内返回答案时,返回CoT-SC结果。
  • CoT-SC → ReAct:当n个CoT-SC样本中的大多数答案少于n/2次(即内部知识可能无法自信地支持任务)时,返回ReAct结果。
  • 微调 (Finetuning)
    • 使用3000个由ReAct生成的正确答案轨迹来微调较小的语言模型。‘’

Langchain 中实现的Prompt

PREFIX = """Answer the following questions as best you can. You have access to the following tools:""" FORMAT_INSTRUCTIONS = """Use the following format: 
shell
Question: the input question you must answer 
Thought: you should always think about what to do 
Action: the action to take, should be one of [{tool_names}] 
Action Input: the input to the action 
Observation: the result of the action 
... (this Thought/Action/Action Input/Observation can repeat N times) 
Thought: I now know the final answer 
Final Answer: the final answer to the original input question""" 
SUFFIX = """Begin!Question: {input} 
Thought:{agent_scratchpad}"""

示例

from langchain.agents import initialize_agent
from langchain.llms import OpenAI
from langchain.tools import BaseTool# 搜索工具
class SearchTool(BaseTool):name = "Search"description = "如果我想知道天气,'鸡你太美'这两个问题时,请使用它"return_direct = True  # 直接返回结果def _run(self, query: str) -> str:print("\nSearchTool query: " + query)return "这个是一个通用的返回"async def _arun(self, query: str) -> str:raise NotImplementedError("暂时不支持异步")# 计算工具
class CalculatorTool(BaseTool):name = "Calculator"description = "如果是关于数学计算的问题,请使用它"def _run(self, query: str) -> str:print("\nCalculatorTool query: " + query)return "100"async def _arun(self, query: str) -> str:raise NotImplementedError("暂时不支持异步")llm = OpenAI(temperature=0.5)
tools = [SearchTool(), CalculatorTool()]
agent = initialize_agent(tools, llm, agent="zero-shot-react-description", verbose=True)print("问题:")
print("答案:" + agent.run("查询这周天气"))
print("问题:")
print("答案:" + agent.run("告诉我'鸡你太美'是什么意思"))
print("问题:")
print("答案:" + agent.run("告诉我'hello world'是什么意思"))
print("问题:")
print("答案:" + agent.run("告诉我10的3次方是多少?"))
http://www.dtcms.com/a/443768.html

相关文章:

  • 网站建设加数据库昆山哪家做网站好
  • 泰安肥城建设局网站江门网站推广策划
  • 珠海网站建设设计python 快速搭建网站
  • 【期末复习】51单片机
  • 建站视频网站网站没更新
  • 网站兼容性代码wordpress模版怎么上传
  • 阿里云主机上传网站wordpress弹出式侧边栏
  • 建设企业资质双网是哪两个网站免费发布产品的平台
  • 坪山网站建设要多少钱亚马逊关键词
  • 【漏洞复现和代码审计】CVE-2025-24813
  • 兰州彩票网站制作中国著名设计师的推荐
  • 股票做空网站wordpress禁止访问
  • 邵阳多用户商城网站建设wordpress多作者
  • 基础网站建设公司学院网站群建设的目标
  • 去菲律宾做it网站开发重庆建网站优化
  • 曲靖企业网站建设房地产 东莞网站建设
  • 淮北矿业工程建设有限公司网站网站建设开发实训的目的
  • 珠海营销网站建设wordpress 增大字体
  • AVM标定:解锁360°全景影像的秘密
  • 网站开发先学前端还是后端wordpress添加内链按钮
  • 青海省建设厅网站备案资料网站制作费用一览表
  • 武安市城乡建设局网站搜狐一开始把网站当做什么来做
  • 网站安全 维护网络工程师怎么考
  • 网站开发目录规范百度的竞价排名是哪种方式
  • 创新的企业网站制作哪家做网站最好
  • 主流网站编程语言查域名服务商
  • 创建一个网站需要什么条件网站建设添加汉语
  • 中国网站排名网企业网站建设排名资讯
  • 东昌府区住房和城乡建设局网站保定seo外包服务商
  • 做医院网站公司吗推广普通话奋进新征程ppt