当前位置: 首页 > news >正文

WPF/C#:使用Microsoft Agent Framework框架创建一个带有审批功能的终端Agent

前言

最近新出了一个Microsoft Agent Framework框架,我感觉还挺有意思的,就通过它的那个Using function tools with human in the loop approvals例子,做了一个终端助手Agent。我觉得使用这个作为学习人在环上这个例子蛮合适的,因为对于需要执行敏感操作(如系统命令)的场景,人工审批机制显得尤为重要。本文以Rouyan为例,说明如何使用Microsoft Agent Framework创建一个能够执行终端命令并具备人工审批功能的WPF应用。

在详细介绍之前,先来看看它的效果。

1、比如获取当前时间

会先弹出一个人工审批窗口:

image-20251017213637660

然后你点击同意了才会执行:

image-20251017213716893

如果你拒绝了就是这样:

image-20251017213755043

实际上你可以利用终端做很多事情,我再举一个例子。

2、新建一个文件,写入你好:

image-20251017214320364

选择同意,结果如图所示:

image-20251017214407194

image-20251017214543527

在介绍如何具体实现之前,先来介绍一下Microsoft Agent Framework。

Microsoft Agent Framework介绍

GitHub上的简介是:“一个用于构建、编排和部署AI代理及多代理工作流程的框架,支持Python和.NET。”

GitHub地址:https://github.com/microsoft/agent-framework

image-20251017215713327

Microsoft Agent Framework 是一个开源开发工具包,用于为 .NET 和 Python 构建 AI 代理和多代理工作流。它整合并扩展了 Semantic Kernel 和 AutoGen 项目的思想,融合了两者的优点,并新增了多项功能。该框架由同一团队开发,将成为未来构建 AI 代理的统一基础。

Agent Framework 提供了两大主要功能类别:

AI 代理:单个代理利用大语言模型(LLM)处理用户输入,调用工具和 MCP 服务器执行操作,并生成响应。代理支持的模型提供商包括 Azure OpenAI、OpenAI 和 Azure AI。

工作流:基于图形的工作流,用于连接多个代理和功能,以执行复杂的多步骤任务。工作流支持基于类型的路由、嵌套、检查点以及适用于人工干预场景的请求/响应模式。

该框架还提供了基础构建模块,包括模型客户端(聊天补全和响应)、用于状态管理的代理线程、用于代理记忆的上下文提供程序、用于拦截代理操作的中间件,以及用于工具集成的MCP客户端。这些组件共同为您提供灵活性和强大功能,以构建交互性强、稳健且安全的AI应用程序。

image-20251017215856749

具体实现

1、安装Nuget包:

image-20251017220544499

2、编写运行脚本的函数

[Description("Execute a Windows cmd.exe script and return its output.")]
static string ExecuteCmd([Description("The script content to run via 'cmd.exe /c'.")] string script)
{try{var psi = new ProcessStartInfo("cmd.exe", "/c " + script){UseShellExecute = false,RedirectStandardOutput = true,RedirectStandardError = true,CreateNoWindow = true};using (var process = new Process()){process.StartInfo = psi;process.Start();string output = process.StandardOutput.ReadToEnd();string error = process.StandardError.ReadToEnd();process.WaitForExit();if (!string.IsNullOrWhiteSpace(error)){return $"错误: {error.Trim()}";}return output.Trim();}}catch (Exception ex){return $"执行失败: {ex.Message}";}
}

3、配置AI Agent

文档中只写了Azure中怎么使用,兼容OpenAI格式的可以这样写:

 // 配置AI AgentDotEnv.Load();var envVars = DotEnv.Read();var apiKey = envVars["OPENAI_API_KEY"];var model = envVars["OPENAI_CHAT_MODEL"];var baseUrl = new Uri(envVars["OPENAI_BASE_URL"]);ApiKeyCredential apiKeyCredential = new ApiKeyCredential(apiKey);OpenAIClientOptions openAIClientOptions = new OpenAIClientOptions();openAIClientOptions.Endpoint = baseUrl;AIAgent agent = new OpenAIClient(apiKeyCredential, openAIClientOptions).GetChatClient(model).CreateAIAgent(instructions: "你是一个乐于助人的助手,可以执行命令行脚本。请使用中文回答。", tools: [new ApprovalRequiredAIFunction(AIFunctionFactory.Create(ExecuteCmd))]);

这里有一个新东西就是ApprovalRequiredAIFunction

这说明如果调用这个函数需要经过人工审批。

4、审批流程

// Call the agent and check if there are any user input requests to handle.
AgentThread thread = agent.GetNewThread();var response = await agent.RunAsync(InputText, thread);
var userInputRequests = response.UserInputRequests.ToList();

我们先来看看这个是什么,运行起来打个断点看看:

image-20251017221907635

这就是一个Agent想要执行的函数,那么现在来看看如何审批:

while (userInputRequests.Count > 0)
{var userInputResponses = new List<ChatMessage>();foreach (var functionApprovalRequest in userInputRequests.OfType<FunctionApprovalRequestContent>()){var scriptContent = functionApprovalRequest.FunctionCall.Arguments?["script"]?.ToString() ?? "未知脚本";var functionName = functionApprovalRequest.FunctionCall.Name;var dialogVm = new HumanApprovalDialogViewModel{Title = "命令执行审批",Message = $"是否同意执行以下命令?\n\n函数名称: {functionName}\n脚本内容: {scriptContent}"};bool? result = _windowManager.ShowDialog(dialogVm);bool approved = result == true;userInputResponses.Add(new ChatMessage(ChatRole.User, [functionApprovalRequest.CreateResponse(approved)]));}// Pass the user input responses back to the agent for further processing.response = await agent.RunAsync(userInputResponses, thread);userInputRequests = response.UserInputRequests.ToList();
}

根据这个地方userInputResponses.Add(new ChatMessage(ChatRole.User, [functionApprovalRequest.CreateResponse(approved)]));中的approved传入的是true还是false表示用户是同意还是拒绝。

然后发送请求获取新的回复,直到没有需要人工审批的函数为止。

5、流式响应

最后再获取一个流式响应:

await foreach (var update in agent.RunStreamingAsync("输出最终答案", thread))
{OutputText += update.Text;
}

最后

以上就是本期的全部内容,希望对你有所帮助。

全部代码已上传至GitHub,地址:https://github.com/Ming-jiayou/Rouyan。

终端助手的代码主要在src/Rouyan/Pages/ViewModel/TerminalAgentViewModel.cs中。

http://www.dtcms.com/a/506893.html

相关文章:

  • 『 QT 』信号-槽 补充: Qt信号槽断开连接与Lambda槽技巧
  • 为何海尔洗衣机屡屡发明新品类?
  • 【案例实战】HarmonyOS应用性能优化实战案例
  • 企业网站建设尚未实现宣传功能交互效果好的移动端网站
  • 10m带宽做下载网站深圳一公司今年新成立16家核检机构
  • 优麒麟(Ubuntu Kylin) 安装向日葵远程工具/ToDesk
  • 速卖通新号优惠券采购:自养号效率提升的安全要点
  • Linux InfiniBand代理模块深度解析:管理数据包的高效处理引擎
  • 开源协作2.0:GitHub Discussions+AI重构开发者社区的知识共创生态
  • Linux01:基础指令与相关知识铺垫(一)
  • QueryWrapper - MyBatis-Plus的“查询条件构建器“
  • Linux外设驱动开发1 - 单总线驱动开发__dht11
  • 使用高性能流式的库SpreadCheetah来添加图片和合并表格单元
  • 建设银行网站建设情况免费招聘的网站
  • 手机上怎么做微电影网站徐州做网站谁家最专业
  • 【Mathematics】椭圆眼睛跟随鼠标交互中的仿射变换数学推导
  • 【u-boot】u-boot的分区支持
  • CG-FS-A3 风速传感器 485型 体积小巧 便捷安装 三杯式 聚碳材质
  • http和https区别如何转https
  • 国外的主要电机生产厂商
  • 英伟达公司发展历史
  • 网站首页文件名通常是无锡市建设安全监督网站
  • SQL之参数类型讲解——从基础类型到动态查询的核心逻辑
  • Linux中匿名设备和安全相关以及VFS的slab缓存对象创建
  • B.NET编写不阻塞UI线程的同步延时
  • 论文泛读:DYNAPROMPT: DYNAMIC TEST-TIME PROMPT TUNING(动态测试时调优)
  • 做 58 那样的网站北京公司网页设计
  • PyTorch实战(9)——从零开始实现Transformer
  • 18.SELInux安全性
  • Layui连线题编辑器组件(ConnectQuestion)