当前位置：首页 > news >正文

ai agent开发实例

news 2025/8/23 13:01:44

manus现在比较火，但是其实要做manus这样的agent应该也是有很多的开源项目了，今天我们来实际部署一些常用的agent制作的项目，然后一步步做一个可以帮自己编程、做实验的agent。
首先需要安装好conda环境，我这里已经按照好了，需要的可以去看一下以前的文章。

这里写目录标题

Openmanus
- 1创建python环境
- 2获取代码
- 3安装项目所需要的python依赖包
- 文件配置
- 代码修改
- 6最终测试
dify
- 克隆项目
- 启动docker
owl
- 获取文件

Openmanus

1创建python环境

conda create -n open_manus python=3.12
conda activate open_manus

在这里插入图片描述

2获取代码

git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus

在这里插入图片描述

3安装项目所需要的python依赖包

pip install -r requirements.txt

在这里插入图片描述

文件配置

安装完毕之后就可以去配置config了，先去config文件夹中创建一个config.toml
在这里插入图片描述
编辑config.toml文件，这里需要使用api，所以请提前去你的云计算平台开通相关服务，我是使用的是阿里云百炼

我的config文件如下所示。

# Global LLM configuration
[llm]
model = "qwq-32b"
base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1/"
api_key = "sk-xxx"  # Replace with your actual API key
max_tokens = 4096
temperature = 0.0

# Optional configuration for specific LLM models
[llm.vision]
model = "qwq-32b"
base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1/"
api_key = "sk-xxx"  # Replace with your actual API key

代码修改

一些改动内容如下，首先我该了网络搜索的接口，使用比应作为百度
安装baidusearch

pip install baidusearch

修改app/tool/google_search.py：

import asyncio
from typing import List
# from googlesearch import search
from bingsearch import search

另外，模型是需要支持Function Call的大模型才可以，可以去https://ollama.com/search?c=tools查一下有没有这个tools的标签，如果没有那就是调用不了的

在这里插入图片描述

6最终测试

python main.py

# 官方问题
Run a thorough SEO AUDIT ON karpathy's website (https://karpathy.ai) and deliver a detailed optimization report with actionable recommendations

在这里插入图片描述
可以让它帮你执行一些具体的任务，这也是agent与chat的区别所在。
如果出现问题请检查是否是模型设置有问题：

目前百炼的有点问题的，所以也可以把它换成硅基流动的api。https://cloud.siliconflow.cn/models?types=chat&tags=Tools 在这里插入图片描述
选上对话和tools，修改config文件。我这里能用的yaml是qwen-plus的

# Global LLM configuration
[llm]
model = "qwen-plus"
base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1"
api_key = "sk-ed28dce9908f432bacca53fcf76e92eb"  # Replace with your actual API key
max_tokens = 4096
temperature = 0.0

# Optional configuration for specific LLM models
[llm.vision]
model = "qwen-plus"
base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1"
api_key = "sk-ed28dce9908f432bacca53fcf76e92eb"  # Replace with your actual API key

在这里插入图片描述
我就问了个“你好”，结果它有30个step来处理。太慢了还是，后面试着使用本地大模型再来尝试一下。但是他也并没有去执行我想要的任务啊？我让他启动一个roscore：

貌似还是一些问答，还是没有去执行我想要的内容，或与还没有接本地的一些接口。

dify

这是一个有着80多k的项目，相信很多大家熟悉的架构应该都是有借鉴这个项目进行开发的，接下来我们来本地部署并且制作一下自己的智能体。

克隆项目

git clone https://github.com/langgenius/dify.git

启动docker

先进入dify/docker文件夹

cd dify/docker

复制环境配置文件，注意，是隐藏文件看不到的。

cp .env.example .env

在这里插入图片描述

启动docker

sudo docker compose up -d

在这里插入图片描述

如果失败了可以清理一下存缓：sudo docker system prune -a
或者如果连接失败时换源：

遇到这种情况可以先换一下源，运行

sudo gedit /etc/docker/daemon.json

添加

{
 "registry-mirrors": ["https://docker.m.daocloud.io","https://0c105db5188026850f80c001def654a0.mirror.swr.myhuaweicloud.com","http://mirrors.ustc.edu.cn/dockerhub/"]
}

全部都创建完成之后，请确保所有的容器都正常运行

docker compose ps

在这里插入图片描述
打开浏览器，输入

localhost:80

就可以进入dify中了。
在这里插入图片描述
请设置并记住自己的管理员信息，登录进去过后就能使用相关的功能了。

大模型API接入，前往设置，可以看到模型供应商，我们去找到自己熟悉的，然后i将api-key输入即可

dify官方有很多不错的智能体/工作流，我们只需要把它添加到工作区即可
在这里插入图片描述

为了增强LLM的上下文能力，可以提供自己的知识库进去
在这里插入图片描述
为了实现比较复杂的智能体任务，我们可以通过工具库来实现这些内容

具体设计后续我们再继续。

owl

获取文件

首先还是获取仓库

git clone https://github.com/camel-ai/owl.git
cd owl

我比较喜欢使用conda，这里创建一个虚拟环境

conda create -n owl python=3.11
conda activate owl

然后安装依赖库

python -m pip install -r requirements.txt

接下来需要配置它的API
在这里插入图片描述
这是一个隐藏文件，所以可能会看不到，创建好的.env文件

# Qwen API (https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key)
QWEN_API_KEY="sk-ed28dce9908f432bacca53fcf76e92eb"

# DeepSeek API (https://platform.deepseek.com/api_keys)
# DEEPSEEK_API_KEY=""

#===========================================
# Tools & Services API
#===========================================

# Google Search API (https://developers.google.com/custom-search/v1/overview)
GOOGLE_API_KEY=""
SEARCH_ENGINE_ID=""

# Hugging Face API (https://huggingface.co/join)
HF_TOKEN=""

# Chunkr API (https://chunkr.ai/)
CHUNKR_API_KEY=""

# Firecrawl API (https://www.firecrawl.dev/)
FIRECRAWL_API_KEY=""

然后可以测试一下大模型是否可用

# 使用 Qwen 模型运行
python owl/run_qwen.py

# 使用 Deepseek 模型运行
python owl/run_deepseek.py

# 使用其他 OpenAI 兼容模型运行
python owl/run_openai_compatiable_model.py

在这里插入图片描述

最后只需要启动项目进行测试即可

python run_app.py

在这里插入图片描述

这个可视化使用gradio做的，我没有chrome浏览器，也就没有执行后续内容了

查看全文

http://www.dtcms.com/a/62218.html

Mysql 的 Query Cache为什么被废弃

设计一个优秀 API 的秘诀

HAMSTER: HIERARCHICAL ACTION MODELS FOR OPEN-WORLD ROBOT MANIPULATION

2.4 基于Vitest的单元测试基础设施搭建

AutoGen学习笔记系列（十）Advanced - Swarm

大湾区经济网报道：全国已有103个统筹地区实施医保基金即时结算

Ubuntu 22.04 安装配置 FTP服务器教程

Vue3的基本使用

Nginx 服务器，Apache 服务器，IIS 服务器的区别

【测试语言基础篇】Python基础之List列表

Vim多模式编辑器的三种模式和常用命令集

springboot432-基于SpringBoot的酒店管理系统(源码+数据库+纯前后端分离+部署讲解等)

使用 crontab 定时同步服务器文件到本地

HarmonyOS开发 - 电商App实例三（网络请求axios）

NGINX介绍--鱼皮老师课程学习笔记

《HTML视觉大框架：构建现代网页设计的基石》

【Pandas】pandas Series update

【玩转23种Java设计模式】结构型模式篇：享元模式

ArduPilot开源代码之AP_OSD_SITL

使用TensorFlow 2构建并训练卷积神经网络（CNN）模型

sap关账+策略模式（避免大量if elseif）

LeetCode 513. 找树左下角的值 java题解

《Spring日志整合与注入技术：从入门到精通》

物理服务器抵御网络攻击的方法都有哪些？

SCSS详解

创建模式-工厂方法模式（Factory Method Pattern）

UE5以插件的形式加载第三方库

AI+视频监控电力巡检：EasyCVR视频中台方案如何赋能电力行业智能化转型

爬虫的精准识别：基于 User-Agent 的正则实现

【RTSP】客户端（一）：RTSP协议实现

这里写目录标题

Openmanus

1创建python环境

2获取代码

3安装项目所需要的python依赖包

文件配置

代码修改

6最终测试

dify

克隆项目

启动docker

owl

获取文件

相关文章：