AI Agent学习
ld推荐学习课程
- UC Berkeley CS194-196
- 读姚顺雨的ReAct Agent 论文
- 读姚顺雨的SWE Agent 论文
- 尝试实现一个简单的AI Agent(使用langchain 或者 直接用python、ts自己糊一个)
- 了解MCP
- 了解各个模型的性能和benchmark:
- SWE Bench:目前SWE Agent的对比
- Imarena leaderboard:以chatbot形式的用户投票的LLM大排名
- Aider benchmark:以Aider作为SWE Agent的大模型排名,包括准确度和费用成本
- LiveCodeBench:另一个codeing能力的benchmark
- LiveBench:对6个维度的LLM排名
- GPQA:通用问答LLM benchmark
- 最好的模型:OpenAI家族(o3、o4-mini high)、claude 3.5/3.7、google gemini 2.5 pro
- 性价比最高:deepseek V3/R1/R2
- 随意切换供应商、可以薅羊毛:OpenRouter
读其他流行CodingAgent、AlAgent、multi agent论文和项目:
- MetaGPT:multiagent完成软件项目
- AutoAgent:港大的sWEAgent
- OpenHands:自前效果最好的SWEAgent之一,原先OpenDevin
- CamelAl、AutoGen、CrewAl:multiagent框架
- cline、aider:开源的SWEAgent实现
- claudecode:claude的闭源实现
- OpenDeep Research by LangChain: LangChain的deepresearc实现
- 目前流行的商业化项目:cursor、windsurf、github copilot、vo、bolt new、lovable、manus.im等等等等…
- 需要灵感?看YouTube上的YCombinator频道,逛逛HackerNews,多看Twittere上做LLM和AIAgent的项目