当前位置: 首页 > news >正文

Claude Code + 自定义模型体验

文章目录

    • 背景
    • 《Claude Code:面向代理式编程的最佳实践》
      • “上下文工程”才是关键
      • 全局的CLAUDE.md文件
      • 代理不会读心,它们需要「规范说明(Spec)」
      • 先计划再动手
      • Claude Code 不止能写代码
    • 安装使用Claude Code
      • 安装Node.js
      • 安装原版Claude Code
      • 安装Claude Code Router
      • 配置 Router
        • 通过 Claude Code工具接入 DashScope 接口
    • Qwen3‑Coder
    • 对CLI的交互方式,常用技巧(持续更新)
      • 恢复历史会话
      • 清除聊天上下文
      • 切换中文交互
    • 关于Claude Code Router
      • ✨ 功能
    • Claudia

背景

AI 编程工具的发展突飞猛进:Cursor 横空出世,推出了“Agent 模式”;新竞争者如 Windsurf 也纷纷加入战局。几乎所有产品都开始转向“代理式(agentic)”开发模式——不再依赖单次 LLM 响应进行补全,而是让大模型在一个循环中调用各种工具,来完成更复杂的任务:分析代码库上下文、读取网页与文档、编译程序、运行测试、修复失败构建或测试、不断迭代等。

即使我很喜欢 Claude Code,我也不认为“命令行终端”会是未来开发体验的最佳形式。
可以看看windsurf的这篇文章 https://windsurf.com/blog/what-is-an-agent

虽然世界显然正朝着自主代理的方向发展,但就目前而言,大型语言模型可能还不够完善,无法在没有任何人为干预或纠正的情况下,端到端地完成这些复杂任务。

这种现实带来了一种新的智能体方法,这种方法基于一种认知,即人类应该做什么和智能体应该做什么之间需要保持某种平衡。为了区别于智能体的自主方法,我们将这些智能体称为协作智能体,或简称为 AI flows

这些流程必须在人类进行工作的相同环境中运行。大多数自主代理的尝试,因为它们独立于用户工作,所以是从一个与用户手动完成工作时所处的界面不同的界面调用的。例如,Devin 是从一个网页调用的,但实际上开发人员会在 IDE 中编写代码。虽然这在代理可以真正做任何事情的世界中可能没有问题,但由于这些自主代理系统没有存在于人类进行工作的界面中,因此它们不会意识到人类手动所做的事情。因此,它们会错过很多可以从这些操作中获得的隐含上下文。例如,如果代理存在于 IDE 中,那么它就会意识到最近的手动编辑,这将隐式地告知代理接下来应该做什么。

换句话说,在这个现实中,人类观察智能体的行为很重要,智能体观察人类的行为也很重要。

《Claude Code:面向代理式编程的最佳实践》

Anthropic nthropic 官方的文章:《Claude Code:面向代理式编程的最佳实践》(https://www.anthropic.com/engineering/claude-code-best-practices

“上下文工程”才是关键

随着主流 AI 的兴起,业界很快提出了一个新概念:提示词工程(prompt engineering)。它的核心理念是:你需要精心设计提示词,才能从模型中获取最优结果。这个观点在早期可能确实有道理,但根据我的实际经验,对于现在的新一代模型来说,提示词工程已经不是重点。

当下的模型在理解不完美输入方面已经有了显著提升——一方面因为模型本身更强大,另一方面也因为它们采用了“思维链(Chain of Thought, CoT)”提示策略。现在你就算给模型模糊的描述、不完整的句子、甚至拼写语法错误,它依然能大致理解你的意图,并将问题拆解为合理的解决步骤。

你在使用 Claude Code 或类似工具时,真正需要反复应对的限制,其实是“上下文窗口”(context window)。

Anthropic 最新的两个模型——Sonnet 4 和 Opus 4——都拥有 200k tokens 的上下文长度,意味着它们一次最多能处理大约 200k token 的文本。但你每输入一个 prompt、模型每回应一句,都在消耗这个上下文容量;而一旦临近尾部,模型的表现往往会变差。
在这里插入图片描述

为了解决这个问题,Claude Code 还贴心地显示了一个“上下文剩余容量指示器”——一旦快要用完,它就会自动进入“压缩(compaction)”流程。这一步的意思是:模型会对当前对话内容进行总结,再用这个总结信息来初始化一个新的上下文窗口,以便你继续使用。

但压缩并不完美:它可能遗漏之前对话中的关键细节,或者因为压缩逻辑本身不够精细,将一些错误信息“继承”到新的上下文中。

所以,总结来说——如何在有限的上下文 token 数量内产出最高质量的结果,也就是所谓的上下文工程(context engineering),才是你真正要在编程代理工具中专注优化的核心能力。

全局的CLAUDE.md文件

默认情况下,Claude 会自动读取 CLAUDE.md 文件中的内容——包括用户级别和项目级别的两个版本。但你也可以通过提示词,主动引导它去读取某些文档或源码文件,以补充任务相关的上下文。

Claude 会调用 Search 和 Read 工具查找并读取这些源码文件,再用 Fetch 工具下载 GitHub 上的 Markdown 文档。让它生成总结的这个步骤非常关键,因为总结能迫使模型真正“思考”它理解了什么,而这个总结会被保留在上下文中,进而提升它接下来处理任务的表现。

当你的代码依赖第三方库,或者使用了模型知识截止时间之后发布的新 API 时,预热尤其重要。这类信息模型本身可能并不了解,所以你得手动补充。

现在也有一些专门工具,比如 Context7 和 llm.codes,它们的作用就是将文档格式化成适合语言模型读取的纯文本内容,从而方便“喂”给 Claude 使用。

统一指令:一个全局的CLAUDE.md文件则扮演着“项目经理”的角色,为所有AI智能体设定了共同的行为准则和目标。

代理不会读心,它们需要「规范说明(Spec)」

代理不会读心,它们需要「规范说明(Spec)」

当你让 Claude 构建某个功能时,一份详细的功能说明文档(spec)是引导模型的关键。如果你不愿投入精力编写清


文章转载自:

http://iE8903xF.hwcLn.cn
http://JysFfcPN.hwcLn.cn
http://BTsbcW7H.hwcLn.cn
http://BxvnQ8HF.hwcLn.cn
http://LWtELHpx.hwcLn.cn
http://qQbxeVhD.hwcLn.cn
http://fJs23nN4.hwcLn.cn
http://x7v82rwz.hwcLn.cn
http://rV91mFSD.hwcLn.cn
http://jJ3Ou5Uy.hwcLn.cn
http://Wb8EmL0r.hwcLn.cn
http://CS9UEXkv.hwcLn.cn
http://HfKG2i7X.hwcLn.cn
http://lEKcqFE9.hwcLn.cn
http://ZiNhFLFd.hwcLn.cn
http://YWI85zqB.hwcLn.cn
http://hAnavPBZ.hwcLn.cn
http://aBCU8qnj.hwcLn.cn
http://6zVw4VQJ.hwcLn.cn
http://95OeeUM0.hwcLn.cn
http://rTHP0YYF.hwcLn.cn
http://Q25BLeUl.hwcLn.cn
http://ObhYeqXk.hwcLn.cn
http://KUSPLbXN.hwcLn.cn
http://0vBO0dtj.hwcLn.cn
http://UZqbawCx.hwcLn.cn
http://zruj46Jr.hwcLn.cn
http://Q7Bk01mE.hwcLn.cn
http://tfLD8qvX.hwcLn.cn
http://1LrGAAJ8.hwcLn.cn
http://www.dtcms.com/a/379578.html

相关文章:

  • Python 实战:票据图像自动矫正技术拆解与落地教程
  • 【Kubernetes】常见面试题汇总(十四)
  • 【 Rank(列)、DIMM(内存条) 和 DDR颗粒(内存芯片) 的区别】
  • 密钥协商与前向/后向安全性
  • UART 总线核心特性
  • CDN(Content Delivery Network,内容分发网络)
  • EMC电磁兼容进阶3讲培训:专题二 电源线滤波器仿真实践-基于反激电源
  • 2.DSP学习记录之GPIO输出应用实验
  • WSL2 | 一种临时解决在 Windows 10 运行了一段时间 WSL2 之后 WSL2 无响应的方法
  • SPARC方法论在Claude Code基于规则驱动开发中的应用
  • Python编程基础(九) | 文件和异常
  • AWS IAM条件操作符实战指南:从基础到高级应用
  • SW - 无法用此剖切线来剖切此模型/零部件。请确认该剖切线完全通过该模型。
  • 【主页介绍】
  • 数据治理进阶——解读2024 企业数据治理体系和应用场景案例【附全文阅读】
  • 测试的概念
  • Python生物信息学数据处理大全:从FASTA文件到Pandas DataFrame
  • Android 设置禁止截图和禁止长截图
  • VR煤矿实训系统相较于传统煤矿培训方式的独特优势​-广州华锐互动
  • 鸿蒙Next Web组件详解:属性设置与事件处理实战
  • Chaosblade常用命令和范例
  • Linux内存管理章节九: 打通虚拟与实体的桥梁:深入Linux内存映射机制
  • leetcode13:罗马数字转整数(哈希表模拟)
  • TCP协议的相关特性
  • 猎豹移动2025年Q2财报:营收2.952亿,接近盈亏平衡
  • Spring框架1—Spring的IOC核心技术1
  • LeetCode 2327.知道秘密的人数:动态规划/差分数组O(n)
  • 8年老测试分析,自动化测试的挑战与实施,一篇打通...
  • VBA即用型代码手册:另存为html文件SaveAs .Html File
  • 数字孪生:数据驱动下的虚实融合与技术落地方法论