当前位置: 首页 > news >正文

大模型开发工具的汇总

以下是一份关于大模型开发工具的汇总,涵盖Gemini CLI、Qwen-Code、Kimi K2等工具的关键信息:

Gemini CLI

Gemini CLI是Google DeepMind推出的命令行工具,用于调用Gemini系列大模型(如Gemini 1.5)。支持本地与API调用,适用于代码生成、文本处理等任务。

  • 功能特性:支持多模态输入(文本/图像)、上下文长度扩展至百万tokens、Python SDK集成。
  • 安装:https://github.com/google-gemini/gemini-cli,需配置API密钥。
  • 示例命令
    npx https://github.com/google-gemini/gemini-cli
    

Qwen-Code

通义千问团队开发的代码专用大模型,支持Python、C++等编程语言的生成与补全,专注于代码场景优化。

  • 功能亮点:GitHub仓库级代码理解、IDE插件(VS Code/JetBrains)、微调工具链。
  • 部署方式
    • Hugging Face模型库直接加载Qwen/CodeQwen-7B
    • 本地运行需16GB以上显存,推荐使用transformers库调用。
  • 安装
    • https://github.com/QwenLM/qwen-code
    • 1.
    • npm install -g @qwen-code/qwen-code
      qwen --version
      qwen

    • 2. 大模型服务平台百炼控制台  获取API-KEY
    • 3. mkdir myprj
    • 4. vi myprj/.env
    • 文件内容
    • export OPENAI_API_KEY="sk-xxxx"  #此处改为从阿里百炼控制台获取的API-KEY
      export OPENAI_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"
      export OPENAI_MODEL="qwen3-coder-480b-a35b-instruct"
      #export OPENAI_MODEL="qwen3-coder-plus"

      参考文档:

    • https://www.kdjingpai.com/qwen-codejiyu-g/
      国内AI大模型编程能力的进步

Kimi K2

月之暗面(Moonshot)推出的Kimi Chat开发者版本,支持长文本(200K上下文)与复杂逻辑推理。

  • 核心能力:文档解析(PDF/Word)、API自动化、中文场景优化。
  • 访问方式
    • 官网申请内测权限,提供Web界面与API。
    • 命令行工具可通过curl调用:
      curl -X POST https://api.moonshot.cn/v1/chat -H "Authorization: Bearer $API_KEY" -d '{"model":"kimi-2", "messages":[{"role":"user", "content":"解释Transformer架构"}]}'
      

其他相关工具

  • LlamaIndex:用于构建大模型数据管道的开源框架,支持RAG(检索增强生成)。
  • vLLM:高通量推理引擎,适配Gemini/Qwen等模型,支持量化部署。

选择建议

  • 轻量级开发:Gemini CLI适合快速原型验证。
  • 代码专项任务:Qwen-Code在代码生成场景表现更优。
  • 长文本处理:Kimi K2的200K上下文窗口适合文档分析。

注:部分工具需申请API权限或特定硬件环境,建议参考官方文档获取最新配置要求。

http://www.dtcms.com/a/299596.html

相关文章:

  • 小架构step系列26:Spring提供的validator
  • 秋招Day19 - 分布式 - 分布式事务
  • Android 修改系统时间源码阅读
  • DeepSeek算法学习笔记
  • RabbitMQ--Springboot解决消息丢失
  • Spring Boot集成RabbitMQ终极指南:从配置到高级消息处理
  • Linux进程控制:掌握系统的核心脉络
  • Git版本控制
  • FC(Function Calling)和MCP详解(区别、作用、运用场景)
  • 2.JVM跨平台原理(字节码机制)
  • 【Bluedroid】btif_av_sink_execute_service之服务器禁用源码流程解析
  • 零基础学后端-PHP语言(第二期-PHP基础语法)(通过php内置服务器运行php文件)
  • 机器语言基本概念
  • android开发中的协程和RxJava对比
  • DOM元素添加技巧全解析
  • LangChain + MCP 构建带可视化图表功能的ChatBI智能体
  • Git 创建一个完全没有提交历史的 master 分支
  • 【服务器与部署 27】Shell脚本自动化部署:Python应用一键部署让运维效率提升10倍
  • 【Android】广播机制
  • 【LeetCode 热题 100】131. 分割回文串——回溯
  • 谷歌无法安装扩展程序解决方法(也许成功)
  • JDBC教程,2025版最新讲解.超详细入门教程
  • 从UX到AX:从“设计路径”到“共创关系”的范式革命——Agentic Experience如何重塑未来产品哲学
  • 关于Feign的应用
  • 大话数据结构之<队列>
  • PHP框架之Laravel框架教程:1. laravel搭建
  • 方案C,version1
  • 零基础学习性能测试第四章:从0到1学会编写性能测试报告
  • 如何开始学习和使用 BPF/eBP
  • 树上倍增和LCA问题