当前位置: 首页 > news >正文

京东开源了一款大模型安全框架:JoySafety,说是京东内部已应用,实现95%+攻击拦截率

京东开源的大模型安全框架:JoySafety —— 实现95%+攻击拦截率,保障大模型安全

📋 目录

  • 项目简介
  • ✨ 特性
  • 🚀 快速开始
  • 📖 使用指南
  • 🏆 最佳实践
  • 🏗️ 架构设计
  • 🛠️ 开发
  • 📄 许可证
  • 📅 计划
  • Star History

项目简介

随着生成式人工智能的应用逐渐深入,如何保障大模型的安全性成为了企业必须面对的重要挑战。内容安全、数据泄露、提示词攻击等问题不容忽视。为了解决这一系列问题,京东正式开源了其大模型安全框架——JoySafety

JoySafety已经在京东多个业务场景中成功应用,包括AI导购、物流客服、销售助手、医疗问诊、商家工作台、法务咨询和安全问答等。该框架可以智能识别、检测多轮对话中的安全风险,支持日均亿级调用,且拥有95%+的攻击拦截率。

JoySafety通过多维响应策略来确保大模型输出内容符合安全规范。它能够即时阻断高风险内容、使用预设的合规知识库进行红线代答、智能纠偏并引导正向回答。该框架支持多种原子能力模块,包括BERT、FastText、Transformer等主流模型,且具有极高的扩展性和易用性。

GitHub 地址


特性

🚀 生产级别

企业级实战验证

  • ✅ 保障京东多个生产级AI应用的安全稳定运行
  • ✅ 在复杂业务场景中得到验证,持续迭代优化
  • ✅ 支持横向扩展,满足高并发业务需求
  • ✅ 策略变更支持分钟级热更新

高可靠性保障

  • 🔄 原子能力热插拔,业务不中断
  • ⚡ 配置动态生效,快速响应业务变化
  • 📊 生产环境长期稳定性验证

📈 高扩展性

灵活的架构设计

  • 🧩 支持多种原子能力模块(BERT、FastText、Transformer等主流模型)
  • 🔌 标准化原子能力接口,便于扩展新模型
  • 🏗️ 支持独立部署或集中部署两种模式
  • ⚙️ 轻量编排引擎,按需灵活配置

智能负载均衡

  • 🌐 集群化部署支持水平扩展
  • ⚡ 异步检测机制,提升并发处理能力
  • 🎯 窗口化检测策略,平衡性能与准确性

💡 易用性

开箱即用

  • 🐳 一键Docker Compose启动,零配置门槛
  • 📱 DAG编排,配置更灵活
  • 🔧 标准化API接口,快速集成现有系统

🎯 核心技术亮点

1. 大模型多轮会话智能识别

可以智能识别多轮对话中的安全风险,确保对话中的内容合规且无害。

2. 采用Free-Taxi异步输出模式

通过Free-Taxi异步输出模式,大幅提升检测响应速度,实现用户体验与安全性的完美平衡。

3. 多维响应策略矩阵
  • 🎯 精准拦截:高风险内容即时阻断
  • ⏸️ 红线代答:使用红线知识库应答
  • 🔄 智能纠偏:自动引导正向回答

🚀 快速开始

环境依赖

请确保已安装以下软件:

  • git
  • git-lfs (用于下载模型文件)
  • docker
  • docker compose

0. 克隆项目

  #1. 克隆项目git clone https://github.com/MaoTouHU/JoySafety.git#2. 进入项目路径cd JoySafety#3. 设置环境变量export SAFETY_ROOT_PATH=`pwd`# 正常为 JoySafety 根路径echo ${SAFETY_ROOT_PATH}

1. 下载模型文件(Huggingface)

  • 模型说明
  • 推荐使用 git-lfs 拉取大模型文件
  # 进入项目路径cd $SAFETY_ROOT_PATHgit lfs install# 方案1git clone https://huggingface.co/jdopensource/JoySafety ${SAFETY_ROOT_PATH}/data/models# 方案2# 可从[ModelScope](https://modelscope.cn/models/syf20240814/joysafety/files)下载

2. 配置 .env 文件

  • 在项目根路径复制 .env.example 或手动创建 .env
   cd $SAFETY_ROOT_PATHcp -f .env.example .env# 修改.env文件中变量: SAFETY_MODEL_DIR,路径需与模型实际下载路径一致SAFETY_MODEL_DIR=

3. 一键启动(Docker Compose)

   docker-compose --env-file .env up

4. API 测试

详细的 API 测试案例及使用说明请参考 quickstart/README.md。获取最新的 API 测试脚本和案例说明。


📖 使用指南

如何接入一个业务

  1. 注册原子能力(如果需要用的原子能力未注册过),参考原子能力管理参考: function_api.md
  2. 增加一个业务,参考 business_api.md
  3. 为业务增加策略,参考:dag_api.md 和 策略样例

如何配置策略(DAG)

识别策略整体是DAG,从rootId对应的node开始,逐层执行识别策略。每个node分为两部分:function和router。function是当前结点执行的具体能力,router则基于当前结点的识别结果决定执行的下一个结点。

常用的router包括stupid_end和groovy,前者表示直接结束,后者则是通过groovy脚本根据识别结果返回下一步的node_id。

如何管理敏感词

支持按分组+业务来管理敏感词,all业务下的敏感词对所有业务生效。可以参考:sensitive_words_api.md。


🏆 最佳实践

最佳实践请参考 best_practice.md。


🏗️ 架构设计

项目目录结构

.
├── README.md
├── deploy
│   ├── docker-compose.yml    // 打包启动服务(各个模块也可以单独启动)
│   └── thirdparty            // 第三方依赖相关配置及文档
│       ├── mysql
│       ├── redis
│       └── vearch
├── safety
│   ├── safety-admin           // 配置和数据管理后台服务
│   ├── safety-api             // 对外提供能力的api服务
│   ├── safety-basic           // 核心服务,支撑所有主要功能
│   ├── safety-demo            // 使用safety-api的多语言示例
│   └── safety-skills          // 各项能力的实现及部署
└── quickstart                 // 用于用户快速体验的脚本和样例

技术架构说明

1. 配置时期流程图
初始化/注册
注册原子能力
注册原子能力
注册原子能力
注册原子能力
敏感词管理
知识库管理
配置写入
策略编排
业务场景配置
模型/配置
模型/配置
敏感词数据
知识/配置
向量检索
quickstart/脚本
safety-admin
后台管理
safety-bert
独立服务
safety-fasttext
独立服务
safety-keywords
独立服务
safety-knowledge
独立服务
MySQL/Redis
Vearch 向量库
防御策略编排
业务场景配置
2. 执行时期流程图
HTTP/SDK
依赖
读策略/配置
HTTP/RESTful
HTTP/RESTful
HTTP/RESTful
HTTP/RESTful
模型/数据
模型/数据
敏感词数据
知识/配置
向量检索
用户/业务系统
safety-api
API服务
safety-basic
Java lib
safety-bert
独立服务
safety-fasttext
独立服务
safety-keywords
独立服务
safety-knowledge
独立服务
MySQL/Redis
Vearch 向量库

📅 计划

JoySafety 致力于构建完整的大模型安全解决方案,后续将推出:

  • 安全审核大模型:开源部分安全审核大模型并集成实现风险合规审计能力
  • 大模型安全评测:针对大模型上线前的安全风险检测
  • Agent安全防护:包括身份、权限、数据、防护工具、执行安全等能力

Star History

Star History of JoySafety on GitHub


作者✍️名片
CSDN猫头虎万粉变现计划和账号流量诊断服务名片

http://www.dtcms.com/a/473536.html

相关文章:

  • 【传奇开心果系列】基于Flet框架实现的关于页面创建和提供文件下载集成了网络请求、文件下载、剪贴板操作功能自定义模板特色和实现原理深度解析
  • ​为什么我们需要将Flow转换为StateFlow?​​
  • vscode远程连接云服务器的初次尝试
  • 甘肃网站开发公司用手机怎么做免费网站
  • 网站是由多个网页组成的吗济南网约车平台
  • Linux系统下的终端,会话,shell,bash,进程组这几个概念的关系。
  • 微信小程序入门学习教程,从入门到精通,自定义组件与第三方 UI 组件库(以 Vant Weapp 为例) (16)
  • 银河麒麟V10高级服务器版Bash快捷键经常失效
  • 建设网站平台需要什么硬件配置电脑上买wordpress
  • Jessibuca 播放器
  • minio之docker的单机版安装
  • 主流 AI IDE 之一的 Qoder 和 Lingma IDE 介绍
  • 搜索不到网站的关键词国家企业信用公示系统官网查询
  • PostgreSQL在Linux中的部署和安装教程
  • AI大事记12:Transformer 架构——重塑 NLP 的革命性技术(上)
  • PostgreSQL JDBC 连接参数大全
  • 【SpringBoot从初学者到专家的成长11】Spring Boot中的application.properties与application.yml详解
  • 简述你对于网站建设的认识h5微网站开发
  • OpenHarmony IMF输入法框架全解析:从原理到自定义输入法开发实战指南
  • LabVIEW的PID控制器带报警仿真系统
  • WordPress--代码块添加折叠和展开功能
  • 爱站网能不能挖掘关键词做网站Linux
  • 在单台电脑上管理多个 GitHub 账户并解决推送问题
  • 计算机毕设选题推荐:基于Hadoop和Python的游戏销售大数据可视化分析系统
  • kanass入门到实战(17) - 如何进行工时管理,有效度量项目资源
  • 汽车角雷达波形设计与速度模糊解决方法研究——论文阅读
  • Node.js+Prisma性能优化:分页查询与事务处理实战
  • 网站建站授权模板下载wordpress爬虫ca
  • 做的网站怎么联网长春制作网站软件
  • FPGA 中的 AXI 总线介绍