当前位置: 首页 > news >正文

大语言模型微调的公开JSON数据

大语言模型微调的公开JSON数据

在这里插入图片描述

以下是一些可用于大语言模型微调的公开JSON数据及地址:

  • EmoLLM数据集
    • 介绍:EmoLLM是一系列能够支持理解用户、帮助用户心理健康辅导链路的心理健康大模型,其开源了数据集、微调方法、训练方法及脚本等。数据集按用处分为general和role-play两种类型,按格式分为qa和conversation两种类型。
    • 地址:https://github.com/SmartFlowAI/EmoLLM/tree/main/datasets
  • kigner/ruozhiba-llama3数据集
    • 介绍:又称弱智吧数据集,大小为601k,包含1500条指令与答复。
    • 地址:https://huggingface.co/datasets/kigner/ruozhiba-llama3
http://www.dtcms.com/a/31701.html

相关文章:

  • 业务流程相关的权威认证和培训有哪些
  • DeepSeek新作-Native Sparse Attention
  • 蓝桥杯之枚举
  • HTML Application(hta)入门教程
  • vue3页面显示tiff图片
  • 解析HTML时需要注意什么?
  • 微软发布Majorana 1芯片,开启量子计算新路径
  • 手动搭建Redis1主2从+ 3 Sentinel 高可用集群
  • 《DAMA 数据治理知识指南》第八章 数据集成和互操作读书笔记
  • 深度学习之图像分类(二)
  • DIP的实际举例
  • 一文讲解Redis中的集群数据分区相关问题
  • PiscTrace的开发者版
  • MySQL之表连接深度解析:原理、类型、算法与优化
  • [数据结构]双链表详解
  • 非容器化部署nginx
  • Kubernetes控制平面组件:APIServer 基于 Webhook Toeken令牌 的认证机制详解
  • Spring MVC 框架学习笔记:从入门到精通的实战指南
  • CAN 分析框架 CANToolz
  • ZLMediakit开源视频服务器——配置到本地服务器
  • Java IO 和 NIO 的基本概念和 API
  • 【Linux】UDP协议
  • 进程及相关概念
  • 【Linux网络编程】socket套接字的基础API接口
  • 《深度剖析:人工智能与元宇宙构建的底层技术框架》
  • C++——list模拟实现
  • 【Linux】命名管道------Linux进程间通信的桥梁
  • Dockerfile中volume功能作用
  • Cursor提示词模板,开发GD32,C语言开发GD32 ARM单片机编程规范提示词 大厂风格代码规范
  • Python常见面试题的详解17