当前位置: 首页 > news >正文

深入解析Semantic Kernel中的聊天历史记录对象

文章目录

  • 深入解析Semantic Kernel中的聊天历史记录对象
    • 一、引言
    • 二、聊天历史记录对象
      • 2.1 创建聊天历史记录对象
      • 2.2 消息类型
        • 2.2.1 用户消息(User Message)
        • 2.2.2 助手消息(Assistant Message)
        • 2.2.3 系统消息(System Message)
      • 2.3 为什么减少聊天历史记录?
      • 2.4 减少聊天历史记录的策略
    • 三、 实战
    • 四、常见问题解决方案
    • 五、总结

深入解析Semantic Kernel中的聊天历史记录对象

一、引言

你有没有遇到过刚跟AI说过"我喜欢吃披萨",下一秒问"我喜欢吃什么?",AI开始问口味偏好。这背后其实是AI缺乏【短期记忆】的困扰。今天我们分享的【聊天历史记录】,就是给AI装上【记忆芯片】的关键技术。

聊天历史记录对象是Semantic Kernel中用于维护聊天会话中消息记录的核心组件。它主要用于存储来自不同作者的消息,例如用户、AI助手、工具或系统消息。作为发送和接收消息的主要机制,聊天历史记录对象对于维护对话上下文和连续性至关重要。

在持续的对话过程中,聊天记录能够帮助AI模型更好地理解当前交互的上下文,提供更加相关和个性化的响应。此外,聊天记录还可以用于调试、分析用户行为模式以及改进AI模型性能。

二、聊天历史记录对象

2.1 创建聊天历史记录对象

聊天历史记录对象是后台列表,便于创建和添加消息。可存储于数据库中按不同用户进行历史聊天记录动态获取。

using Microsoft.SemanticKernel.ChatCompletion;// Create a chat history object
ChatHistory chatHistory = [];//添加系统消息
chatHistory.AddSystemMessage("你是一个乐于助人的AI助手。");
chatHistory.AddUserMessage("我喜欢吃披萨、听歌");
chatHistory.AddAssistantMessage("听起来你的兴趣爱好很 Lifestyle 噢!披萨是一种非常受欢迎的食物,无论是经典的意式披萨还是各种美式变种,它们都有着独特的风味。你有没有什么特别喜欢的披萨口味呢?另外,听歌也是一种很好的放松方式,可以提升心情,增加乐趣。你有特别喜欢的歌手或音乐类型吗?如果有,不妨分享一下,我们也可以交流一下。");
chatHistory.AddUserMessage("我喜欢什么?");

2.2 消息类型

2.2.1 用户消息(User Message)

代表用户输入内容,如同聊天软件中你发送的消息:

history.AddAssistantMessage("听起来你的兴趣爱好很 Lifestyle 噢!披萨是一种非常受欢迎的食物,无论是经典的意式披萨还是各种美式变种,它们都有着独特的风味。你有没有什么特别喜欢的披萨口味呢?另外,听歌也是一种很好的放松方式,可以提升心情,增加乐趣。你有特别喜欢的歌手或音乐类型吗?如果有,不妨分享一下,我们也可以交流一下。");
2.2.2 助手消息(Assistant Message)

记录AI的回复:

history.AddUserMessage("我喜欢吃披萨、听歌");
2.2.3 系统消息(System Message)

给AI的"角色设定卡",控制AI的行为模式:

history.AddSystemMessage("你是一个乐于助人的AI助手。");

2.3 为什么减少聊天历史记录?

管理聊天历史记录对于维护上下文感知对话至关重要,同时确保高效性能。 随着对话的进行,历史记录对象可能会超出模型上下文窗口的限制,从而影响响应质量并降低处理速度。 减少聊天历史记录的结构化方法可确保最相关的信息仍然可用,而无需不必要的开销。

  • 性能优化:大型聊天历史记录会增加处理时间。 减小其大小有助于保持快速高效的交互。
  • 上下文窗口管理:语言模型具有固定的上下文长度(如8K、128K)。 当历史记录超过此限制时,旧消息将丢失。 管理聊天历史记录可确保最重要的上下文保持可访问性。
  • 内存效率:在受资源约束的环境(如移动应用程序或嵌入式系统)中,无限制的聊天历史记录可能会导致内存使用率过高和性能降低。
  • 隐私和安全:保留不必要的对话历史记录会增加公开敏感信息的风险。 结构化缩减过程可最大程度地减少数据保留期,同时维护相关上下文。

2.4 减少聊天历史记录的策略

可以使用多种方法来保持聊天历史记录可管理,同时保留基本信息:

  • 截断:当历史记录超过预定义限制时,将删除最早的消息,确保仅保留最近的交互。
  • 摘要:较旧的消息压缩为摘要,同时保留关键详细信息,同时减少存储的消息数。
  • 基于token长度:基于token长度是通过测量token总数并在超出限制时删除或汇总旧消息,确保聊天历史记录保持在模型的token长度限制范围内。

聊天历史记录化简器通过评估历史记录的大小并根据可配置参数(要保留的消息数)和阈值计数(触发减少点)来自动执行这些策略。
通过集成这些减少技术,聊天应用程序可以保持响应性和性能,而不会影响聊天上下文。
在Semantic Kernel中,聊天历史记录化简器抽象由 IChatHistoryReducer 接口定义:

[Experimental("SKEXP0001")]
public interface IChatHistoryReducer
{Task<IEnumerable<ChatMessageContent>?> ReduceAsync(IReadOnlyList<ChatMessageContent> chatHistory, CancellationToken cancellationToken = default);
}

此接口允许自定义实现来减少聊天历史记录。

此外,语义内核还提供内置化简器:

  • ChatHistoryTruncationReducer - 将聊天历史记录截断为指定大小并丢弃已删除的消息。
    当聊天历史记录长度超过限制时,将触发减少。
  • ChatHistorySummarizationReducer -
    截断聊天历史记录,汇总已删除的消息,并将摘要添加回聊天历史记录作为单个消息。

这两个化简器始终保留系统消息,以保留模型的基本上下文。

三、 实战

注:调用方式可参考使用 Semantic Kernel 快速对接国产大模型实战指南(DeepSeek/Qwen/GLM)

var modelConfig = Global.CurModelContext("glm-4-flash");
// 1. 填充OpenAI格式LLM调用参数值
var modelId = modelConfig.Model;
var endpoint = modelConfig.EndpointKey;
var apiKey = modelConfig.ApiKey;// 2. 创建一个OpenAI聊天完成的内核
var builder = Kernel.CreateBuilder().AddOpenAIChatCompletion(modelId,new Uri(endpoint),apiKey);// 4.构建内核
Kernel kernel = builder.Build();//5. 对话功能(流式)
await StartStreamingChatSession(kernel);/// <summary>/// 统一对话管理(流式输出)/// </summary>/// <param name="kernel"></param>/// <returns></returns>private async Task StartStreamingChatSession(Kernel kernel){// 保留系统消息和最新5条对话信息(注:可以通过调整targetCount来设置保留历史记录数量)var reducer = new ChatHistoryTruncationReducer(targetCount: 6); var chatService = kernel.GetRequiredService<IChatCompletionService>();var history = new ChatHistory();history.AddSystemMessage("你是一个乐于助人的AI助手。");while (true){///获取用户输入Console.Write("用户 > ");var input = Console.ReadLine();//将用户输入添加到历史记录history.AddUserMessage(input);// 以下示例演示如何在维护聊天流时仅保留最后两条用户消息。//注:也可使用传统方式,对历史进行截断。如history.RemoveRange(0, history.Count - 5);var reducedMessages = await reducer.ReduceAsync(history);// 保留系统消息和最新的两条用户信息if (reducedMessages is not null){history = new ChatHistory(reducedMessages);}//获取流式响应var response = chatService.GetStreamingChatMessageContentsAsync(chatHistory: history,kernel: kernel);Console.WriteLine($"助手 > ");string resStr = "";//输出流式响应await foreach (var chunk in response){resStr += chunk;//拼接聊天记录Console.Write(chunk);}//将完整的响应添加到历史记录history.AddAssistantMessage(resStr);//输出换行Console.WriteLine();}}

在这里插入图片描述

在这里插入图片描述

四、常见问题解决方案

  • 对话越长响应越慢怎么办?

    • 启用流式输出
    • 减少聊天记录长度
  • 如何保证多用户隔离?

    • 为每个会话创建独立ChatHistory实例
    • 使用DI容器管理对话生命周期
  • 系统消息被覆盖如何处理?

    • 定期检测并补充系统指令
    • 将系统消息单独追加到聊天记录中

五、总结

我们学习了如何在 Semantic Kernel 中创建和管理聊天历史记录对象,以及如何使用聊天记录进行问答。聊天历史记录对象在维护对话上下文和连续性方面发挥着重要作用,是构建高效对话系统的必要工具。让AI不再健忘!

相关文章:

  • Gradio全解20——Streaming:流式传输的多媒体应用(6)——RT-DETR模型构建视频流目标检测系统
  • STM32教程:DMA原理及结构分析(基于STM32F103C8T6最小系统板标准库开发)*详细教程*
  • C++类与对象深度解析:从基础到应用
  • 《Java 高并发程序设计》笔记
  • 【言语理解】片段阅读之标题拟定(5)
  • Deepseek基础-api key申请及应用(java)、硅基流动api key申请及应用(dify)
  • 《Effective java》 第三版 核心笔记
  • 怎么才能找到自己的天赋?
  • 图片批量处理JPGC 深度测评:智能压缩 + 多线程加速
  • RFID(无线射频识别)技术在牧场中的结合智能助手应用
  • 编译原理期末重点-个人总结——1 概论
  • 创建线程的几种方式
  • 第13项三期,入组1123例:默沙东启动TROP2 ADC+PD-1子宫内膜癌头对头临床
  • C++ 重载:解锁符号与函数的 “变形魔法”
  • labelimg快捷键
  • Tensorrt 基础入门
  • C语言之初识指针
  • C++ -- 内存管理
  • 机器学习项目流程极简入门:从数据到部署的完整指南
  • 软考 系统架构设计师系列知识点 —— 黑盒测试与白盒测试(1)
  • 洗衣机无法有效杀菌
  • 上海畅通“外转内”,外贸优品成“香饽饽”
  • 准80后遵义市自然资源局局长陈清松任仁怀市委副书记、代市长
  • 魔都眼|咖啡节上上海小囡忍不住尝了咖啡香,母亲乐了
  • 多地景区发公告称售票达接待峰值,有景区暂停网络和线下售票
  • 增诉滥用职权罪,尹锡悦遭韩国检方追加起诉