当前位置: 首页 > news >正文

【创新实训个人博客】数据库搭建

 1.原因

为了降低模型使用以前训练的数据或者幻觉知识,我们在对话时需要提供相关内容的数据,同时由于需要最新的广告实时数据,实时爬取和版权问题。数据由团队在网上爬取,为了广告内容的有效性,如果长期使用,数据库需要定期几个月更新一次。

2.数据库选择

我决定搭建本地轻量级数据库sqlite提供查询,数据采用最简单的方式,

3.数据表设计

一条数据包含的内容每个都不同

例如一条数据是

{"序号": 1, "公司名称": "四川腾晟乾建筑工程有限公司", "投放平台": " 巨量广告/千川 13859 (100.00%)", "投放广告创意数": "13,859", "投放天数": 14, "最后投放时间": "2025-04-14"}

而另一类数据则不同

{"序号": 89, "开发商名称": "海南捞月狗网络科技有限公司", "旗下主推产品": " 捞月狗 747 (99.20%), 偷星猫 6 (0.80%)", "投放广告创意数": "753", "投放天数": 14, "最后投放时间": "2025-04-14"}

我们不要求更加精细的查询,这对业务毫无意义。

因此按照默认生成的row_id作为主键,file_id是每个不同的类别,可以做查询和区分,第三列data是agent需要的数据

4.最终数据库截图

http://www.dtcms.com/a/159463.html

相关文章:

  • AOSP Android14 Launcher3——Launcher的状态介绍LauncherState类
  • 重合闸的作用与技术解析
  • Server-Side Request Forgery服务器端请求伪造(ssrf)
  • PDFMathTranslate:让数学公式在PDF翻译中不再痛苦
  • PDF嵌入图片
  • 新闻数据接口开发指南:从多源聚合到NLP摘要生成
  • Linux的例行性工作(crontab)
  • 自动驾驶(ADAS)领域常用数据集介绍
  • Windows 安装 Yarn 的教程
  • 4.2.2 MySQL索引原理以及SQL优化
  • LangChain构建大模型应用之RAG
  • java-mybatis01
  • 大模型时代的具身智能:从虚拟到现实的智能体进化革命
  • 用Python做有趣的AI项目 2:用 Python 和 NLTK 构建一个聊天机器人
  • 深度解析如何将图像帧和音频片段特征高效存储到向量数据库 Milvus
  • 深入浅出JVM - Java架构师面试实战
  • 有源晶振输出匹配电阻选择与作用详解
  • Spring security详细上手教学(三)密码管理
  • 如何把握邮件发送的黄金时间?
  • 北京工业大学25计专上岸经验分享
  • Qt 中 QSQLITE 和 QODBC 数据库连接的区别
  • Java 构造器
  • 基于Pytest接口自动化的requests模块项目实战以及接口关联方法详解
  • 稳扎稳打,25西电生命科学技术学院(考研录取情况)
  • Git命令(Gitee)
  • 10 DPSK原始对话记录
  • spring项目rabbitmq es项目启动命令
  • Node.js 应用部署:镜像体积优化与安全的多阶段构建探索
  • 神经编译革命:如何用脑机接口直接编程量子计算机?
  • Java求职者面试:从Spring Boot到微服务的技术深度探索