当前位置: 首页 > news >正文

基于-轻量级文档搜索系统的测试报告

文章目录

    • 一、项目背景
    • 二、项目功能
    • 三、测试计划
      • (一)测试用例设计
      • (二)测试用例实现
        • 1.功能测试
        • 2.界面测试
        • 3.兼容性测试
        • 4.易用性测试
        • 5.安全性测试

一、项目背景

1.基于轻量级文档检索系统采用C++技术栈来实现,同时使用了本地文件系统来存储相关的索引数据,同时将其部署到云服务器上。前端主要有一个页面构成:搜索页,该页面包含搜索框、结果列表与摘要展示区,以上模拟实现了一个最简单的垂直搜索引擎系统。其结合后端实现了以下的主要功能:对技术官网文档的全文爬取与解析、正排与倒排索引的构建、关键词的分词与检索、搜索结果的相关性排序(基于权重公式标题词频*10 + 正文词频)以及提供HTTP搜索接口等功能。

2.但是该项目没有设计图形化的索引构建与监控功能,只能通过命令行指令启动索引构建过程;并且搜索结果的相关性衡量策略较为简单,仅依赖于词频统计,并未引入更复杂的算法(如TF-IDF或BM25);而索引数据存储在内存中,并未实现持久化,服务重启后需要重新构建索引。

3.该轻量级文档检索系统可以实现对官方技术文档的快速站内检索,用户输入关键词后,相关的文档标题、内容摘要以及官方链接都可以被详细地查看并点击访问。


二、项目功能

该轻量级搜索引擎主要实现了以下几个功能:索引构建、关键字搜索、搜索结果高亮与摘要生成以及Web服务等功能。

索引构建功能:原始技术官网的HTML文档已经提前下载并存储在指定目录,没有实现实时爬虫抓取功能,即:数据源是静态的、预先准备好的。项目启动时首先会运行索引构建模块,对HTML文件进行去标签、解析、分词,并建立正排索引和倒排索引。构建成功后,搜索引擎即可对外提供检索服务。

搜索页面:用户可以在前端搜索页的输入框中输入任意关键字,其界面包含搜索框、搜索结果统计和结果列表。在结果列表中可以看到匹配文档的标题、内容摘要以及对应的官方URL链接。点击标题或URL即可跳转到Boost官网对应的文档页面。

搜索结果:在搜索页面输入关键字并点击“搜索”按钮后,页面会异步向后端发送请求,并动态加载返回的搜索结果。此时就可以看到所有匹配文档的概要信息,并按相关性(权重)从高到低排序。每个结果项都清晰展示了文档的标题、包含关键字的摘要片段和可直接访问的链接。

搜索流程:在搜索框输入关键字后,后端服务会执行一套完整的检索流程:首先对查询词进行分词,然后在倒排索引中查找每个分词对应的文档ID列表,接着进行权重计算与合并,最后根据合并后的权重对文档进行排序,并将排名前N的结果包装成JSON格式返回给前端渲染。

三、测试计划

(一)测试用例设计

在这里插入图片描述

(二)测试用例实现

1.功能测试
1)特殊字符处理1.1输入无效字符是否提示(✔)![请添加图片描述](https://i-blog.csdnimg.cn/direct/c5c37de1e4824d4c9442704b1b75c8a4.png)

请添加图片描述

1.2输入有效字符是否正确(✔)
请添加图片描述
2)基本搜索功能
2.1加入特殊字符后(✔)
在这里插入图片描述
2.2加入空格后(✔)
请添加图片描述
3)历史记录
3.1历史记录是否有效(✔)
请添加图片描述
3.2历史记录是否可以清除(✔)
请添加图片描述

2.界面测试

1.1原版搜索框界面
在这里插入图片描述
1.2优化后搜索框界面(✔)
请添加图片描述
1.3原版搜索结果界面
请添加图片描述

1.4优化后搜索结果界面(✔)请添加图片描述

3.兼容性测试

1)Edge浏览器(✔)
在这里插入图片描述
2)google浏览器(✔)
在这里插入图片描述

4.易用性测试

1.1搜索结果清晰
在这里插入图片描述
1.2操作性
输入需要查询的英文内容,点击相应标题,直接跳转到boost官方相关文档处,简单高效。

5.安全性测试

过滤敏感词
在这里插入图片描述


文章转载自:

http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://00000000.nwcLg.cn
http://www.dtcms.com/a/364784.html

相关文章:

  • 工业4.0时代的通信革命:OPC UA Pub/Sub机制全面解析
  • 车载诊断架构 --- 从架构系统角度怎么确保整车DTC的完整性?
  • 关于缓存的一些思考?
  • SPI通讯协议
  • 【AI】人工智能 传统和现代 架构和算法的演变历史
  • 控制View缩放与还原
  • Go 语言面试题详解之上下文 (Context) 解密
  • 开学季 老师必备的收集信息“神器”
  • 利用 Python 绘制环形热力图
  • 使用飞算JavaAI快速搭建酒店管理系统
  • Augmentcode免费额度AI开发WordPress商城实战
  • VBA 64位API声明语句第013讲
  • leetcode算法刷题的第二十五天
  • LiteFlow:国产流程编排引擎体验
  • 疯狂星期四文案网第59天运营日记
  • 机器学习从入门到精通 - 降维艺术:PCA与t-SNE带你玩转高维数据可视化
  • 【Unity开发】热更新学习——AssetBundle
  • 【wpf】WPF 自定义控件绑定数据对象的最佳实践
  • 戴尔笔记本电池健康度检测、无电池开机测试与更换电池全流程记录
  • 52DH Pro网址导航系统开源版
  • 因地制宜选购壁挂炉,家庭采暖更舒适
  • 【保姆级选型指南】2025年国产开源AI算力平台怎么选?覆盖企业级_制造业_国际化场景
  • C++ ---- 模板的半特化与函数模板的偏特化
  • [鸿蒙心迹]鸿蒙培训讲师带新人学鸿蒙的悲欢离合
  • Deformable 3D Gaussians:把动态场景装进“可变形的静态世界”
  • React Hooks小技巧-防止async函数抖动触发
  • AI 时代零售数据底座怎么建?首份《零售一体化云数据库白皮书》发布
  • 初识基于鸿蒙开发(HarmonyOS)
  • 涨了一倍多的顺丰同城,还能继续做大即时零售基建的蛋糕吗?
  • 使用PyTorch构建全连接神经网络实现MNIST手写数字分类