Perplexica - 开源AI搜索引擎,让搜索更智能
🚀 Perplexica - 一款AI驱动的搜索引擎 🔎
概述
Perplexica 是一款开源的 AI 驱动搜索工具,旨在深入互联网寻找答案。它汲取了 Perplexity AI 的灵感,不仅能够在网络上搜索,还能理解用户的提问。该工具采用先进的机器学习算法,如相似性搜索和嵌入技术,以精炼结果,并提供明确的答案及来源。
Perplexica 使用 SearxNG 来保持信息的及时性,它确保在不损害用户隐私的情况下,始终提供最新的信息。
功能特性
Perplexica 具备一系列强大的功能,使其在众多搜索引擎中独树一帜:
- 本地大型语言模型 (LLMs):用户可以使用 Qwen、DeepSeek、Llama 和 Mistral 等本地 LLM。
- 两种主要模式:
- 助手模式:提升搜索体验,通过生成不同的查询找到更相关的网络源。它不仅仅使用 SearxNG 的上下文,而是访问顶部匹配项,直接从页面中寻找用户查询的相关来源。
- 普通模式:处理用户查询并进行网络搜索。
- 聚焦模式:为了更好地回答特定类型的问题,Perplexica 目前支持六种聚焦模式:
- 全部模式:搜索整个网络以寻找最佳结果。
- 写作助手模式:在不需要网络搜索的写作任务中提供帮助。
- 学术搜索模式:寻找文章和论文,适合学术研究。
- YouTube 搜索模式:根据搜索查询查找 YouTube 视频。
- Wolfram Alpha 搜索模式:处理需要计算或数据分析的问题。
- Reddit 搜索模式:在 Reddit 上搜索与查询相关的讨论和观点。
- 当前信息:与许多搜索工具仅依赖爬虫机器人获取信息不同,Perplexica 使用 SearxNG 作为元搜索引擎,确保用户获得最新信息而无需每天更新数据。
- API 接口:开发者可以将 Perplexica 集成到现有应用程序中,充分利用其强大的搜索功能。
Perplexica 还支持图像和视频搜索,未来还将推出更多功能。关于更多计划功能的信息,可参见即将推出的功能部分。
安装步骤
Docker 安装(推荐)
-
确保系统上已安装并运行 Docker。
-
克隆 Perplexica 仓库:
git clone https://github.com/ItzCrazyKns/Perplexica.git
-
在包含项目文件的目录中,重命名
sample.config.toml
文件为config.toml
。如果使用 Docker,只需填写以下字段:OPENAI
: 你的 OpenAI API 密钥(如希望使用 OpenAI 的模型)。OLLAMA
: Ollama API 的 URL,格式为http://host.docker.internal:PORT_NUMBER
。- 注意:其他 API,如 GROQ、Anthropic 可根据需要填写。
-
进入包含
docker-compose.yaml
文件的目录,然后执行:docker compose up -d
-
等待几分钟,初始化完成后,可以通过 http://localhost:3000 访问 Perplexica。
非 Docker 安装
- 安装 SearXNG,并在其设置中允许
JSON
格式。 - 克隆仓库,重命名
sample.config.toml
为config.toml
,并确保完成所有必需字段。 - 执行
npm i
安装依赖项,然后运行npm run build
。 - 最后,通过执行
npm run start
启动应用。
注意:建议使用 Docker 安装以简化设置过程。
使用 Perplexica 作为搜索引擎
要将 Perplexica 作为 Google 或 Bing 等传统搜索引擎的替代方案,或希望通过浏览器搜索栏快速访问,请按照以下步骤操作:
- 打开浏览器设置。
- 找到 ‘搜索引擎’ 部分。
- 添加新网站搜索,URL 为
http://localhost:3000/?q=%s
。如在本地未托管,请替换为你的 IP 地址或域名。 - 点击添加按钮。现在,你可以直接通过浏览器搜索栏使用 Perplexica。
使用 Perplexica 的 API
Perplexica 提供 API,开发者可以将其强大的搜索引擎集成到自己的应用中。有关更多信息,请查看完整文档。API 文档。
即将推出的功能
- 增加设置页面
- 添加对本地 LLM 的支持
- 历史保存功能
- 引入各种聚焦模式
- 添加 API 支持
- 添加发现功能
- 最终确定助手模式
Perplexica 是一款不断发展的工具,具有强大的功能和丰富的使用场景,可以帮助用户高效地获取信息。对于开发者和普通用户来说,Perplexica 都是一个不可多得的资源。
同类项目的功能和特点
- Algolia: 专注于提供快速精准的搜索体验,支持多种类型的数据源,自定义搜索接口。
- Elasticsearch: 提供强大的实时数据搜索和分析功能,适合用于大规模数据集的搜索需求。
- Solr: 另一个成熟的开源搜索平台,具有高可扩展性和灵活性,支持多语言和复杂搜索需求。
以上项目各有其特色,适用于不同需求的用户。在选择合适的搜索引擎时,建议结合自身具体业务需求与使用场景。