当前位置: 首页 > news >正文

利用Pandas AI完成Excel大模型的结合实现自然语言问数

需求说明

实现对Excel工具的自然语言问数,即可以通过界面上传Excel文件,然后在文本框里通过语言对话的形式问出要统计的内容。比如:

用户数有多少?

语文成绩低于90的用户有多少?

.....

实现思路

Pandas AI是基于Pandas库构建的,它扩展了Pandas的功能,使其能够支持生成式AI的任务。Pandas本身是一个用于数据处理和分析的Python库,其强大的数据处理能力也是Pandas AI的基础。这里借助于Pandas AI框架集成Pandas和大模型的能力达到这个目的,详见如下代码。

代码过程

import gradio as gr
import pandas as pd
from pandasai import SmartDataframe
from pandasai.llm.local_llm import LocalLLMollama_llm = LocalLLM(api_base="http://127.0.0.1:11434/v1", model="qwen2.5:72b")def analyze_excel(file_path, user_query):"""使用PandasAI分析Excel文件并回答用户查询"""try:# 读取Excel文件df = pd.read_excel(file_path)# 创建SmartDataframe##smart_df = SmartDataframe(df, config={"llm": llm})smart_df = SmartDataframe(df, config={"llm": ollama_llm})# 执行查询response = smart_df.chat(user_query)# 返回响应和原始数据的前5行return response, df.head()except Exception as e:return f"发生错误: {str(e)}", None# 创建Gradio界面
with gr.Blocks(title="Excel 数据分析助手") as demo:gr.Markdown("Excel 数据分析助手")gr.Markdown("上传Excel文件,然后用自然语言提问,AI会帮你分析数据!")with gr.Row():file_input = gr.File(label="上传Excel文件", file_types=[".xlsx", ".xls"])query_input = gr.Textbox(label="输入你的问题", placeholder="例如:哪个月的销售额最高?")submit_btn = gr.Button("分析")with gr.Row():output_text = gr.Textbox(label="分析结果", interactive=False)output_data = gr.Dataframe(label="数据预览")# 示例问题examples = [#["示例数据.xlsx", "哪个月的销售额最高?"],#["示例数据.xlsx", "按产品类别分组并计算平均价格"],#["示例数据.xlsx", "绘制销售额随时间变化的趋势图"]]# 设置交互submit_btn.click(fn=analyze_excel,inputs=[file_input, query_input],outputs=[output_text, output_data])gr.Examples(examples=examples,inputs=[file_input, query_input],outputs=[output_text, output_data],fn=analyze_excel,cache_examples=True)# 启动应用
if __name__ == "__main__":demo.launch(server_name="0.0.0.0", server_port=7860)

http://www.dtcms.com/a/238662.html

相关文章:

  • AtCoder Beginner Contest 409
  • OD 算法题 B卷【正整数到Excel编号之间的转换】
  • BERT
  • 自然语言处理——文本表示
  • NLP学习路线图(三十四): 命名实体识别(NER)
  • Mac M芯片 RAG 极简流程 安装 ragflow + LM studio
  • 嵌入式面试提纲
  • 网约车平台(预约打车)
  • 【Elasticsearch】映射:详解 _source store 字段
  • 【医疗电子技术】新型医疗电子和医学人工智能发展现状和趋势
  • 大数据赋能行业智能化升级:从数据价值到战略落地的全景透视
  • 听写流程自动化实践,轻量级教育辅助
  • AI书签管理工具开发全记录(十六):Sun-Panel接口分析
  • WEB3技术重要吗,还是可有可无?
  • xtp+ctp 交易系统接口简介
  • 会计-合并-5- 处置交易在合报与个报会计处理
  • C-Equilateral Triangle
  • ffmpeg(五):裁剪与合并命令
  • NY158NY159美光固态闪存NY160NY161
  • 【推荐算法】Deep Crossing:端到端深度推荐系统的奠基者
  • PLC入门【1】PLC的简单介绍(教学软件:FX-TRN-BEG-C)
  • 2025年6月8日树型动态规划
  • 第一讲 常见的指令, 外壳与权限
  • 北京工作周期7,8,9,10
  • [2025CVPR]确定性图像转换新突破:双逼近器布朗桥模型(Dual-approx Bridge)技术详解
  • 条件语句易错点
  • 【阿里巴巴 x 浙江大学】信息与交互设计 - 信息设计漫谈
  • STM32入门学习之系统时钟配置
  • 【论文阅读】YOLOv8在单目下视多车目标检测中的应用
  • 第12篇:数据库中间件日志设计与追踪系统落地实践