当前位置: 首页 > news >正文

Datawhale AI数据分析 笔记

Part1:数据分析入门--信息统计

知识点:什么是提示词(Prompt)?

在人工智能(AI)领域,"提示词"是一个关键概念,它指的是输入给AI模型的文本或指令,用于引导模型生成特定的输出。

按照如下两个要素进行组合的:

指标(讲清楚表格构成和一些重要指标的含义)

要求(做什么样的分析、画什么样的图)

提示词进化路线:

表格中有3张表格sheet,1.sheet是1群的统计数据,2.sheet是2群的统计数据,number.sheet是1.sheet和2.sheet数字列对应的兴趣点,其中兴趣点对应兴趣数字列

现在需要统计1群和2群所有兴趣点的统计结果,加上统计百分比的数据,并对统计百分比列按照倒序进行排列

修改为表格格式

请先统计出1群的结果,再统计出2群的结果,加上统计百分比的数据,并对统计百分比列按照倒序进行排列,行末尾加上总计,返回表格格式,注意两个表格不要放在同一个表格中

将编号修改为整数 

百分比数值请以整数的形式输出

导出结果为表格

请帮我把这两个统计结果表格导出来,谢谢 

Part2:了解数据概况--描述性分析

知识点:什么是描述性分析?

描述性统计就像是给数据做一次“快照”。

它用一些简单的数字和图表来告诉我们数据集中的信息,比如数据的平均值、最大值、最小值,或者数据分布的形状等。这些数字和图表可以帮助我们快速了解数据的基本情况。

参考prompt

这里统计的是大学生对感兴趣活动主题的调查结果,其中:

number.sheet是活动主题编号和主题详情, 编号对应的1.sheet和2.sheet的数字列, 1.sheet是1班的数据,2.sheet是2班的数据。

请根据这份表格,完成描述性分析

  • 有多少同学参与了问卷
  • 不同选项数对应的同学人数和人数比例分别是多少
  • 超过3个选项的回答是不合规的回答,不合规回答的同学人数和比例分别是多少 ...

小知识:描述性分析一般包括如下内容

  1. 集中趋势度量 :

    • 平均数(Mean):所有数据值的总和除以数据的数量。
    • 中位数(Median):将数据从小到大排列后位于中间位置的值。
    • 众数(Mode):数据中出现次数最多的值。
  2. 离散程度度量 :

    • 极差(Range):数据中最大值和最小值的差。
    • 方差(Variance):衡量数据值与平均数之间差异的平方的平均值。
    • 标准差(Standard Deviation):方差的平方根,也是衡量数据分散程度的指标。
  3. 分布形状 :

    • 偏度(Skewness):衡量数据分布的不对称性,正偏度表示数据右尾长,负偏度表示数据左尾长。
    • 峰度(Kurtosis):衡量数据分布的尖峭程度,高峰度表示数据分布比正态分布更尖锐。
  4. 频率分布 :

    • 统计数据中各个不同值出现的次数或频率。

学习的过程中可以使用一些比较实际的数据进行尝试哈,推荐大家可以拿以往高教杯数学建模的赛题进行尝试,赛题网址在(https://dxs.moe.gov.cn/zx/a/hd_sxjm_sthb/230523/1840580.shtml),有数据分析相关的题以及相关的大量数据。

http://www.dtcms.com/a/280110.html

相关文章:

  • 2025开放原子开源生态大会 | openKylin的技术跃迁和全球协作
  • 回顾一下Docker的基本操作
  • Linux部署Python服务
  • 面向医疗AI场景的H20显卡算力组网方案
  • 2025开放原子开源生态大会 | 开源欧拉的AI原生实践与全球协作
  • 应用部署作业-02-流程
  • 第十四章 Stream API
  • 深度强化学习 | 图文详细推导深度确定性策略梯度DDPG算法
  • 波动回升正当时!期权合成多头:震荡市攻守兼备利器
  • 深入解析环境变量:从基础概念到系统级应用
  • 用uniapp开发鸿蒙应用(暂停更新-根据项目更新,现在项目未开始)
  • QT简介和QT环境搭建
  • JVM——JVM 的内存区域是如何划分的?
  • Go从入门到精通(24) - 一个简单web项目-添加redis缓存
  • 教育培训机构如何为课程视频添加防盗录的强水印?
  • IPM31主板E3300usb键盘鼠标安装成功Sata接口硬盘IDE模式server2003-nt-5.2.3790
  • AI生成代码示例
  • 【自学linux】计算机体系结构和操作系统第二章
  • LangChain面试内容整理-知识点18:Chroma 向量数据库集成
  • 3.1k star!推荐一款开源基于AI实现的浏览器自动化插件工具 !
  • 蓝牙信号强度(RSSI)与链路质量(LQI)的测量与应用:面试高频考点与真题解析
  • GitCode疑难问题诊疗技术文章大纲
  • 3种添加视频水印的加密方式,守护视频安全!
  • 音视频学习(三十九):IDR帧和I帧
  • LeetCode|Day13|88. 合并两个有序数组|Python刷题笔记
  • GaussDB 数据库架构师修炼(四) 备份容量估算
  • SQLite技术架构解析,适用场景有哪些?
  • 邮件伪造漏洞
  • 基于 AI 的大前端安全态势感知与应急响应体系建设
  • 【SVN】设置忽略规则