当前位置: 首页 > news >正文

python数据挖掘编程题

1.编写一个Python程序,读取一个文本文件(假设文件名为test.txt, 内容为一些英文句子、每个句子占一行),将每个单词首字母大写,统计文件中单词的总数,并将结果写入另一个文件result.txt中.

# 同时打开test.txt用于读取,result.txt用于写入,均使用utf-8编码
with open("test.txt", "r", encoding="utf-8") as fin, open("result.txt", "w", encoding="utf-8") as fout:total = 0  # 初始化单词总数for line in fin:  # 遍历输入文件的每一行words = line.strip().split()  # 去除行首尾空白并按空格分割为单词列表total += len(words)  # 累加本行单词数到总数# 将每个单词首字母大写后写入输出文件,并以空格分隔,最后换行fout.write(" ".join(w.capitalize() for w in words) + "\n")# 在输出文件末尾写入单词总数fout.write(f"\nTotal words: {total}\n")

编程题2

2.1根据”超市营业额2.xlsx”,查看单日交易总额最小的3天的交易数据,并查看这3天是周几。

import pandas as pd
df = pd.read_excel('./data/超市营业额2.xlsx')
df = df[['日期', '交易额']].groupby(['日期'], as_index=False).sum()
df = df.nsmallest(3, '交易额')
df['weekday'] = pd.to_datetime(df['日期']).dt.day_name()
print(df)
           日期  交易额   weekday
24  2023-03-25  8498.0  Saturday
20  2023-03-21  8661.0   Tuesday
9   2023-03-10  8789.0    Friday

2.2根据“超市营业额2.xlsx”文件,绘制饼状图展示该月各个柜台营业额在交易总额中的占比

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm#设置国形中使用中文学体
plt.rcParams['font.sans-serif'] = ['SimHei']df = pd.read_excel('./data/超市营业额2.xlsx', sheet_name='Sheet1', usecols=['柜台', '交易额'])
df = df.groupby(by='柜台', as_index=False).sum()
df.plot(x='柜台', y='交易额', kind='pie', labels=df['柜台'].values)
plt.legend()
plt.show()

在这里插入图片描述


文章转载自:

http://RAqV1Teb.mtgkq.cn
http://tEI0aKAl.mtgkq.cn
http://E6CRwAvs.mtgkq.cn
http://PcSaarLG.mtgkq.cn
http://hqRNlmus.mtgkq.cn
http://JMtRWa2X.mtgkq.cn
http://31xoUUZm.mtgkq.cn
http://zwA3xZHG.mtgkq.cn
http://xc662loy.mtgkq.cn
http://n72dksId.mtgkq.cn
http://GZN0ZVcN.mtgkq.cn
http://yCCXK9HF.mtgkq.cn
http://y3q2oPAR.mtgkq.cn
http://23m0r3eH.mtgkq.cn
http://PD27o5Sj.mtgkq.cn
http://zxT1kGV5.mtgkq.cn
http://LbIhjpu6.mtgkq.cn
http://nmGV6lTJ.mtgkq.cn
http://moUMk7TK.mtgkq.cn
http://FC3G7wSk.mtgkq.cn
http://O0TWnQ7p.mtgkq.cn
http://CH9R1sA0.mtgkq.cn
http://uZSbGhxz.mtgkq.cn
http://Igk9pU8f.mtgkq.cn
http://25y5daMe.mtgkq.cn
http://ercmGDra.mtgkq.cn
http://qLHj4U2s.mtgkq.cn
http://GWZf45fy.mtgkq.cn
http://if8t1xtJ.mtgkq.cn
http://MvgKdGwu.mtgkq.cn
http://www.dtcms.com/a/248620.html

相关文章:

  • Vulkan学习笔记6—渲染呈现
  • 《并查集》题集
  • 通关JUC:Java并发工具包从入门到精通 | 深度源码解析​
  • Excel词典(xllex.dll)文件丢失或损坏导致功能异常?别慌!专业修复策略来了!
  • Java 实现 Excel 转化为 PDF
  • 51c自动驾驶~合集59
  • 在线教程丨刷新TTS模型SOTA,OpenAudio S1基于200万小时音频数据训练,深刻理解情感及语音细节
  • 从TCGA下载图像数据
  • Python的格式化输入输出
  • C盘瘦身?
  • 轻量级顺序监控器监控 LLM 中的分解攻击
  • 最新四六级写作好词好句锦囊(持续更新中)
  • 亚马逊店铺注册:2025亚马逊注册店铺最新教程
  • 3.图数据Neo4j - CQL的使用
  • Tensorflow安装出现dependency conflict错误
  • 山东大学软件学院项目实训:基于大模型的模拟面试系统项目总结(八)
  • 分布假设学习笔记
  • JsonTypeHandler解析数据库json类型字段
  • QWebEngine
  • LVGL学习笔记-----标签控件(lv_label)
  • 【学习笔记】重载和重写的注意事项
  • 前端历练(一)Tailwind 配置
  • MCP(Model Context Protocol,模型上下文协议)的当前状态
  • 《棒垒球百科》棒球、垒球奥运会运动员规定·棒球1号位
  • kafka Tool (Offset Explorer)使用SASL Plaintext进行身份验证
  • Reels流量密码:Ins 2025算法偏好的7个隐形规则
  • 自动化模型管理:MediaPipe Android SDK 中的模型文件下载与加载机制
  • 中小企业数字化转型:如何选择靠谱的软件开发服务商?
  • 详解Python当中的pip常用命令
  • Day13_C语言基础项目实战