Python与机器学习-学生课堂用实验报告.docxVIP

Python与机器学习-学生课堂用实验报告.docx

  1. 1、本文档共96页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Python与机器学习 实验报告 学生学号 实训成绩 《电影数据统计》 实验报告 实验课程 实验项目 电影数据统计 指导教师 班 级 学生姓名 日 期 陈清华 2019年12月制 电影数据统计 学习情境 数据统计 子情境 数据统计基本流程 教学单元 项目一 总学时 3 实施环境 本地计算机 实施时间 (学时) 1.5 任务描述 通常,进行数据分析的基本步骤包括以下5步。 (1)明确目的:分析要解决什么问题,从哪些角度分析问题,采用哪些方法或指标。 (2)数据获取:明确数据获取的途径,主要是本地数据采集和网络数据获取。 (3)数据解析:把杂乱无章的数据处理成一定结构,形成有效数据的过程。 (4)数据分析:对数据进行分析操作,比如分组、聚合操作。 (5)结果呈现:将数据以图的形式直观地进行展示。 本项目基于上述步骤,了解数据的读取、清洗、简单统计分析与可视化展现。 任务准备 1.学习有关Pycharm/Anaconda集成环境的使用,数据分析流程相关基本知识。 2.一台装有PyCharm/Anaconda集成开发环境的Windows 系统。 任务实施 电影数据读取 数据清洗 数据筛选 数据统计 数据可视化 【实验目的】 熟练掌握PyCharm/Anaconda集成开发环境的使用方法。 掌握数据分析的一般过程。 了解数据获取的主要途径。 学会读取CSV本地文件。 初步学会Python数据分析常用包的使用方法:Pandas、Matplotlib等。 掌握使用柱状图来实现数据的可视化,并能对坐标轴、标题、颜色等属性进行设置。 了解散点图的画法。 【实验环境】 PyCharm环境、Python 3.7、Pandas、NumPy、Matplotlib。 【实验内容及实施步骤】 一、文件读取 从film.csv中读取数据 读取代码如下: 显示结果截图如下: 二、数据清洗 将空值替换为0值,并去除重复行 代码如下: 显示结果截图如下: 三、数据筛选 (1)从数据中筛选电影名称为“老男孩”的数据 代码如下: 显示结果截图如下: (2)从数据中筛选出放映日期为2010年05月前半月 代码如下: 显示结果截图如下: (3)筛选票房数据“1600”且名称为“老男孩”或“剑雨”的数据行 代码如下: 显示结果截图如下: 四、数据统计 (1)按电影名称统计前半月的日平均票房 代码如下: 显示结果截图如下: (2)统计每日放映的电影部数 代码如下: 显示结果截图如下: 五、数据可视化(一) (1)图形化显示不同电影的票房情况 代码如下: 显示结果截图如下: (2)按从小到大图形化显示不同电影的票房情况 代码如下: 显示结果截图如下: 六、数据可视化(二) (1)格式化显示不同电影的票房情况,参考代码及格式如下: 代码如下: 显示结果截图如下: (2)子图的效果显示上图(左边绿色格式化前、右边蓝色格式化后): 参考代码如下: # 创建自定义图像 fig = plt.figure() # 令ax1为1行2列图形的第1个坐标系 ax1 = fig.add_subplot(1, 2, 1) # 令ax2为1行2列图形的第2个坐标系 ax2 = fig.add_subplot(1, 2, 2) scale=range(len(filmgrp_bor[filmname])) # 在ax1坐标系上画出柱状图,并设置相应参数 ax1.bar(filmgrp_bor[filmname],filmgrp_bor[bor], color=blue, width=0.4) # 在ax2坐标系上画出柱状图,并设置相应参数 ax2.bar(film_sort[filmname],film_sort[BOR], color=green, width=0.4) ax1.set_title(排序前) ax2.set_title(排序后) plt.show() 显示结果截图如下: 你的代码如下: 你的显示结果截图如下: 【实验总结】 通过本次实验,已掌握: 答: 存在的疑问: 答: 课堂笔记: 【课后思考】 本项目中用的第三方库包有哪些? 数据分析的基本流程 统计函数有哪几种,可以分别用来做什么? 【课后思考与课堂思政】 请你谈谈在数据分析中哪些地方体现了中国工匠精神 请参考日常生活中的数据,对其进行数据分析与可视

文档评论(0)

赵五菱王 + 关注
实名认证
文档贡献者

资料收集自互联网,若有侵权请联系删除,谢谢~

版权声明书
用户编号:8036120077000004

1亿VIP精品文档

相关文档