首先将5题的文件复制形成副本,如下图所示:
在资源管理器的路径中输入cmd,如下图所示:
在上图中输入后,按Enter键运行进入cmd窗口。在cmd窗口中输入并运行命令:jupyternotebook,如下图所示:
在上图中输入后,按Enter键运行自动打开浏览器并且进入jupyternotebook编程界面。在jupyternotebook中,点击第一题,ipynb和第一题-副本.ipynb。浏览器会新建两个标签页,如下图所示:
在两个标签页中,读者可以对照题目要求完成做题。下面是5道题目作者的答案和解析。
最后2行代码可以使作图时不出现编码错误,分别用来正常显示中文标签和正常显示负号。
柱形图.png
先将chipo这个变量深度拷贝给c变量,这样可以避免影响原数据,使代码每次都能成功运行。item_price这个单词是一个条目的价格,不是单个商品的单价。我们平时超市购物的单子的最后price那一列也是算的这一个条目的价格,比如2个相同的商品算1个条目。
散点图.png
pandas.cut用法官方文档.png
将电影时长分类后赋值给duration_labeled_series变量,数据类型为Series。查看其中的值,如下图所示:
对duration_labeled_series变量统计每个分类出现的次数,使用value_counts方法。
直方图.png
利用plt.scatter方法画出散点图
观察示例答案中左右两幅图,不同的地方有:处于画板的位置、标题、散点颜色。定义函数drawScatter用于绘制散点图,传入4个参数:数据group、处于画板的位置subplot、标题title、散点颜色。
组合散点图.png
在有2组散点的散点图当中,第1组散点默认为橘黄色,第2组散点默认为天蓝色。
THE END