找回密码
 注册
搜索
热搜: 活动 交友
查看: 113|回复: 0

数据科学中级 Python:Matplotlib

[复制链接]

2

主题

0

回帖

12

积分

新手上路

积分
12
发表于 2023-11-6 13:14:57 | 显示全部楼层 |阅读模式
本帖最后由 manha123@ 于 2023-11-8 18:41 编辑

大家好,我叫 Filip,是 DataCamp 的一名数据科学家。在这个中级 Python 课程中,您将进一步增强数据科学方面的Python 技能。您将学习如何可视化数据以及如何将数据存储在新的数据结构中。在此过程中,您将掌握控制结构,您将需要这些控制结构来自定义脚本和算法的流程。我们将以一个案例研究来结束本章,您将在其中将学到的所有知识融合在一起来解决一个很酷的问题。 第一章是关于数据可视化的,这是数据分析中非常重要的一部分。首先,您将不断使用它来探索您的数据集。您对数据了解得越多,您就越能够提取见解。一旦您找到了这些见解,您将再次需要可视化,以便能够与其他人分享您的宝贵见解。作为一个例子,看看这个美丽的情节。 它是由瑞典教授汉斯·罗斯林提出的。他关于全球发展的演讲已被观看数百万次。让它们如此有趣的是,通过制作美丽的情节,他让数据讲述自己的故事。这里我们看到一个气泡图,其中每个气泡代表一个国家。泡沫越大,该国的人口就越多,所以这里最大的两个泡沫是中国和印度。 有 2 个轴。横轴显示人均国内生产总值(以美元为单位)。纵轴显示预期寿命。我们清楚地看到,人均GDP较高的国家的人们寿命更长。

尽管如此,相同收入水平的国家之间的预期寿命仍存在巨大差异。 现在我为什么要告诉你这一切?嗯,因为在本章结束时,你将能够自己构建这个美丽的情节。 Python 中有许多可视化包,但它们的母体是matplotlib. 您将需要它的子包pyplot。按照惯例,这个子包被导入为plt,如下所示。 对于我们的第一个例子,让我们尝试了解世界人口演变的一些见解。我有一个包含年份的列表,年份,以及相应人口的列表,以十亿表示,pop。例如,1970 年,地球上生活着 37 亿人。 要将这些  加拿大电话号码表  数据绘制为折线图,我们调用 plt.plot() 并使用两个列表作为参数。第一个参数对应于水平轴,第二个参数对应于垂直轴。您可能认为现在就会弹出一个情节,但 Python 非常懒惰。它将等待show()函数实际显示绘图。这是因为您可能希望在实际显示绘图之前向绘图中添加一些额外的成分,例如标题和标签自定义。稍后我会再讨论这个问题。请记住这一点:该plot() 函数告诉 Python 要绘制什么以及如何绘制它。show()实际上显示了情节。 当我们查看绘图时,我们会发现横轴确实显示了年份,纵轴显示了人口数量。



有四个数据点,Python 在它们之间画一条线。1950 年,世界人口约为 2 点 50 亿。2010年约为70亿。因此,世界人口在六十年内几乎增加了两倍,这非常可怕。如果人口继续这样增长怎么办?世界会变得人口过剩吗?你会在练习中找到答案。 首先让我向您介绍另一种类型的图:散点图。要创建它,我们可以从之前的代码开始。不过,这一次,您将绘图函数更改为散点图。生成的散点图简单地绘制了所有单独的数据点;Python 不会用线连接点。对于许多应用来说,散点图通常是比线图更好的选择,因此请牢记此散点函数。您也可以说这是一种更“诚实”的绘制数据的方式,因为您可以清楚地看到该图仅基于四个数据点。 现在我们已经掌握了基础知识直方图 在本视频中,我将介绍直方图。直方图是一种可视化类型,对于探索数据非常有用。它可以帮助您了解变量的分布。要了解它是如何工作的,请想象 0 到 6 之间的 12 个值。我将它们放在一条数轴上。要为这些值构建直方图,您可以将线分成相等的块,称为箱。假设您有 3 个箱,每个箱的宽度为 2。接下来,计算每个箱内有多少个数据点。第一个 bin 有 4 个数据点,第二个 bin 有 6 个数据点,第三个 bin 有 2 个数据点。

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黒屋|Quetzal Audio

GMT+9, 2025-2-23 23:25 , Processed in 0.162173 second(s), 18 queries .

Powered by Discuz! X3.5

Copyright © 2001-2025 Tencent Cloud.

快速回复 返回顶部 返回列表