散点图是用于研究两个变量之间关系的经典的和基本的图表。如果数据中有多个组,则可能需要以不同颜色可视化每个组。
2.带边界的气泡图(BubbleplotwithEncircling)
有时,您希望在边界内显示一组点以强调其重要性。
3.带线性回归最佳拟合线的散点图(Scatterplotwithlinearregressionlineofbestfit)
如果你想了解两个变量如何相互改变,那么最佳拟合线就是常用的方法。下图显示了数据中各组之间最佳拟合线的差异。
针对每列绘制线性回归线:
4.抖动图(Jitteringwithstripplot)
通常,多个数据点具有完全相同的X和Y值。结果,多个点绘制会重叠并隐藏。为避免这种情况,请将数据点稍微抖动,以便您可以直观地看到它们。
5.计数图(CountsPlot)
避免点重叠问题的另一个选择是增加点的大小,这取决于该点中有多少点。因此,点的大小越大,其周围的点的集中度越高。
6.边缘直方图(MarginalHistogram)
边缘直方图具有沿X和Y轴变量的直方图。这用于可视化X和Y之间的关系以及单独的X和Y的单变量分布。这种图经常用于探索性数据分析(EDA)。
7.边缘箱形图(MarginalBoxplot)
边缘箱图与边缘直方图具有相似的用途。然而,箱线图有助于精确定位X和Y的中位数、第25和第75百分位数。
9.矩阵图(PairwisePlot)
矩阵图是探索性分析中的最爱,用于理解所有可能的数值变量对之间的关系。它是双变量分析的必备工具。
10.发散型条形图(DivergingBars)
如果您想根据单个指标查看项目的变化情况,并可视化此差异的顺序和数量,那么散型条形图(DivergingBars)是一个很好的工具。它有助于快速区分数据中组的性能,并且非常直观,并且可以立即传达这一点。
发散型文本(DivergingTexts)与发散型条形图(DivergingBars)相似,如果你想以一种漂亮和可呈现的方式显示图表中每个项目的价值,就可以使用这种方法。
12.发散型包点图(DivergingDotPlot)
发散型包点图(DivergingDotPlot)也类似于发散型条形图(DivergingBars)。然而,与发散型条形图(DivergingBars)相比,条的缺失减少了组之间的对比度和差异。
13.带标记的发散型棒棒糖图(DivergingLollipopChartwithMarkers)
带标记的棒棒糖图通过强调您想要引起注意的任何重要数据点并在图表中适当地给出推理,提供了一种对差异进行可视化的灵活方式。
14.面积图(AreaChart)
15.有序条形图(OrderedBarChart)
有序条形图有效地传达了项目的排名顺序。但是,在图表上方添加度量标准的值,用户可以从图表本身获取精确信息。
16.棒棒糖图(LollipopChart)
棒棒糖图表以一种视觉上令人愉悦的方式提供与有序条形图类似的目的。
17.包点图(DotPlot)
包点图表传达了项目的排名顺序,并且由于它沿水平轴对齐,因此您可以更容易地看到点彼此之间的距离。
18.坡度图(SlopeChart)
坡度图最适合比较给定人/项目的“前”和“后”位置。
19.哑铃图(DumbbellPlot)
哑铃图表传达了各种项目的“前”和“后”位置以及项目的等级排序。如果您想要将特定项目/计划对不同对象的影响可视化,那么它非常有用。
20.连续变量的直方图(HistogramforContinuousVariable)
直方图显示给定变量的频率分布。下面的图表示基于类型变量对频率条进行分组,从而更好地了解连续变量和类型变量。
21.类型变量的直方图(HistogramforCategoricalVariable)
22.密度图(DensityPlot)
密度图是一种常用工具,用于可视化连续变量的分布。通过“响应”变量对它们进行分组,您可以检查X和Y之间的关系。以下情况用于表示目的,以描述城市里程的分布如何随着汽缸数的变化而变化。
23.直方密度线图(DensityCurveswithHistogram)
带有直方图的密度曲线汇集了两个图所传达的集体信息,因此您可以将它们放在一个图中而不是两个图中。
24.JoyPlot
JoyPlot允许不同组的密度曲线重叠,这是一种可视化大量分组数据的彼此关系分布的好方法。它看起来很悦目,并清楚地传达了正确的信息。
25.分布式包点图(DistributedDotPlot)
分布式包点图显示按组分割的点的单变量分布。点数越暗,该区域的数据点集中度越高。通过对中位数进行不同着色,组的真实定位立即变得明显。
26.箱形图(BoxPlot)
箱形图是一种可视化分布的好方法,记住中位数、第25个第45个四分位数和异常值。但是,您需要注意解释可能会扭曲该组中包含的点数的框的大小。因此,手动提供每个框中的观察数量可以帮助克服这个缺点。
27.包点+箱形图(Dot+BoxPlot)
包点+箱形图(Dot+BoxPlot)传达类似于分组的箱形图信息。此外,这些点可以了解每组中有多少数据点。
28.小提琴图(ViolinPlot)
小提琴图是箱形图在视觉上令人愉悦的替代品。小提琴的形状或面积取决于它所持有的观察次数。但是,小提琴图可能更难以阅读,并且在专业设置中不常用。
29.人口金字塔(PopulationPyramid)
人口金字塔可用于显示由数量排序的组的分布。或者它也可以用于显示人口的逐级过滤,因为它在下面用于显示有多少人通过营销渠道的每个阶段。
30.分类图(CategoricalPlots)
31.华夫饼图(WaffleChart)
用于显示更大群体中的组的组成。
32.饼图(PieChart)
饼图是显示组成的经典方式。然而,现在通常不建议使用它,因为馅饼部分的面积有时会变得误导。因此,如果您要使用饼图,强烈建议明确记下饼图每个部分的百分比或数字。
33.树形图(Treemap)
树形图类似于饼图,它可以更好地完成工作而不会误导每个组的贡献。
34.条形图(BarChart)
条形图是基于计数或任何给定指标可视化项目的经典方式。在下面的图表中,我为每个项目使用了不同的颜色,但您通常可能希望为所有项目选择一种颜色,除非您按组对其进行着色。
36.带波峰波谷标记的时序图(TimeSerieswithPeaksandTroughsAnnotated)
那么如何解读呢
对于空乘旅客,我们看到多达14个滞后跨越蓝线,因此非常重要。这意味着,14年前的航空旅客交通量对今天的交通状况有影响。
41.使用辅助Y轴来绘制不同范围的图形(PlottingwithdifferentscalesusingsecondaryYaxis)
在该方法中,订单数量的平均值由白线表示。并且计算95%置信区间并围绕均值绘制。
43.堆积面积图(StackedAreaChart)
44.未堆积的面积图(AreaChartUnStacked)
45.日历热力图(CalendarHeatMap)
46.季节图(SeasonalPlot)
47.树状图(Dendrogram)
树形图基于给定的距离度量将相似的点组合在一起,并基于点的相似性将它们组织在树状链接中。
48.簇状图(ClusterPlot)
簇状图(ClusterPlot)可用于划分属于同一群集的点。下面是根据USArrests数据集将美国各州分为5组的代表性示例。此图使用“谋杀”和“攻击”列作为X和Y轴。或者,您可以将第一个到主要组件用作X轴和Y轴。
49.安德鲁斯曲线(AndrewsCurve)
安德鲁斯曲线有助于可视化是否存在基于给定分组的数字特征的固有分组。如果要素(数据集中的列)无法区分组(cyl),那么这些线将不会很好地隔离,如下所示。
50.平行坐标(ParallelCoordinates)
平行坐标有助于可视化特征是否有助于有效地隔离组。如果实现隔离,则该特征可能在预测该组时非常有用。