什么是散点图?
下面的这个图片里就是一个散点图. 首先它的数据是以点的形式显示出来的, 这个点的大小呢本身不重要, 这个点的位置很重要. Scatter Plot就是我们初中数学里的坐标轴, 每一个点就是一个坐标, 以前我们学习的时候, X轴是从1开始的数字, 现在它被替换成了某个变量, 比如销售额, Y轴也一样, 以前就是数字, 现在这个数字只不过有了具体的意义. 在下边的这个图里Y轴就是利润.
而他们在x轴和y轴坐标的大小才是最重要的.
那么每个点本身代表什么, 在左侧的Marks区域, 我们看到Product Name出现在Detail Mark的后边, 这意味着我们看到的每个点都是一个产品. 这个点对应的X轴上的值是这个产品的总销售额, 这个点对应的Y轴上的值是这个产品的总利润.
接下来我们来看整个图, 我们看到销售额都是大于0的,但是利润有正数, 有负数. 大部分的产品都集中在原点也就是0的周围, 然后随着往外扩散, 产品就越来越稀疏了. 在最右上角我们能看到有一个产品帮我们产生了最高的利润和最高的销售额. 同样我们也能看到有一些产品它的销售额很高, 但是它的利润反而是负的.
什么时候使用散点图?
如果单纯比较销售额, 那么柱状图是最合适的, 从大到小一目了然. 但是到了两个变量,比如需要同时显示销售额和利润的时候, 散点图就体现出它的第一个优势, 它能够兼顾两个变量.
散点图的第二个优势就是能够观察趋势也就是随着一个变量的增加, 另一个变量的变化是怎么样的.
在上边的这个截图当中, 我们就会发现并不是说一个产品的销量越高, 它的利润就越高, 有的时候利润反而就越低. 卖的越多赔的越多
使用Show Me Button来创建一个散点图
在Show Me Button下边的要求当中我们可以看到, For Scatter Plots, 我们需要两到四个Measure, 0到多个dimension. 但是我们前边不是刚说过Scatter Plot最合适同时展示两个Measure吗, 怎么Show Me Button说是四个呢, 让我们来一探究竟.
在上边的动图当中我们可以看到, 虽然我选中了四个Measure: Discount, Profit, Quantity和Sales. 但是最后在X轴上和Y轴上的变量仍然是各一个, 而另外两个Measure分别被分配到了Marks上的Size和Color上去了.
在后半部分,我又尝试了选中Customer Name和Category两个Dimension, 再加上四个Measure, 看看Tableau还能给我搞出什么新花样的时候. 这一次我们可以看到, 新增加的那个Dimension Category被添加到了Shape上边, 而在右侧的Scatter Plot当中, 我们可以看到出了原来全部是圆圈的形状, 这一次出现了加号➕, 空心方框.如果你此时点开Shape, 就会看到下边的这个界面.
Category下边的每一个值都被赋予了一个新的形状
如果我们说两个Measure和一个Dimension是构成Scatteplot最基本的元素的话, 那么上边的这个例子就能够让你感受到Scatter Plot的拓展性, 每个具体的点的颜色, 形状, 大小全部都可以用数据来控制. 而之所以最多是4个measure就是因为形状是没有办法用Measure来展示的必须用Dimension. 而颜色和尺寸可以
Clustering 聚类分析
聚类分析是Scatter Plot的一个重要用途, 虽然在这个部分稍微有点超纲, 但是我觉得掌握它是学习Scatter Plot时一个非常关键的技能.
什么是聚类?
聚就是聚集, 类就是分类的意思. 在我们创建Scatter Plot时, 每一个产品都是一个单独的个体, 在散点图当中, 他们都是一个个小点. 然后每个点都有两个属性,他们的利润和他们的销售额. 那么聚类的目的就是这些单独的个体的数据点太多了, 我们能不能根据他们的利润和销售额大致分一下类. 比如把我们所有的产品大致分成四个组别. 这四个组别都有差不多的产品总数, 然后每个组内的产品,他们的销售额和利润都相似.
在上边的这个动图里, 我在已经创建好的Scatter Plot的基础之上, 开始尝试添加Cluster.
首先点击最上边的Analytics Pane, 选中Model当中的Cluster, 然后把Cluster移动到我们已经创建好的Scatter Plot上, 在界面的最下方, 输入你想要将所有的产品分成多少组, Tableau就会根据Variables当中显示的计算的名字, 自动帮你分类.
Clusters下边的Variables只显示了Sales和Profit就是因为当前的Scatter Plot里选择了这两个Variable做为X轴和Y轴. 但是Cluster是可以用别的Calculated Field来分类的.