改善散点图

散点图无处不在,理所应当。 但是一个简单的散点图:

信息太少。 我在第一个图中显示的增强的散点图增加了几件事:

  • 回归线:那是直线
  • 黄土平滑线:这是波浪线。 这是数据的非参数平滑器。 它与直线的偏差不大这一事实表明,线性回归在这里非常合适。
  • 每个点的标签。 在这里,它们是状态,变量是失业和婴儿死亡率。
  • 每个变量的内核密度图,一个很好的单变量图形。
  • 置信椭圆,使您看到DC和密西西比州是两类离群值。

我在SAS中创建了精美版本。 我的代码是:

  PROC IMPORT OUT = WORK.UnempIM 
DATAFILE =“” C:\ personal \ Graphics \ UnEmpChildMort.csv“
DBMS = CSV替换;
GETNAMES = YES;
DATAROW = 2;
跑;

获取数据。

  proc模板; 
定义状态图scatdens2;
初音 *开始定义图形;
标题为“带有密度图的散点图”;
*创建标题;
布局晶格/列= 2行= 2
columnweights =(.8 .2)rowweights =(.8 .2)
columndatarange =联合rowdatarange =联合;
*布局格网...设置了网格图;
*列加权和行加权集
个人的相对大小
列和行;
柱轴
columnaxis / label ='失业率(%)'
griddisplay = on;
columnaxis / label =''griddisplay = on;
尾腔;
*列集特殊
列的特征;
*第二个没有标签(不适合);
row
rowaxis / label ='婴儿死亡率(按XXX)'
griddisplay = on;
rowaxis / label =''griddisplay = on;
内伤
布局叠加 *开始实际绘制点ETC;
散点图x =失业y =婴儿死亡率/数据标签= stateab;
*图点;
Loessplot x =失业y =婴儿死亡率;
loessplot x =失业
y =婴儿死亡率/平稳= 1;
椭圆x =失业y =婴儿死亡率
/ type =预测;
条目“预测椭圆(“ {unicode alpha}” =。05)“ / autoalign =自动textattrs =(颜色=红色);
布局;
densityplot婴儿死亡率/方向=水平kernel();
密度图失业率/内核();
布局;
底图
结束;
跑;

它设置了一个供图形模板语言使用的模板(*后面的内容是该代码部分功能的注释。有关更多信息,请参见我关于散点图的论文。

 选项nodate nonumber; 
标题;
title2;
ods pdf file =“ c:\ personal \ presentations \ SASGF14 \ scatterdens.pdf”;
proc sgrender数据= UnempIM模板= scatdens2;
*现在我们提供我们创建的模板;
跑;
ods pdf关闭;

这引起了阴谋。

当然,在某些情况下,您可能需要其他信息。 如果两个变量都是离散变量,则可以添加直方图而不是密度图。 您可能想对点进行颜色编码(例如,我可能对国家/地区进行了颜色编码。您可能需要几条不同的黄土线;或者,如果存在间断,则可能希望使用小波生成线。