主题:【第十三届原创】数据可视化之热图的应用与绘制

浏览 |回复0 电梯直达
welewolf
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
维权声明:本文为v2823651原创作品,本作者与仪器信息网是该作品合法使用者,该作品暂不对外授权转载。其他任何网站、组织、单位或个人等将该作品在本站以外的任何媒体任何形式出现均属侵权违法行为,我们将追究法律责任。

数据可视化之热图的应用与绘制

welewolf (ID: v2823651)



本篇原创作品以我在论文写作过程中绘制热图的经历和感悟为主题,与大家一起交流学习。

1.可视化图形是科研论文不可或缺的要素之一

信息时代中海量的数据信息需要借助图形手段可视化,从而清晰高效地传递。科学研究获得的原始数据通常繁杂无序,但科研论文不能只是这些数据的简单堆叠。因此,在科研领域,数据通过可视化图形表达是一个极为活跃而又关键的要素。

科研绘图作为论文的脸面,既要注重科学性,又要注重艺术性。众所周知,科研论文的发表要经过编辑和多位审稿人多层次和全方位的审核,而众多期刊编辑和审稿人的审稿习惯都是先看文章插图。因此规范化的科研绘图在论文发表过程中极为重要。正如著名期刊Journal of Hazardous Materials副主编关小红所说:论文千万条,规范第一条;绘图不规范,被拒两行泪

2.热图

热图通常是以矩阵的形式,结合渐进的色带展示数据值大小变化规律的热谱图,其效果一般优于离散点的直接显示,可以很直观地展现空间数据的疏密程度或频率高低。据统计,2012年发表于NatureBiotechnology, Cancer Cell, Genome Research, Genome Biology, Molecular & Cellular Proteomics等五种期刊的664篇原始研究文章中,使用热图对科研数据进行可视化表达的文章数为202篇,占比为30.4%[1] (1),表明热图在科研论文的可视化表达方面具有较高的认可度和热度。

在使用热图的202篇论文中,134篇文章未提及热图的绘制方法;其余68篇文章里明确地说明了热图的绘制方法,其中R语言是最常用的热图绘制工具,占比为46%;其次是JavaTreeview,占比为24% (2)。然而,R语言的缺陷在于要求使用人员具有相当高的编程技能,而这一缺陷通常会导致很大一部分研究人员放弃使用热图进行数据的可视化表达。







3.    使用Excel绘制污染物浓度相关性热图

对于缺乏编程技能的研究工作者们,如何使用常规工具绘制热图,从而增强科研数据可视化表达的效果呢?在此为大家分享一下我在不使用R语言的前提
下,如何使用Excel绘制污染物浓度相关性热图。以生物样本中有机磷阻燃剂 (A-E) 浓度之间Spearman相关系数为例。
首先,使用SPSS软件对原始数据 (图3) 进行Spearman correlation分析,得到生物样本中有机磷阻燃剂 (A-E) 浓度之间的Spearman相关系数 (图4)。
由于不会使用R语言绘制热图,此前仅将统计结果以表格的形式展示于论文中 (表1)。虽然表格的形式也常见于很多期刊论文中,但我还是被老板狠diss了一回。








其次,将获得的Spearman相关系数复制到Excel中(图5),调整字体和单元格的大小,使数据以较为美观的形状展示;并且去除显著性符号 (星号),使数据以数值形式显示 (图6)。




下一步,选中数据,点击工具栏中的条件格式选项,在弹出的下拉框中选择色阶选项,在右侧滑出的复选框中选择红-黄-绿色阶,如图7所示。




最后,结合PS软件为初步制作好的热图添加显著性符号、图例和相关说明。最终效果如图8所示。





参考文献:

[1] Deng W, Wang Y, Liu Z, Cheng H, Xue Y (2014) HemI: A Toolkit forIllustrating Heatmaps. PLoS ONE 9(11): e111988.
为您推荐