R语言GO富集分析画图 r语言faithful数据集

GO富集结果整体可视化

下面就来介绍一下simplifyEnrichment包是如何展示GO富集结果的。这里用该包中数据做一个演示。

网站建设哪家好，找成都创新互联！专注于网页设计、网站建设、微信开发、小程序定制开发、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了威信免费建站欢迎大家使用！

默认展示circ 数据前10个GO Term，通过参数 nsub 调整需要展示的GO Term chord_dat ()将作图数据构建成GOChord() 要求的输入格式；一个二进制的关系矩阵， 1 表示基因属于该GO Term， 0 与之相反。

经过上游的生信分析我们会获得许多具有生物学意义的gene set，可以是差异表达基因，也可是正选择基因或者加速进化基因。通常，只要具有这些基因的gene symbol或者是geneid，都可以利用该软件进行分析。

富集分析结果的可视化无非就是柱状图和气泡图，但是公司默认出图实在是太丑，所以还是自己动手修改修改。常规柱状图（ggplot2）横轴为gene counts，或者用-logP也行，填充相应的用P值或者gene counts。

最近有粉丝反映说，利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候，发现GO条目的名字都重叠在一起了。气泡图柱形图这个图别说美观了，简直不忍直视。经过我的认真研究，发现跟R版本有关。

但是该方法存在一个很大的问题，那就是当x轴标签数量很多时，那么就无法通过这样的方法进行解决了。方法二是方法一的逆向思路，既然可以调大画布，那么反过来，我们也可以调小x轴标签字体。

最近小Q在做自然选择分析，分析完之后简单粗暴的对候选基因做了富集分析，并做了展示，比起气泡图，我模仿了另一种作图方式，显示效果更佳。所以想在此分享一下如何用R语言画富集分析示意图（非气泡图）。

在是否需要构建的问题上，我看到徐洲更在功能注释后如何做富集分析中提到 “你不需要构建Orgdb，因为Orgdb的用途是进行基因编号和GO/KEGG的转换。

单细胞富集分析我最常用的是分组GSVA ，但最近用到了GO分析，就复习一下GO和KEGG富集分析及绘图。载入无比熟悉的pbmc.3k数据集 (已注释好，数据准备见 monocle )pbmc3k数据集只有1个样本，没办法区分HC和病例组。

3 GO富集分析加载了注释库之后，读取基因列表文件，并使用clusterProfiler的内部函数enrichGO()即可完成GO富集分析。读取基因列表文件，并使用clusterProfiler的内部函数enrichKEGG()即可完成KEGG富集分析。

单细胞数据的分组包含不同细胞类型，对照组和实验组，不同时间段的样本等，可以按照不同的分组将表达量矩阵和细胞分组信息提取出来，再进行后续分析。

GO、KEGG富集分析是我们做生信分析较为常用的部分，它可以将基因与功能相联系起来。GO指的是Gene Ontology，是基因功能国际标准分类体系。

GO是Gene ontology的缩写，GO数据库分别从功能、参与的生物途径及细胞中的定位对基因产物进行了标准化描述即对基因产物进行简单注释，通过GO富集分析可以粗略了解差异基因富集在哪些生物学功能、途径或者细胞定位。

通常称这种分析为GO、KEGG富集分析。本节视频教程，就让我们带大家学习什么是GO、KEGG富集分析，它们的主要原理是什么，并简单展示使用DAVID进行差异表达基因GO富集分析的操作过程。

文章名称：R语言GO富集分析画图 r语言faithful数据集
文章URL：http://dzwzjz.com/article/dspidgs.html