R语言可视化STRING分析的蛋白互作网络报错的解决方法

今天就跟大家聊聊有关R语言可视化STRING分析的蛋白互作网络报错的解决方法，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

创新互联主要业务有网站营销策划、做网站、网站制作、微信公众号开发、重庆小程序开发公司、H5页面制作、程序开发等业务。一次合作终身朋友，是我们奉行的宗旨；我们不仅仅把客户当客户，还把客户视为我们的合作伙伴，在开展业务的过程中，公司还积累了丰富的行业经验、网络营销推广资源和合作伙伴关系资源，并逐渐建立起规范的客户服务和保障体系。

R语言可视化STRING分析的蛋白互作网络（PPI）

有一些朋友留言说在重复

net<-graph_from_data_frame(d=links,vertices=nodes,directed = T)

遇到了报错

Error in graph_from_data_frame(d = links, vertices = nodes, directed = T) : Some vertex names in edge list are not listed in vertex data frame

在这里记录一下原因和解决办法

R语言包ggraph可视化网络需要准备两个文件

一个是节点文件
另一个是节点之间的连线文件

比如我的网络是四个节点，分别是A,B,C,D,

节点之间两两连线

对应的数据应该是

> nodes<-data.frame(node=c("A","B","C","D"))
> edges<-data.frame(node1=c("A","A","A","B","B","C"),
+                   node2=c("B","C","D","C","D","D"))
> nodes
 node
1    A
2    B
3    C
4    D
> edges
 node1 node2
1     A     B
2     A     C
3     A     D
4     B     C
5     B     D
6     C     D

接下来是可视化

library(ggraph)
library(igraph)
net<-graph_from_data_frame(d=edges,vertices = nodes,directed = F)
ggraph(net)+
 geom_edge_link()+
 geom_node_point()

R语言可视化STRING分析的蛋白互作网络报错的解决方法 — image.png

但是如果你的edges文件里出现了nodes文件里没有的节点，

比如我在向edges这个文件里添加一个C~E的边

df<-data.frame(node1="C",node2="E")
edges1<-rbind(edges,df)
edges1

 node1 node2
1     A     B
2     A     C
3     A     D
4     B     C
5     B     D
6     C     D
7     C     E

接下来合并节点和边的时候就会遇到报错

> net<-graph_from_data_frame(d=edges1,vertices = nodes,directed = F)
Error in graph_from_data_frame(d = edges1, vertices = nodes, directed = F) :
 Some vertex names in edge list are not listed in vertex data frame

一种解决办法是把带E的这条边给他去掉。那如何判断边中哪个节点是多与的呢？

可以使用 %in% 来看

比如

> edges1$node1 %in% nodes$node
[1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE
> edges1$node2 %in% nodes$node
[1]  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE FALSE
> which(edges1$node2 %in% nodes$node)
[1] 1 2 3 4 5 6
> which(! edges1$node2 %in% nodes$node)
[1] 7

这就说明node2这一列第7行没有在 nodes里。

那我们就可以把这一行删掉了

还有一种办法是把E添加到节点里

df1<-data.frame(node="E")
nodes1<-rbind(nodes,df1)
nodes1
net<-graph_from_data_frame(d=edges1,vertices = nodes1,directed = F)
ggraph(net)+
 geom_edge_link()+
 geom_node_point()

关于string中蛋白互作网络输出文件为什么会出现

边文件中有的节点不是我们自己输入的基因id。这个我也不清楚。

我猜，完全是猜

比如你输入基因 a,b,c ，数据库中某个基因 d 刚好是链接这三个基因的中间点就像这种，中间是d

R语言可视化STRING分析的蛋白互作网络报错的解决方法

那么最终的网络文件中就会多出来d 如果是这种情况，就不能在边文件删除d而是只能在节点中添加d了。

看完上述内容，你们对R语言可视化STRING分析的蛋白互作网络报错的解决方法有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注创新互联行业资讯频道，感谢大家的支持。

网页名称：R语言可视化STRING分析的蛋白互作网络报错的解决方法
分享路径：http://ybzwz.com/article/jedhej.html

R语言可视化STRING分析的蛋白互作网络报错的解决方法

其他资讯