[R]特定字符的提取

2024-07-02  本文已影响0人  花生学生信

例子

假设column_names是一个向量

column_names <- c("chr08_2600000_2610000", "chr12_4500000_4510000", "chr17_7800000_7810000")
column_names

提取染色体信息

Chr <- sub("_.*", "", column_names)
Chr

提取第二个”下划线“后的字符

Between_1_2 <- sub("^(\\w+)_(\\d+).*", "\\2", column_names)
Between_1_2

提取前两个字符

Chr <- sub("^(\\w+)_.*", "\\1", column_names)
Chr

下面是实践部分

#读取基因变异数据
mygene <- read.csv("5_scaffold_1091_1091_57926_63436.csv", header = T,row.names = 1)
###提取列名
column_names <- names(mygene)

##提取染色体名
Chr <- sub("_.*", "", column_names)
# 创建一个数据框,其中包含转置后的第一行,列名是"sample"
new_df <- data.frame(sample = column_names,Pos=column_names,Chr=Chr)
new_df
需要读取的文件 新生成的new_df文件
###保存文件,即为onci图的第三个输入文件
write.csv(new_df, file = "3.mytype.csv", row.names = FALSE)
上一篇 下一篇

猜你喜欢

热点阅读