UCSC gene browser
莎莎写于2020.5.10 今天实验设计终于讲完啦,效果还不错,下一步准备设计引物买过表达和siRNA了,一点一点努力吧~💪本来昨天正好查到UCSC gene browser就想着写个简书吧,但是昨天还要想一下PPT怎么讲,而且当时已经12点多了,宿舍要熄灯了,就没有来得及写。今天又拖到晚上8点多,虽然新疆这边天还没有黑,哈哈🤭现在我的电脑桌边上放着一听水蜜桃汁儿一会要学习还要重新把数据分析一下,画个散点图什么的,晚上任务繁重啊!!!奥里给😄
USCS官网:http://www.genome.ucsc.edu/
这里可以选基因组image.png
但是!我要进的不是这里,是通过circBASE网站进去
1.打开circbase:
image.png
image.png
2.通过在线数据库UCSC genome browser检索circRNA序列
本文以最近发表的一篇circRNA文献为例,跟大家一起交流如何不通过写代码快速获得circRNA全长序列。
该文研究者发现的一种全新的circRNA,起源于SCD基因的3UTR区,命名为SCD-circRNA2。实验结果表明SCD-circRNA2在肝癌组织中显著上调,是肝癌预后独立预测因子。进一步研究发现RNA结合蛋白RBM3在肝癌中高表达,与肝癌预后不良相关,RBM3高表达促进了SCD-circRNA2的表达,是SCD-circRNA2的上游调控因子。
注:硬酰辅酶A 去饱和酶(stearoyl-CoA desaturase, SCD) 是合成单不饱和脂肪酸的限速酶,是调节肝脏脂肪生成和脂类氧化的关键控制点。该酶活性的改变会导致脂质代谢异常,从而引起各类脂肪代谢相关疾病的产生。
下面我们一起根据文献给出的数据通过3步来寻找SCD-circRNA2的全长序列。
1. 收集文献中circRNA序列相关信息
首先我们罗列出文章中SCD-circRNA2相关信息。
- Fig1c给出了SCD-circRNA1和SCD-circRNA2在SCD基因上起源定位示意图。Part of Exon6说明SCD-circRNA2来源6号外显子部分序列。
- Fig6a给出SCD-circRNA2序列侧翼序列相对位置,
- 补充材料Supplementary Table 2材给出了SCD-circRNA2的PCR,siRNA和northblot探针序列。
- 补充材料table5给出circRNA高通量测序SCD-circRNA2的转录起始终止染色体坐标 chr10:102122370-102122756
2.通过在线数据库UCSC genome browser检索circRNA序列
对于全新circRNA,一般类似circbase等数据库不会收录,所以检索不到。这里我们可以根据上面circRNA测序提供的SCD-circRNA2染色体坐标在UCSC genome browser(http://genome.ucsc.edu/)网站上进行分析。
- 进入UCSC基因组浏览器后,鼠标悬停Genomes处,点击进入Human GRCh37/hg19界面(此处选的是hg19基因组版本,不知道基因组版本的情况下,可能还要试试hg38版本)。
- 将circRNA染色体坐标chr10:102122370-102122756粘贴进搜索框,鼠标点击go按钮。页面会刷新进入如下界面,可以看到浏览器已经跳转到SCD基因区。
- 查看SCD基因的详细信息并确认。
- 查看SCD基因全长结构,下图可知道SCD基因由6个外显子组成。
- 根据上图点击“Get DNA for SCD”
注:UCSC坐标系统以0开始的
image由于Ensembl 数据库用 1起始的坐标系统,而UCSC 用0起始的坐标系统,因此这里需要将SCD-circRNA2的起始坐标加上1,即SCD-circRNA2坐标为chr10:102122371-102122756
image- 获得SCD-circRNA2的全长序列,并转换得到接头序列,转换方式见下图。
3.验证获得序列的正确性
- 利用文献中给出的PCR引物和siRNA序列,考察是否可以对应到已获取序列中。
- 利用UCSC genome browser的blat工具验证获取SCD-circRNA2序列准确性。
点击submit提交后,跳转到下面界面。
image点击第一条记录的browser,跳转到下面图形界面。
image上图SCD-circRNA2和SCD的定位图是不是跟文献的Fig1c一致了。
image👌今天就分享到这里吧~ 😔一会要分析数据了!