如何使用crispick

2021-10-21 本文已影响0人 Seurat_Satija

如何使用克里斯皮克
概述
CRISPick 旨在为各种参考基因组、CRISPR/Cas 内核糖它利用了所述的评分原则多恩奇等人自然生物技术 .

要使用 CRISPick，请首先从可用选择的菜单中选择感兴趣的参考基因组。所选参考基因组的可用机制和酶将可供选择。请注意，并非所有机制或酶都可用于列出的每个参考基因组。

在选择适当的参考基因组、机制和酶后，以可接受的格式之一输入单个目标，该格式在快速查找搜索框下突出显示。

或者，如果您有同一参考基因组的多个目标，您可以选择批量查找选项以复制/粘贴在几个可接受的目标输入中，或者使用文件上传选项一次输入多达 500 个目标。

最后，选择 CRISPick 配额（如果与每个目标默认选择 5 个选择不同）不同，请按"验证"按钮，该按钮将在进入选择过程之前确认您的输入。

输入/输出详细信息
克里斯普科
克里斯普拉/i
输入：
此工具支持原始 DNA 序列、FASTA 文件、脚本 ID、基因 ID 或官方基因符号或特定基因组坐标形式的输入。您可以通过从快速查找中选择基因、将它们直接粘贴到批量输入文本框或上传文件来提供 sgRNA 目标。仅使用选定输入方法的目标输入。目标仅限于500个基因或脚本ID，或20，000个原始DNA序列碱基。

在提供原始DNA序列时，请注意 Azimuth 2.0 目标评分模型考虑了目标周围的上下文。这意味着S.pyogenesCas9的20默目标序列与5'端的4个上下文基和3'端的6个基数一起得分。S. aureus Cas9 目标的 21mer 目标序列与 5' 端的 4 个上下文基础和 3' 端的 11 个基础一起得分。这意味着可能包含有效目标的最短输入序列是S. pyogenes的 30 个碱基和S. aureus 的36 个碱基。

或者，如果您想要为精确的基因组坐标设计指南，如果您遵循CRISPRko应用程序的严格格式，您可以直接将其输入 Web 表单。例如：

NC_000001.11：-1000-2000：5000-6000

表示具有两个连续体（例如延伸超过两个外延的编码区域）的目标，位置为 1000.2000 和 5000.6000。前缀"NC_000001.11：-："表示该基因位于人类染色体1的减去链上。该工具当前要求您输入基因组序列的完全合格的 RefSeq 标识符，因此"NC_000001.11"，而不仅仅是"chr1"。另请注意，RefSeq 标识符必须存在于选定的基因组中（例如，上述 ID 是 GRCH38 的一部分，但不是 GRCH37）。链也必须指定，因为工具计算和输出蛋白质切割长度，这是定向的。

请注意，有关基因/脚本结构的信息不会推断为原始序列。例如，如果您想要使用此方法定位特定的 Exon 或避免使用此方法为成绩单提供内电序列，则可能需要编辑序列以避免无意中针对不需要的序列或功能。

例子：
CDC5L：官方基因符号
988： NCBI基因 ID
ENSG00000223972：恩森布尔基因 ID
NM_014911：参考成绩单 ID （无修订号：我们将选择最新）
NM_014911.3：参考成绩单 ID（修订号）
ENST00000456328：恩森布尔成绩单 ID
特特格塔格特加
NC_000001.11：-：1000-2000：5000-6000：基因组坐标
输出：
此工具生成两个输出文件。主要输出是一个可下载的.txt文件，其中包含针对编码序列设计的 sgRNA。该工具还生成一个摘要文件，按选择顺序提供目标上和偏离目标分数的统计数据。

输出文件列描述：
输入
目标基因或成绩单 ID 按最初要求。
配额
为此目标选择的候选 sgRNA 序列数量。
目标分类
目标基因的分类。
目标基因 ID
目标基因的 ID（通常是数字的，例如"恩特雷兹基因"ID）。
目标成绩单
目标成绩单的 ID（如果有）。
目标别名
对于上传的 FASTA 文件中的 DNA 序列目标，这是与文件中的序列相关的独特 ID。
目标模式
实际目标区域的定义方式是什么？成绩单 = 目标成绩单的所有外文，包括非编码区域;CDS = 仅限目标成绩单外例的编码部分。CDS 目标模式对 sgRNA 设计器的运行有两种影响：（1）候选 sgRNA 序列仅从目标成绩单的编码区域提取，而不是从其所有外波序列中提取：（2）拾取算法更喜欢接近目标 CDS 序列开始的 sgRNA 序列（首先在 5-65% 区域内尝试，然后先后放松到 0-80% 和 0-100%）。注：目前所有原始DNA序列输入在采摘过程中均被视为CDS序列。
PAM 策略
目前仅限于 Ngg 。
初始间距要求
如果可能，选择按一定距离分离的 sgRNA 序列（根据整个目标区域长度的百分比进行此处测量）。这称为"初始"，因为，如果在检查目标的所有候选 sgRNA 后没有达到配额，则在随后的挑选"回合"中将放宽此要求。
目标外匹配规则设置版本（"CFD 分数"）
计算目标外匹配或"CFD"（切割频率确定）分数的方法;目前只有一个偏离目标的规则集（"1"）。
目标外层策略
用于将脱靶匹配分类为"层"的方法;目前只有一个这样的政策（"1"），其细分为：第一层：蛋白质编码区域：第二层：编码基因转录序列中的任何位置（内电或外森）：第三层：非编码基因转录序列中的任何位置;第四层：任何基因中未包含的位置（即未转录）。
目标外匹配箱策略
阈值用于根据 CFD 分数将目标外匹配分类为"匹配箱"。有四个垃圾箱按三个阈值分列，按时间段划分。阈值为百分比。例如，"5.20.100"表示以下 4 个垃圾箱：Bin I： CFD = 1.0，Bin II： 1.0 >差价合约 ≥ 0.2，Bin III： 0.2 > CFD ≥ 0.05，Bin IV：差价合约< 0.05。
参考序列
包含切口位置的参考序列（脚本或染色体）的 ID。如果这是一个脚本 ID，则意味着该工具无法解决用户对基因组 DNA 中位置的输入，而是使用了脚本中已知的 RNA 序列（如果可用，可能具有外向边界信息）。这是次优的，因为在这些情况下，工具不能选择扩展到内电序列的 sgRNA 目标序列。此外，如果没有外向边界是已知的，也有可能的工具将选择一个sgRNA序列，跨越外向外在边界在RNA，这当然是荒谬的从生物学的角度来看。
sgRNA 切割位置（基于 1）
该候选 sgRNA 导致的 DNA 切割预测后，在基因组序列中基于碱基的 1 个位置。
目标链
如果参考序列是基因组参考序列，而不是成绩单 ID，则此列表示沿染色体沿整个目标基因的链（+或 -）。
斯格纳链
如果参考序列是基因组参考序列，而不是成绩单 ID，则此列指示 sgRNA 序列的链，因为它被投影到染色体上（+或 -）。
取向
sgRNA 序列的方向（感官或反感）与目标序列的链有关。
sgrna 序列
候选人 sgRNA 的序列。
sgRNA 上下文序列
用于目标功效评分的较长上下文序列（包含 sgRNA 序列）。
PAM 序列
此匹配的 PAM 序列。
Exon 号码
包含此切割位置的目标区域内的 Exon（如果仅限 CDS 或成绩单目标模式）。
目标切割长度
"目标"序列是目标（可能不连续）基地的总数。对于蛋白质编码目标，这是转录 CDS 中切割位置前的碱基数（即可用于计算蛋白质截断的百分比）。
目标总长度
所有目标基地的总合并长度。如果目标成绩单有多个外向，那么这可能是一组不连续的序列。
目标切割百分比
切割前的目标百分比，遵循转录方向。对于 CDS 目标，这是蛋白质产品可能截断的建议，假设切割会导致帧移位和早期停止 codon。
其他目标匹配
完美的目标匹配基因，而不是当前的目标基因，如果有的话。

脱靶层 I 匹配 Bin I 匹配

计算 I 层和匹配宾 I 的所有偏离目标的比赛。

目标外二级匹配宾 I 匹配

计数所有偏离目标的比赛为第二层和匹配宾 I。

目标外三级匹配宾 I 匹配

计数所有目标外的比赛为第三层和匹配宾 I。

脱靶四级匹配箱 I 匹配

计数所有脱靶匹配的第四层和匹配宾 I。

目标外层 I 匹配 Bin II 匹配

计算 I 层和匹配宾 II 的所有偏离目标匹配。

目标外二级匹配宾 II 匹配

计算第二层和匹配箱 II 的所有偏离目标匹配。

目标外三级匹配宾 II 匹配

计算第三层和匹配箱 II 的所有偏离目标的比赛。

目标外四级匹配箱 II 匹配

计算第四层和匹配宾 II 的所有偏离目标的比赛。

目标外层 I 匹配 Bin III 匹配

计算 I 级和匹配宾 III 的所有偏离目标匹配。

目标外二级匹配宾 III 匹配

计数所有非目标匹配的二级和匹配宾 III。

目标外三级匹配宾 III 匹配

计算第三层和匹配宾 III 的所有偏离目标的比赛。

目标外四级匹配宾 III 匹配

计算第四层和匹配宾 III 的所有偏离目标匹配。

脱靶层 I 匹配 Bin IV 匹配

计算第一层和匹配宾 IV 的所有偏离目标的比赛。

目标外二级匹配宾 IV 匹配

计算第二层和匹配宾 IV 的所有偏离目标的比赛。

目标外三级匹配宾 IV 匹配

计算第三层和匹配宾 IV 的所有偏离目标的比赛。

目标外四级匹配宾 IV 匹配

计算第四层和匹配宾 IV 的所有偏离目标匹配。
目标规则集
用于计算"目标"功效评分的模型（目前唯一支持的版本是"Azimuth_2.0"，这是"规则集 2"的更新版本多恩奇、富西等人，自然生物技术2016).看阿齐穆特 2.0.
目标有效性分数
使用目标规则集计算的该候选 sgRNA 上下文序列的实际目标分数。
目标排名
与此目标的所有其他候选人相比，该候选人 sgRNA 的目标得分的数字排名（1 是最高的）。
脱靶排名
与此目标的所有其他候选人相比，该候选人 sgRNA 的非目标评估中的数字排名（1 是最高的，即最具体的）。
目标排名重量
将目标和非目标排名合并为一个组合排名时，使用此重量进行目标排名。
脱靶排名重量
将目标和非目标排名合并为一个组合排名时，使用此重量进行非目标排名。
组合排名
根据目标和目标外排名的加权总和，该候选 sgRNA 的数字排名（1 是最高的）。
挑选订单
如果选择此候选人以达到目标的配额，则选择的顺序是什么。
采摘圆
考生挑选是复杂的，可能会经历多轮放松的限制，本专栏指出在哪个回合的挑选发生。
拾取注释
此列指出了在挑选过程中跳过构造的原因。如果候选人在第 1 轮中被选中，则该该候选人是空的。