生信学习记录

0523

2022-05-23  本文已影响0人  坤坤呆又呆

Linux操作复习

data:显示日期

cal:显示相关数据

bc:计算器 scale=5 保留小数点后五位

ctrl+c:终止进程

ctrl+d:终止键盘输入

exit

man

sync

shutdowm:关机重启 shutdown -h +10/shutdown -r +30

reboot

poweroff -f

init:0 关机 3 纯文本模式 5 图形接口 6 重启

chgrp:改变文件群组

chown:改变所有者

chmod:改变权限 chmod a+w #添加书写权限

uname:查看核心版本uname -r

cd

pwd

mkdir

rmdir:删除空目录

ls:-a/-l/-d

cp

rm:删除以aaa开头的文件 rm ./-aaa-   #加入./抵消冲突

mv

rename

basename

dirname

cat

tac

nl:nb -b a -n rz -w 4:显示行号且空行编号,行号在右侧显示且行号前加零,且保留四位整数。

more

less

head:-n

tail:-n

od:-t a/c/o/d/x/f

touch

chattr:配置文件隐藏属性

lsattr:显示文档的隐藏属性

file:显示文档类型

which -a command:

whereis:

locate:模糊寻找 locate 123 #找到含123的文件

find

gzip

zcat

bzip2

bzcat

tar

illumina测序原理

主流测序方法:illumina/pacbio/nanopore

前两者均是边合成边测序

illumina测序过程:边合成边测序

桥式PCR增加模板数,增大荧光量。末端终止法控制,合成的速度一致性。illumina150 bp由于桥式PCR限制导致测序片段较短。pacbio几千kb。

选择合适长度片段进行测序,鸟枪法打断后进行加接头adapter(barcode不同),与flow cell上接头序列是反向互补,结合后进行桥式PCR。PCR之后存在两个相反方向的片段,去掉任一方向的片段在进行测序。每一个cycle拍照记录。测出序列后与参考序列进行比对,测序深度足够那么将覆盖所有DNA片段。

一个flowcell上有8个lane

测序后fq文件内容:

每四行为一组

      第一行:标识行

      第二行:序列信息

      第三行:描述信息/注释信息

      第四行:质量信息

Q30:Q=-10log10e sanger= Q+33

    Q30>80%,至少有80%的错误率小于千分之一

0523报告单倍型多样性和单核苷酸多样性

单倍型多样性和单核苷酸多样性

单倍型多样性:

单核苷酸多样性:

N 代表没有测定的碱基。比如在测序过程中出现gap,那么这一段都用N来代替这些还没有测序、尚不明确的碱基。

上一篇下一篇

猜你喜欢

热点阅读