空转第三节课多样本整合的补充2(python版本)

2023-10-02  本文已影响0人  单细胞空间交响乐

作者,Evil Genius

大家国庆过得如何了?????

如果很开心,不妨分享一下

上一篇文章讲过了,对空间转录组进行整合分析,比较CCA和harmony的结果可以发现

harmony整合的过程中把正常区域整合在了一起,而CCA在整合的过程把部分正常区域和部分肿瘤区域合并成了一个cluster。
CCA对肿瘤区域的聚类结果更为混乱一点,这一点符合认知。
整体效果而言倾向于harmony的分析结果。
关于空间整合分析的结果仍然建议大家采用文献的思路,整合的过程分别使用CCA和harmony进行分析,根据形态学划分来判断采用哪种整合结果。

我们在空间转录组第三节课上的分享的多样本整合基本都是基于R版本,但是对于空间转录组而言很多分析都是基于python的,那么这一篇我们来更新python版本的空间多样本整合。

在这之前了解一下SpaceRanger的分析参数

参数介绍

输出文件夹名字,两个样本的输出文件分别命名为A和P

Visium slide serial number. Refer to the Slide Parameters for information on supported slide versions. Required unless --unknown-slide is passed.

Visium capture area identifier. Required unless --unknown-slide is passed. Options for Visium are A1, B1, C1, D1.

spaceranger count运行时图片对其有两种方式,一种软件自动识别图片进行对齐,另外一种就是先用Loupe软件手动对齐,生成对于json文件提供给后面的软件并用loupe-alignment参数指定。

测序流程示意图

样本定量实例

#>>>A.sh>>>
human_index_dir=~/DataHub/10X/refdata-gex-GRCh38-2020-A
mouse_index_dir=~/DataHub/10X/refdata-gex-mm10-2020-A
fastqs_dir=~/Project/ST/data/V1_Mouse_Brain_Sagittal_Anterior_Section_1_fastqs
image_path=~/Project/ST/data/V1_Mouse_Brain_Sagittal_Anterior_image.tif
output_dir=~/Project/ST/data

cd ${output_dir}

spaceranger count \
    --id A \
    --description Mouse_Brain_Sagittal_Anterior_Section_1 \
    --transcriptome ${mouse_index_dir} \
    --fastqs ${fastqs_dir} \
    --image ${image_path} \
    --slide V19L29-035 \
    --area B1 \
    --localcores 20 \
    --localmem 128
#<<<A.sh<<<
cd ~/Project/ST/data
nohup zsh A.sh &> A.sh.log &

输出文件

├── filtered_feature_bc_matrix.h5
├── spatial
│   ├── aligned_fiducials.jpg
│   ├── detected_tissue_image.jpg
│   ├── scalefactors_json.json
│   ├── spatial_enrichment.csv
│   ├── tissue_hires_image.png
│   ├── tissue_lowres_image.png
│   ├── tissue_positions.csv
└── web_summary.html

outs文件夹下需要查看的文件

其他输出文件描述可以查看官网介绍https://support.10xgenomics.com/spatial-gene-expression/software/pipelines/latest/output/overview

接下来进行python版本的多样本整合

from pathlib import Path
import re
import warnings

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import scanpy as sc
import seaborn as sns
import squidpy as sq

import bioquest as bq
import sckit as sk

批量读取数据

上一篇下一篇

猜你喜欢

热点阅读