重磅干货—1来自XGenomics单细胞转录组FAQ来啦

网友 1

最佳答案

回答者:网友

随着09年单细胞转录组技术的现世,使得科研精度从组织转变为单个细胞的层面。10XGenomics单细胞转录组技术作为其中目前来说最为大火的技术,对于细胞发育、肿瘤异质性以及细胞图谱等等方面的研究发挥着越来越重要的作用。今天我们一起看下其中可能遇到的问题吧~

Q1. 什么样的原始数据可以直接用于cellranger分析呢?

A1. 使用cellranger软件进行分析,使用的是:
*_S1_L001_R1_001.fastq.gz
*_S1_L001_R2_001.fastq.常么项张着国具伟赶解煤gz

分析软件只识别形如以下格式的fq文件:
“Sample Name_S1_L00[Lane Numb雨住容乎而烟剧跟er]_[Read 感养官选希需做代去Type]_001.fastq.gz

Q2. 通常样品nGene和nUMI的相关性系数要在0.8以上,但是这次实等歌验的相关性在0.5以下,怎么解释这个情况,得到的实验下机数据还可靠吗?

A2. 影响相关性的因素有文库制备过程的稳定性和细胞状态的一致性。如果相关性较低,可能是由于文库中细胞状态差异不胡眼第抗看令蒸倒硫较大。

可能与细胞检测时的状态有关,有些细胞可能活性降低,核酸存在降解的状态。

Q大什保目突已3. 检测线粒体表达量目的是为了作为阴性对照吗?正常线粒体基因在细胞中含量不是很多,那检测线粒体表达量是评价测序结果好坏的果民里根见七调一个阴性对照吗?

A3. 检测线粒体基因的表达量是一个数据分析质控指标。除了部分特殊类型的细胞(如卵细胞合激菜两损械因绍加示)。如果定位到线粒体的比例高,表明细胞质量较低,这可能是细胞凋亡增加所致。

Q4. valid barcodes只有92%,请问其他的reads是不带标燃陈十记还是带错误标记呢?如果是错误标记,该错误是在哪一步引入的?

A4. 都会有barcode,这个barcode不在白名单里面,可能是错配较多,或者质量较差。

Q5. 能否根据已知的某一个或者某几个的扩述marker基因,过滤出高表达这些maker基因的细胞,然后对这些细胞重新进行聚类分析呢?

A5. 可以。可以直接计算出每个细胞中这些marker基因的表达比例,然后挑选高表达(需要确定高表达的阈值)这些基因的细胞做后续分析。

Q6. 关注的基因表达量水平比较低,分析中采用的归一化方法对低表达量基因的影响是否很大呢?

A6. seurat分析中,默认采用LogNormalize归一化算法。该归一化对棉新犯临定船素记州四低表达的基因没有影社超张制候第武总群而工响。

Q7. seurat分析里P_val和p_val_adj要考虑么?p_val_adj有数值为1的,应该选取什么样的数值呢?

A7.seurat软件结果只对a械永检市来言业vg_logFC有个阈值控制(seurat软件默认),一般为0.25。

对其他值比如P_val和p_val_adj都没有设定阈值,所以会出现有p_val_adj值为1的结果。

主要原因是由于单细胞数据表达量数据较低(与bulk RNA相比较),设定太严格的阈值可能会造成有些有意义的数据被过滤掉了。

P_val和p_val_adj的值可以参考一下,差异倍数相差不大的话,可以考虑一下这两个值。

参考文献
https://www.***.org/content/biorxi请叶围较下德并是群班v/early/2019/03/18/576827.full.pdf


我来回答