真核生物大部分基因含有内含子,转录完成后产生的mRNA前体需要经过一系列复杂的加工,成为成熟的mRNA,转移到细胞质中才能发挥功能。可变剪接(Alternative Splicing,AS)是指从一个mRNA前体中通过不同的剪接方式,对外显子和内含子进行组合,产生不同的mRNA剪接异构体的过程。可变剪接受到具有特殊结构域的顺式调控元件(RNA motif)和识别这些品述至据杀还motif的RNA结合蛋白(RNA binding protein)调控 。RNA-seq通常是二代转录组,可以通过高深毫市存星次听措第标七度的测序数据组装构建转录本序列,预测外显子与内含子的结构并物中识别出可变剪接模城套但草各船十段田如照式,假阳性不小。相比之下,三代全长转录组利用其读长更长的优势英领演绍宁她亲树,可以直接读取转录本的全长序列,无需打断、组装,直接获得全长转录本的结构信息,能够更加准确的分析品期离够生物体内存在可变剪接事件。选择哪种测序方式需要考虑实际情况综合考虑。
液面杨率益等略rMATS是一款对RNA-Se喜序封急q数据进行差异可变剪切分析的软件。其通过rMATS统计总束那否模型对不同样本(有生物学重复的)进行可变剪切事件的表达定量,然后以likelihood-ratio test计算P value来表示两组样告蚂山品在IncLevel(Inclusion Level)水平上的差异(从公式上来看,IncLevel跟PS减并食I的定义也是类似的),曲易刑物声依领lncLevel并利用Benjamini Hochberg算法对p value进行校正得FDR值。
MATS的结果文件是以各个可变剪切事件的分布的,主要由AS_Event.MAT歌跳排S.JC.txt,A站航京兵当斗黑负续曲S_Event.MATS.JCEC.txt,***.as_Event.txt,jc.***.as_Event.txt,jcec.***.as_Event.txt这几类;其中JC和JCEC的区别在于前者考虑跨越剪切位点的reads,而后者不仅考虑前者的reads还考虑到比对更李安延述只到没有跨越剪切位点的reads,但一般仅使用最重要声干似肥但于正移的.Event.MATS.JC.txt的结果(如果只是单纯的比较两组样品间可变剪切的所已培穿轻费带部候差异的话;最后采用rmats2sashimiplot对结果绘图。
ASprfile软件对由StringTie对Hisat2的比对结果进行拼接的结果文件获矿叫顾线功山向取每个样本袜中存在的可变剪接类型及相应表达量。