从1987年首次发现CRISPR,到最近几年CRISPR-associated(Cas)技术的广泛应用,短短几年时间,CRISPR技术使基因编辑成为科研界的热门内容。那么CRISPR到底是怎么一回事儿呢?
下面我将分为背景简介、工作原理及应用方向三个方面来进行介绍。
为响应入侵病毒和质粒的侵害,细菌和古菌能够将外源DNA整合进自身染色体,整合后的序列作为一种“免疫记忆卡片”,在遇到与该序列互补的外源DNA后,能够对其进行切割。而这种整合后的序列就叫规律成簇的间隔短回文重复(Clustered Regularly Interspaced ShortPalindromic Repeat ,简称CRISPR),是细菌和古菌的一种自我保护机制。
CRISPR/Cas由分布在操纵子区域的多种Cas基因和CRISPR单元组成。CRISPR单元则由富含AT的前导区(被认为是CRISPR的启动子区域)、基因组靶向序列(genome-targeting sequences,称spacers)和多个相同的重复序列(repeats,约20~50-nt)组成,spacers之间被repeats隔开,呈repeat-spacer-repeat-spacer-repeat- spacer-repeat-……分布。
CRISPR/Cas介导的免疫防御系统依赖小RNA识别入侵者的特定序列(protospacers),并使其沉默表达,这种免疫反应主要包括三个阶段。
首先是适应期,细菌和古菌拥有一个或多个能够响应病毒或质粒入侵的CRISPR位点,它们通过类似于外源标记的方式来响应这种入侵,即将外源基因的短片段(protospacers)整合到宿主染色体的CRISPR序列前导区的近端(如第一个spacer),实现标记功能。第二三阶段属于宿主的反击,Cas基因被翻译成蛋白质,CRISPR单元被转录成CRISPR
RNA前体物(pre-crRNA),然后通过酶加工成成熟的能够与入侵者protospacers序列互补配对的crRNAs,这个过程相当于将靶标锁定。与靶标结合后,crRNAs通过与Cas蛋白形成的复合物来指导外源基因的沉默,从而达到免疫作用。
这种特殊的免疫系统主要有三种主要的类型,并且在一个生物体内三种类型能够兼容,Cas1基因存在于所有的CRISPR系统中。Type I有一个相同的特征——编码一个Cas3基因;Type II由四种Cas组成,Cas9是其中一;Type III可分为两种亚型,III-A和III-B,前者能够在体内靶向质粒DNA,后者能够在体外切割单链RNA。在基因编辑的应用中,运用最广泛的是Type II CRISPR系统。
在TypeII CRISPR系统中,一种与转录相关的tracrRNA(trans-activating CRISPR RNA)与repeats区杂交,形成一条RNA双链,被内源的RNase III等酶切割并被加工。成熟的crRNA-tracrRNA复合物与Cas9蛋白形成复合体,实现靶向序列双链DNA的切割从而介导免疫应答。
那么为了防止对自身的DNA进行切割,Cas9是如何区分自身DNA和外源DNA的呢?首先crRNA能够与外源DNA5'端20-nt的碱基序列互补配对,在这段靶向序列附近,一段短的DNA序列(protospacer adjacent motif,PAM),是帮助Cas9区分异源的重要元件。
在CRISPR/Cas9系统中,PAM 区是-NGG序列,而Cas9的切割位点则在NGG5’端的第三个碱基,这意味着Cas9能够被开发成RNA引导的(RNA-guided)基因编辑系统。
目前,融合了包含靶基因序列的crRNA和tracrRNA的单个向导RNA(Single guide RNA,
sgRNA),以及能够表达Cas9蛋白的载体已经被广泛用于基因编辑。如果感兴趣的DNA序列中包含NGG,那么Cas9就能够以NGG 5'端的20-nt序列为靶标来切割目标DNA双链。
Cas9是一种常用的核酸酶工具,能够用来修饰多种生物的基因组序列。在sgRNA(含有20-nt能够与靶基因互补的序列)的引导下,Cas9特异性的切割靶标序列,造成DNA双链的断裂(double-strand DNA breaks,DSBs),从而引起生物体内的DNA损伤修复。
这种修复作用主要包括两种途径,一种是利用非同源重组 (NHEJ)的修复,即易错修复,可能造成基因组的插入或缺失突变,这种方式常导致靶基因失去功能。另一种是利用同源重组修复(HDR),即精准修复,能够借助外源引入的短单链DNA序列(SSOND)或质粒(donor)为模板,介导替换或插入。
除了基因编辑方面的应用,Cas9还能用于转录调控,这种应用依赖于Cas9蛋白结构的解析。Cas9作为一个多功能蛋白,拥有HNH和RuvC两个核酸酶结构域,HNH结构域切割切割与crRNA互补配对的DNA链,RuvC结构域则切割双链DNA的另一条链。
如果突变两个结构域的其中一个,Cas9则变成单链切割的蛋白,如果将两个结构域都突变,那么Cas9则变成只有NDA结合活性的蛋白质(DeadCas9,dCas9;Asp10 → Ala, His840 → Ala)。
当dCas9结合在基因的编码区或启动子区域时,会影响RNA聚合酶的活性,从而影响转录,这种方法也称为CRISPRi。在人类和酵母中,如果将dCas9蛋白与VP64或KRAB融合表达,会分别带来转录激活和转录抑制的作用。
CRISPR/Cas9系统具有非常广泛的应用,总体而言主要有四个方面的应用:
1.基因编辑(基因敲除/插入/替换/修饰);
2.基因表达调控(转录激活/抑制);
3.表观遗传学修饰;
4.基因组成像等
然而,CRISPR/Cas9系统也存在无法避免的短板,那就是脱靶效应(Off-Target),这种脱靶结合可能发生在sgRNA位点和可被替换的PAM区。但提高CRISPR/Cas9特异性的方法也应运而生,其中最重要的一个考虑因素就是选择合适的靶基因序列。
尽管如此,CRISPR/Cas9基因编辑技术为人类基因治疗领域带来了新的曙光,同时,更多的CRISPR系统在不断被发掘,更完美的基因编辑技术在路上……