当前位置:首页 > 杂谈 > 正文内容

三维基因组学研究的是什么?什么是 Hi-C 技术?为什么 Hi-C 技术这么火?(三维基因组结构模型)

2023-09-23 19:09:29TONY杂谈133

直系师兄一直在做染色体结构表观遗传和疾病之间的关系。前一段时间师兄让我在组会上分享关于三维基因组学的一些内容,部分内容整理如下:

首先介绍一下三维基因组学的诞生

我们知道我们所在的空间是一个三维空间,而不是一个二维平面的东西。我们的染色质也并不是平铺在我们的细胞核内,而是在空间内有一个立体的结构。我们在学习有丝分裂的时候会注意到染色质解螺旋变成染色体,而在平时就是高度螺旋化的状态。结构决定功能,这样高度螺旋化的空间结构势必会对生命体复杂的功能造成影响。

那么我们的染色质结构到底是什么样的呢?

下面我们来介绍真核生物中染色质的结构[1]

真核生物细胞核内染色质的结构

我们知道对于染色质结构的认识是非常漫长也非常复杂的:

我们从一级结构开始分析,在这一层面我们能够检测到的就是碱基序列的排布,也就是我们通常进行的基因组测序信息的分析,在这些序列上会有一些甲基化的修饰,这些修饰可以通过BS-seq检测到。

除了能够检测到的碱基序列和表观修饰之外,我们还发现DNA会缠绕在组蛋白八聚体上形成一个核小体结构,在核小体上面也会携带一系列的表观修饰,包括甲基化修饰或者乙酰化修饰等,这些组蛋白修饰可以通过ChIP-seq检测到。

我们知道这些核小体的分布在染色质的有一些地方是致密的有一些是疏松的,而疏松的地方会空出很多裸露的片段,这些裸露的片段恰恰就是转录发生的地方,也就是我们所谓的开放区域,这个开放结构我们可以通过ATAC-seq检测到。

再往上走,我们的染色质结构会缠绕成三维立体的高级结构,从电镜我们可以看到有些地方比较深,有些地方比较浅。这也就是我们所说的常染色质和异染色质。常染色质易被碱性染料染成浅色,常位于细胞核的中心,而异染色质易被碱性染料染成深色,常位于细胞核的边缘和核仁周围。

这些一系列的层次结构就组成了我们细胞核内的静态画面。

从以上的描述中,可以看到我们对于基因组的序列、表观修饰等方面都有了长足的认知。我们对基因组学的研究越来越深入,因此染色质的结构与基因组功能间的关系越来越成为大家关注的焦点,三维基因组学应运而生。

首先介绍一下三维基因组学的概念:它是基因组三维空间结构与功能研究的简称,旨在考虑基因组序列、基因结构、调控元件的同时,对基因组序列在细胞核内的三维空间结构,及其在基因转录、调控、复制和修复等生物过程中的功能进行研究。

三维基因组学的进展史也可以说是我们对于染色质结构分辨率的不断提升的过程,最开始我们认识到染色质在细胞核内分布的并不是随机分布的,而是不同染色体占据不同的空间。这就是所谓的CT疆域(chromosome territories)。

随着染色质构建捕获技术(看的是染色体上不同位点的相互作用)的不断发展,从3C-4C-5C-Hi-C。最早的3C只能研究一个位点对另外一个位点的相互作用(一对一)。而后又发展出了4C(一对全),5C(多对多),Hi-C(全对全)等技术。

三维基因组技术发展图

不同技术的比较:

我重点介绍一下Hi-C技术。

什么是Hi-C,Hi-C (High-through chromosome conformation capture) 是以整个细胞核为研究对象,利用高通量测序技术,结合生物信息分析方法, 研究全基因组范围内整个染色质DNA在空间位置上的关系, 获得高分辨率的染色质调控元件相互作用图谱。

Hi-C技术的流程[2]

用甲醛对细胞进行固定,使 DNA 与蛋白,蛋白与蛋白之间进行交联(图中DNA片段:蓝色,红色。中间的环状的是protein);进行酶切(HindIII),使交联两侧产生粘性末端;末端修复,引入生物素标记,连接;解交联,使 DNA 和蛋白、蛋白和蛋白分开,提取DNA,打断,捕获带有生物素标记片段,进行建库;高通量测序

Hi-C的数据分析流程:

前期raw reads过滤(跟一般二代测序数据处理基本一致)序列比对。建议采用pair-end模式定位酶切位点。比对寻找到reads pairs在基因组物理位置之后,通过插入片段大小的限制搜索reads pairs两端每条read所对应的最近的酶切片段。酶切片段的位置代表了DNA交互产生的大致位置筛选出有效的比对片段。配对的reads位于酶切位点两端且mapped的方向相反整合DNA片段交互强度。DNA片段交互矩阵标准化。compartments分析TAD分析显著互作分析

常用软件:

通过技术的不断发展,人们对染色质空间结构的认知不断加深。我们发现了A/B compartments、TAD和loop结构。A/B compartments的划分是根据染色质的活性来划分的。

A compartments:开放的染色质,表达活跃,基因丰富,具有较高的GC含量,包含用于主动转录的组蛋白标记,通常位于细胞核的内部。B compartments:关闭的染色质,表达不活跃,基因缺乏,结构紧凑,含有基因沉默的组蛋白标志物,位于核的外围

在染色质区室中,我们还会发现互相作用相对频繁的基因组区域,这些就是拓扑相关结构域 TAD。

在哺乳动物基因组中,TAD通常由CTCF这个转录抑制因子给分割开来。CTCF还会和Cohesin蛋白复合物结合,帮助基因组形成相对稳定的三维结构。正由于此,两个TAD之间的转录活性是非常低的(转录需要打开DNA),而结合CTCF等转录抑制因子的DNA元件,也被称为insulator(绝缘子)。

在TAD内部是非常活跃的。CTCF在帮助基因组DNA凹造型的同时,把DNA元件给绑到了一起。而这样相互作用的元件,通常是enhancer(增强子)和promoter(启动子),他们往往分布在相距很远的染色质区域,却因为CTCF蛋白在三维空间中聚集在一起,我们把这种结构称之为loop[3]

我们进一步从空间结构上来认识loop、TAD和compartments之间的关系[4]

compartments内有很多活跃的区域构成了很多的TAD,TAD内有loop。

因此我们通过Hi-C分析三维基因组时常常是从loop、TAD和compartments三个层次的拓扑结构来进行解析。

下面得到的是Hi-C中最经典的一张图:染色体位点互作图

Hi-C染色体位点互作图

红色代表位点间相关作用强,依次我们会有一些认知:蓝色是A区室,黄色是B区室。不同compartments之间的相关作用是比较低的,更多的是compartments内部的相关作用。

红色区域也就是活跃区域就是我们所谓的TAD区域,就是图中放大了的三角形。每一个三角形是一个TAD。不同的TAD区域之间更多是独立的。因此对于TAD的边界定义是非常重要的。真核生物TAD边界通过会有CTCF蛋白结合,如果边界不能结合CTCF蛋白,也就意味着边界的模糊和损坏,不同的TAD之间的相关作用就会增强,就可能会发生一个TAD内某些不应该被表达的基因被另外一个的enhance激活[5]

Joanna Achinger-Kawecka;Epigenomics (2017) 9(1), 47–55

绿色代表enhancer,粉色圆圈代表TAD边界的CTCF结合位点,棕色代表promoter。红色长方形代表癌基因。

Darío et al. 2015, Cell

如上图所示,手指发育畸形就与TAD边界的缺失有关。

其他Hi-C分析常见的图片:

cis/trans互作比例:染色体间和染色体内的互作关系图

哺乳动物内染色体内部的互作要远远大于染色体间的互作,如果发现染色体间的互作更大,很可能发生了一些融合或者其他的现象。

compartments

进行区室外之间的互作关系分析:不同区室之间的互作关系是比较弱的,如果发生了区室间的相关作用,是否考虑区室的偏移问题。

TAD分析

结合ChIP-seq可以分析TAD的边界以及TAD内部相关作用。

Hi-C技术应用:

解析全基因组互作模式辅助基因组组装宏基因组学研究基因组分型分析……

参考

^Yadav et al. 2018, Science^Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome. Erez Lieberman-Aiden et al. science 2009^Rao et al. 2014, Cell^Large-Scale Topological Changes Restrain Malignant Progression in Colorectal Cancer^Darío et al. 2015, Cell

“三维基因组学研究的是什么?什么是 Hi-C 技术?为什么 Hi-C 技术这么火?(三维基因组结构模型)” 的相关文章

卢布成为 2022 年走势最强的货币,这主要是受到哪些因素的影响?

卢布成为 2022 年走势最强的货币,这主要是受到哪些因素的影响?

(以下内容为机翻,如有翻译问题欢迎指正,同时原文中的超链接都会保留,以便有兴趣的人点击查看) https://meduza.io/feature/2022/05/13/kurs-rublya-rastet-uzhe-poltora-mesy...

抖音小店登录入口在哪儿?如何登录?新手开店登录教程

抖音小店登录入口在哪儿?如何登录?新手开店登录教程

大家好,我是电商糖果 很多人看上了抖音电商的强大变现能力,都想入驻这个平台,但是有不少新手朋友却找不到抖音小店登录入口在哪儿,也不知道如何登录。 今天,糖果就来给大家详细的讲解一下,想开店或者准备开店的朋友,记得收藏。 抖音小店登录入口在哪儿? 我...

比Scholarscope功能更强大,这款插件与PubMed是绝配

比Scholarscope功能更强大,这款插件与PubMed是绝配

今天在逛浏览器扩展插件等网站时,发现一个不错的浏览器插件——EasyPubMed插件。看名字就可以猜到,这个插件跟PubMed有关。我看了下插件功能介绍,发现这个插件功能超级强大,简直可以称为PubMed最强插件。下面我们看看这个插件到底有哪些功能?1. 安装插件首先我们先来安装下这个插件。在安装之...

秦怡被确诊了肠癌,医生直言“活不久”,结果98岁仍容光焕发

秦怡被确诊了肠癌,医生直言“活不久”,结果98岁仍容光焕发

"世界上最大的勇气,是压力下的优雅。"——海明威 世界上始终存在一种声音让大家以生命的长度作为评价人生价值的标准,但有些人二十岁的年纪就已经让旁人感受到了生命力的枯竭,而有些人即使已经高龄近百,仍然绽...

原创
            剧本杀《给某某》复盘解析+剧透结局+凶手是谁+真相答案

原创 剧本杀《给某某》复盘解析+剧透结局+凶手是谁+真相答案

原标题:剧本杀《给某某》复盘解析+剧透结局+凶手是谁+真相答案 人数:6人 类型:现代 情感 欢乐 还原 发行:谜团 时长:4-5小时 一、《给某某》 剧本杀复盘故事简介 青少年的烦恼像野草一样茂盛,无穷无尽。只有梧桐和风听到过,...

高速路道路救援拖车需要多少钱

高速路道路救援拖车需要多少钱

需要说明的是普通汽车不得在高速公路拖拽牵引其他车辆,因为以这种方式拖车无法进行中高速驾驶,后车总是无法正常制动或者观察道路情况的;而应急车道并不允许行驶,只是供故障车辆临时维修可以快速解决的问题使用。所以“车拖车”是不允许操作的 1.高速发展公路进行救援收费管理标准按车型...