欢迎访问河北健海生物 北京健海华创生物科技有限公司官网!

400-660-7557
  •  
  •  

联系我们

客服电话:400-660-7557
技术服务:0311-66685383
公司地址:河北省石家庄市高新技术开发区黄河大道136号科技中心12F

您现在的位置:网站首页科研服务DNA类重测序 > 目标区域测序
  • 项目名称: 目标区域测序

概述

  目标区域测序(Target region sequencing)是通过定制感兴趣的基因组区域的探针,与基因组DNA进行杂交,将目标区域DNA富集后进行高通量测序的研究策略。通过对大量样本的目标区域研究,有助于发现和验证疾病相关候选基因或相关位点,在临床诊断和药物开发方面有着巨大的应用潜力。

技术优势

  1. 研究区域明确:针对感兴趣的区域及相关基因进行研究;

  2. 性价比高:非常适合大样本量及高深度研究;

  3. 应用范围广:临床检测,大量验证,各种疾病类研究;

  4. 更加全面的数据库注释:目前我们已全面更新升级了目标区域信息分析流程和结题报告,添加了CancerGeneCensus、Encode、ESP(6500 Exome)等数据库注释,使得疾病的变异检测解析更加全面;

研究内容

一、标准信息分析

  1. 去除接头污染和低质量数据

  2. 数据通过BWA与UCSC hg19数据库进行比对

  3. 数据产量统计分析、测序深度分析、覆盖度均一性分析

  4. SNP变异信息检测(SAMtools、SOAPsnp、GATK)

  5. SNP的RefGene注释

  6.  SNP数据库分析(与dbSNP、千人基因组数据、ESP外显子组数据库以及炎黄基因组(仅亚太地区)数据进行数据库注释分析)

  7. 单样品SNP保守性预测、致病性分析(仅针对人类样本,软件:SIFT、Polyphen-2、Phylop、GERP scores、Mutation assessor、Condel、FATHMM) 

  8. SNP在各基因功能元件上的分布统计

  9.  InDel变异信息检测(SAMtools、GATK)

  10.  InDel的RefGene注释

  11.  InDel数据库分析(与dbSNP 、千人基因组数据、ESP外显子组数据库、炎黄基因组(仅亚太地区)进行数据库注释分析)

  12.  InDel在各基因功能元件上的分布统计

  注:SIFT、Polyphen-2、Phylop、GERP scores、Mutation assessor、Condel、FATHMM这几个数据库的分析仅针对人类样本。 

二、 高级信息分析(仅针对人类样本)

1、 通用高级分析

  1) 非编码区SNP的注释分析(基于ENCODE数据库进行注释分析)

  2) 非编码区InDel的注释分析(基于ENCODE数据库进行注释分析) 

2、 肿瘤高级分析

  1) 基于质谱的case/control样品成对初步鉴定(建议在测序前进行,需要额外增加约2周时间)

  2) 成对样品的 Somatic SNV检测、注释及统计(与dbSNP、千人基因组数据、ESP外显子组数据库、炎黄基因组(仅亚太地区)进行数据库注释分析)

  3) 成对样品的Somatic InDel检测、注释及统计(与dbSNP、千人基因组数据、ESP外显子组数据库、炎黄基因组(仅亚太地区)进行数据库注释分析)

  4) 成对样品SNV/InDel的COSMIC数据库注释分析

  5) 成对样品SNV的保守性预测(SIFT、Polyphen-2、PhyloP、GERP score、Mutation assessor、Condel、FATHMM)

  6) 影响氨基酸改变的突变基因的CancerGeneCensus数据库注释分析 

3、 复杂疾病高级分析

  1) 样本设计以及power计算(项目设计阶段)

  2) 群体SNP检测和基于连锁不平衡(LD)的Genotype分型检测

  3) SNP 注释与统计(与OMIM和ENCODE数据库进行注释分析)

  4) 群体SNP质控(base quality,map quality,allele balance,strand bias,mappability,homopolymer,Hardy-Weinberg Equilibrium测试,InDel附近的SNP过滤)

  5) 基于遗传数据的样本质控:亲缘关系检测,基于近交系数的样本污染检测,PCA群体分层检测

  6) 基于单个SNP的关联分析

  7) eQTL分析(基于HapMap数据库进行注释分析) 

4、 群体进化高级信息分析

  1) 群体SNP检测,注释与统计

  2) 群体SNP质控(base quality,map quality,allele balance,strand bias,mappability,homopolymer,Hardy-Weinberg Equilibrium测试、InDel附近的SNP过滤)

  3) 基于参考单体型集合(HapMap/1000Genomes)的基因型推断和单体型定相

  4) 基于遗传数据的样本质控:亲缘关系检测,基于近交系数的样本污染检测

  5) 选择分析,可选择方法有:iHS,XP-EHH,DDAF,FST,Tajima's D,PBS等

  6) GO功能注释分析,KEGG和PANTHER通路富集分析(可选;GO功能注释分析默认做,通路富集分析需要基因集基于通路筛选的可做)

 5、 单基因病高级信息分析

  1) 性别判断

  2) 筛选影响功能元件的变异(优先考虑nonsynonymous SNP (nonsense, missense), frameshift indel, cds-indel;选择性的考虑非编码区部分注释为启动子、增强子、转录因子结合位点、DNA酶敏感位点的变异)

  3) 筛选出的突变与已知数据库的注释和过滤(1000Genomes(1092),Hapmap、ESP(6500 Exome),PVFD)(需选择是否基于单基因病高级分析第2条)

  4) Case共有的突变筛选(需选择是否基于单基因病高级分析第 2,3条)

  5) HMM 预测(患者的样本量需两个以上,不适用于患者亲缘关系为父子/父女/母子/母女的情况,三代及以上家系效果更佳)

  6) SIFT 保守性预测(基于单基因病高级分析第 2、3、4条)

  7) GO功能注释分析和KEGG通路富集分析(基于单基因病高级分析第 2、3、4条)

  说明:4、5、6、7条原则上只提供给合作项目,服务项目若要提供相关分析,需与业务线联系定制化信息分析 

6、 复杂疾病定制化分析(适用于大样本量,建议至少200对case & control以上)

  1) Gene-based的关联分析(CMC,SKAT-O,WSS,KBAC,Collapse)

  2) 候选基因优化筛选

  3) 候选SNP的条件分析

  4) 候选位点附近的LD分析及基于单体型域的单体型关联分析

  5) GO功能注释分析和KEGG通路富集分析(可选;GO功能注释分析默认做,通路富集分析需要基因集基于通路筛选的可做)

  6) 基于代谢通路的交互分析(两交互或者多交互)(可选,默认不做;如果基因集是基于通路筛选的可做)

  7) ROC曲线与遗传方差解释

  8) eQTL 分析(基于HapMap数据库进行注释分析)

  9) 群体CNV检测,注释与统计

  10) CNV关联分析(Merge & Split) 

7. 基于家系样本的de novo mutation分析

  1) De novo SNV检测,注释与统计

  2) De novo InDel检测,注释与统计

  (以下条款适用于多个家系,建议至少30 trios或10-20 quads以上)

  3) De novo SNV,InDel与疾病的关联分析

  4) GO功能注释分析,KEGG通路富集分析,以及蛋白关联分析等

  5) De novo SNV突变父母来源判断

研究案例和参考文献

1. 目标区域测序在上万个样本的稀有突变频率研究中的应用
  An Abundance of Rare Functional Variants in 202 Drug Target Genes Sequenced in 14,002 People. Science. 2012
案例描述:
  众所周知稀有碱基突变(MAF<0.5%)与复杂疾病密切相关,但是人类的稀有突变频率到底是多少呢?该文献中对14,002个样本的202个药物靶点基因的exons进行了目标区域测序来研究稀有突变频率等。
结论:
  结果发现,突变数量是相当可观的,每17个碱基就有一个是稀有突变;并且存在地理位置特异性,即使有如此庞大的样本量,稀有突变的数量仍然不完全。此外该文献中指出由于群体的快速增长和弱化的进化选择,使得人类群体藏有大量的稀有突变,其中大部分是有害突变并且与复杂疾病之间有关联。

2. 目标区域测序在大样本量中SNP检测及验证的应用
  A large-scale screen for coding variants predisposing to Psoriasis. Huayang Tang,, Xin Jin,Yang Li. et al.NG.2827(2013).
案例描述:
  为了研究编码区变异对银屑病的影响,本文献做了WES和TRS。首先通过对781个case和676个control检测到了 133个非同义的SNV(过滤了MHC区域的SNV);其次,对得到的133个位点,以及收集了1326个基因,总共区域大小3.2Mb进行了目标区域测序捕获。
结论:
  最终通过TRS发现了大量的稀有突变,通过GWAS分析,只有2个低频突变与银屑病有轻微的关系;并没有在编码区发现与银屑病有较大贡献的低频或者稀有突变。

3. 目标区域测序在疾病诊断研究中的应用
  Targeted Next-generation Sequencing as a Comprehensive Test for Patients With and Female Carriers of DMD/BMD: a Multi-population Diagnostic Study. European Journal of Human Genetics. Doi: 10.1038/ejhg. (2013).
案例描述:
  DMD/BMD(肌营养不良症)是典型的遗传病。由于该基因很大,迄今为止,还没有什么方法可以进行有效准确的分子检测。本文献中针对该基因的79个外显子,78个内含子,8个promoters总共2.5Mb的区域进行了目标区域捕获测序。检测了352例病人,包含89例病人,18个女性携带者和245例非DMD的病人。
结论:
  与传统方法比较,目标区域测序的检测特异性是99.99%,CNV检测的敏感性是98.96%,SNV检测的准确性是100%。因此,目标区域测序可以作为DMD基因检测的有效方法,可以为临床治疗提供更有意义的临床信息。

[1] Nelson MR, Wegmann D, Ehm MG, et al. An Abundance of Rare Functional Variants in 202 Drug Target Genes Sequenced in 14,002 People. Science. (2012).
[2] Huayang Tang, Xin Jin,Yang Li. et al. A large-scale screen for coding variants predisposing to Psoriasis.NG.2827(2013).
[3] Targeted Next-generation Sequencing as a Comprehensive Test for Patients With and Female Carriers ofDMD/BMD: a Multi-population Diagnostic Study. European Journal of Human Genetics. Doi: 10.1038/ejhg. (2013).

技术参数

样品要求

  样本总量:≥ 0.5 µg DNA(提取自新鲜及冻存样本)
                 ≥ 1.0 µg DNA(提取自FFPE 样本)

  样品浓度:≥ 20 ng/μl
测序平台
  HiSeq X PE150 或者 HiSeq 4000 PE150
测序深度

  200X(平均有效测序深度)

  可根据老师研究目的进行更高深度测序
项目周期
  定制探针70 天,建库测序分析30天

技术流程