原始 DNA 数据是一切探索的起点

DNA 原始数据,是每个人恒久不变的「源代码」,也是一切解读的基础。各色所有的先天倾向解读报告,都是基于 DNA 数据做出的推论。

包括各色科技在内的大部分消费级基因检测公司,一次性提供了两种服务:

(1)实验室分型,获得你的 DNA 原始数据;

(2)根据你的原始数据,提供解读或其他服务。

 

* 重要提醒:消费级基因检测是价格低廉的个人 DNA 数据探索方式,并不具备临床诊断的功能。使用科研级基因芯片获得一份高质量的 DNA 原始数据,并随研究探索不断获得最新的研究结论,是消费级基因检测最重要的价值。

怎样获得我的 DNA 原始数据?

各色为所有用户提供 DNA 测序原始数据。你可以发邮件到 dna@gesedna.com,告知你在有赞微店下单的收件人手机号、姓名、以及你在各色官网的个人主页截图备注「570万」

我们确认后,会在 5 个工作日内将 DNA 数据发给你。

随着科学研究不断进步,你的 DNA 中会有更多信息得到解读。同时,各色会不断介绍国内外适合你探索原始数据的平台,更好为你提供持续服务。

 

了解你的570万 DNA 原始数据

各色过去使用的 GSA ( Globle Screening Array) 和 目前升级的 ASA (Asian Screening Array)芯片都基于 Illumina 平台,始终同步国际最高水准,检测准确率达到 99% 以上。

 

ASA 各色联合定制版

 

ASA 芯片上市于2017年底,是 Illumina 公司第一次专为亚洲人设计和研发的芯片。这款芯片可以检测 75 万位点,其中 70 万位点 Illumina 已经设计完成,其他位点可以联合定制。

ASA 各色联合定制版,是国内第一款基于 ASA 定制芯片的消费级基因检测产品。各色参与定制了 3 万 + 心理和健康相关位点,这款芯片于201810月正式交付使用。

各色联合定制版 ASA 芯片,一次可检测 75 万 + 原始位点,并且通过数据扩展再得 500 万+ 位点,考虑到低廉的价格,是入门基因数据探索的不二之选。

这 75 万个原始检测位点是 Illumina、各色和多个科研机构共同挑选集成。

  • 基因组骨架设计参考 9000 名亚洲人的全基因组测序数据,检测专属亚洲人的基因差异。
  • 参考 GWAS Catalog,PharmGKB,OMIM,Clinvar 等成熟权威基因-表型数据库,选择与疾病、用药和人类复杂特征相关的典型位点。
  • 重新梳理亚洲人的基因研究,纳入已发现效应位点。
  • 更适合亚洲人的质控位点设计,性别、血型和祖源等标识性位点,保证数据样本可验证。

除此上述 Illumina 设计的相关位点,为了给用户提供更丰富的心理学相关特征解读,推动领域发展,各色参与定制了 3 万+ 心理和健康相关的位点,尽可能多的涵盖与认知功能、精神健康、人格特质和社会性发展的多个基因的重要位点。如:

  • COMT 基因—— 与多巴胺的代谢息息相关,涉及记忆、情绪和社交多项特征。
  • BDNF 基因——脑源性神经营养因子基因,涉及神经发育、认知能力和情绪多项特征。
  • OXT 和 OXTR 基因——催产素相关基因,涉及共情和利他等社交多项特征。
  • APOE 基因—— 参与脂蛋白的代谢,涉及阿兹海默症等神经系统疾病。

在 75 万原始检测数据的基础上,我们研发团队使用隐马尔可夫(Hidden Markov Model, HMM) 模型,利用全基因组数据作为参考数据集,针对各色用户的测序数据进行了扩展,明确了模型参数与每个用户的每个位点准确率相关关系。

最终,我们使用高性价比和准确率高达 98% 的方式,获得了最能代表人与人差异的 570 万位点。

这就意味着,不需要花钱就能多测 500 万位点。今后,我们会依据这570 万位点,给大家带来更丰富的检测性状和解读。

拿到DNA数据后可以做什么?

这里,我们列出了一个小清单,助你升级成为「高阶 DNA 数据玩家」。

首先,你的原始数据可以上传到其他解读平台。国外有一些提供原始数据上传的平台,比如著名的 「GEDmatch」网站,上传数据后能看到你的祖源和其他一些解读。

https://www.gedmatch.com

其次,你可以在 DNA 百科网站—— SNPedia 查到很多关于基因位点的信息。

https://www.snpedia.com

提供免费的和身体健康相关解读,界面友好,上传数据即可。

https://codegen.eu

此外,各色正在积极洽谈解读合作方,争取为用户提供更多解读可能。

 

我对数据和文献有疑问

各色的每个基因位点的选择都有相关研究支持。纳入各色参考数据库中的每篇文献,都是在阅读该领域大量文献基础上,挑选最新/最权威文献得来。各色还会通过定期文献检索,更新文献数据库,优化相关解读。

但由于这一领域研究快速发展,如果你是一个专业研究人员,或者基因数据发烧友,我们欢迎你来帮助我们一起完善优化解读。有任何关于基因解读的想法建议与勘误,请发送至邮箱:service@gesedna.com ,我们的科学研究团队会在两个工作日内回复。

 

各色参考文献和DNA数据库来源(部分):

NCBI : [National Center for Biotechnology Information](https://www.ncbi.nlm.nih.gov)

Springer : [Home – Springer](https://link.springer.com)

Elsevier  : [ScienceDirect.com| Science, health and medical journals, full text articles and books.](http://www.sciencedirect.com)

Nature  : http://www.nature.com/siteindex/index.html

PNAS  :  [Proceedings of the National Academy of Sciences](http://www.pnas.org)

Science : [Journals | Science | AAAS](http://www.sciencemag.org/journals)

PsycARTICLES : [PsycARTICLES](http://www.apa.org/pubs/databases/psycarticles/)

Ensembl :  [Ensembl genome browser 91](http://asia.ensembl.org/index.html)

Catalog : [GWAS Catalog](https://www.ebi.ac.uk/gwas/)

 

以抑郁为例,各色使用基因解读参考文献如下所示:

Gatt, J. M., Nemeroff, C. B., Dobson-Stone, C., Paul, R. H., Bryant, R. a, Schofield, P. R., … Williams, L. M. (2009). Interactions between BDNF Val66Met polymorphism and early life stress predict brain and arousal pathways to syndromal depression and anxiety. Molecular Psychiatry, 14(7), 681–695.

Tozzi, L., Carballedo, A., Wetterling, F., McCarthy, H., O’Keane, V., Gill, M., … Frodl, T. (2015). Single Nucleotide Polymorphism of the FKBP5 Gene and Childhood Maltreatment as Predictors of Structural Changes in Brain Areas Involved in Emotional Processing in Depression. Neuropsychopharmacology, (May).

Mekli, K., Payton, A., Miyajima, F., Platt, H., Thomas, E., Downey,. (2011). The HTR1A and HTR1B receptor genes influence stress-related information processing. European Neuropsychopharmacology, 21(1), 129–139.

Detainees, J. (2008). Association Between Polymorphisms in the Dopamine Transporter Gene and Depression. Psychological Science, 19(1), 62–69.

Caspi, A., Sugden, K., Moffitt, T. E., Taylor, A., Craig, I. W., Harrington, H., … Poulton, R. (2003). Influence of life stress on depression: moderation by a polymorphism in the 5-HTT gene. Science (New York, N.Y.), 301(5631), 386–389.

Kim, J. M., Stewart, R., Kim, S. W., Yang, S. J., Shin, I. S., Kim, Y. H., & Yoon, J. S. (2007). Interactions Between Life Stressors and Susceptibility Genes (5-HTTLPR and BDNF) on Depression in Korean Elders. Biological Psychiatry, 62(5), 423–428.

Ke, L., Qi, Z. Y., Ping, Y., & Ren, C. Y. (2006). Effect of SNP at position 40237 in exon 7 of the TPH2 gene on susceptibility to suicide. Brain Research, 1122(1), 24–26.

Power, R. A., Tansey, K. E., Buttenschøn, H. N., Cohen-Woods, S., Bigdeli, T., Hall, L. S., … & Teumer, A. (2017). Genome-wide association for major depression through age at onset stratification: Major Depressive Disorder Working Group of the Psychiatric Genomics Consortium. Biological psychiatry, 81(4), 325-335.

Kohli, M. A., Lucae, S., Saemann, P. G., Schmidt, M. V., Demirkan, A., Hek, K., … & Hoehn, D. (2011). The neuronal transporter gene SLC6A15 confers risk to major depression. Neuron, 70(2), 252-265.

 

以抑郁为例,各色研发过程如下所示:

一、明确概念和遗传率。

抑郁是什么,在人群中的遗传率有多高(约50%)。

二、梳理文献和综述,深入理解目前关于抑郁基因的研究模式。

候选基因研究:根据以往研究经验,发现五羟色胺与抑郁有关,研究者进一步假设,与五羟色胺代谢相关的基因与抑郁相关。研究者会选择一些位点进行研究,发现一些结论。

全基因组关联分析研究:候选基因研究不能发现新的基因位点,全基因组关联分析研究是数据驱动研究,在更大的基因数据和表型数据中,寻找效应位点。

基因和环境交互研究:抑郁作为一种情绪,和生活环境和个人经历息息相关,基因和环境的交互研究发现在不同的环境中,与抑郁相关的基因表达程度不同。

三、 综合以上的探索,开始挑选基因位点。

1. 研究对象是不是中国人。如果是中国人或者东亚人的研究质量较好,优先选择,但是很遗憾,这部分的研究不是很多。

2. 成熟的,经过多次重复研究验证的候选基因研究。例如 BDNF 基因 rs6265 位点,在研究中多次发现与抑郁显著相关。 例如,Kim, J. M., Stewart, R., Kim, S. W., Yang, S. J., Shin, I. S., Kim, Y. H., & Yoon, J. S. (2007). Interactions Between Life Stressors and Susceptibility Genes (5-HTTLPR and BDNF) on Depressionin Korean Elders. Biological Psychiatry, 62(5), 423–428.

3. 全基因组关联分析研究,寻找效应最高的几个位点。通过统计中的p值或者or值可以选择,or值越大,p值越小,效应越高。例如我们选择的rs7647854,是这项研究 【Power, R. A., Tansey, K. E., Buttenschøn, H. N., Cohen-Woods, S., Bigdeli, T., Hall, L. S., … & Teumer, A. (2017). Genome-wide association for major depression through age at onset stratification: Major Depressive Disorder Working Group of the Psychiatric Genomics Consortium. Biological psychiatry, 81(4), 325-335.】效应最高的点。这是摘要中结果部分:“We identified one replicated genome-wide significant locus associated with adult-onset (>27 years) MDD (rs7647854, odds ratio: 1.16, 95% confidence interval: 1.11-1.21, p = 5.2 × 10-11). ”

4. 选点还要兼顾国内外差异。例如有个效应位点,在中国人群中分布不好,100%的中国人都是同一类型,那我们也不会选择,这对中国人没有意义。

5. 这些选点是否在各色目前检测的570万基因位点范围内。如果这一位点各色没有检测,我们也无法纳入到解读位点中。

6. 这些位点之间是否存在连锁不平衡效应。如果有的话,需要予以排除。

四、最后的综合算法。

目前主要的算法是计算 Polygenic Risk Scores,即基因效应累加模式。这一模式在很多研究中显示了较高的预测力。各色会根据研究中的效应量,对位点附上不同的权重,从而得到综合预测结果。

这一算法的介绍如下:

Dudbridge, F. (2013). Power and Predictive Accuracy of Polygenic Risk Scores. PLOS Genetics, 9(3).

这一算法在抑郁中的示例如下:

Power, R. A., Tansey, K. E., Buttenschøn, H. N., Cohen-Woods, S., Bigdeli, T., Hall, L. S., … & Teumer, A. (2017). Genome-wide association for major depression through age at onset stratification: Major Depressive Disorder Working Group of the Psychiatric Genomics Consortium. Biological psychiatry, 81(4), 325-335.

五、划分用户。

每个用户都会得到自己在抑郁特征上的综合得分,各色根据得分,参考抑郁特征在人群中实际表现的分布,将人群划分为5类,给予5个不同程度标签,提供不同解读。

最终完成一次基因产品的开发。

各色开发产品的第一原则就是准确。

(1)基因研究模式较多,涉及大量位点,各种研究结论的输出的DNA格式也不统一,所以阅读相关文献,找到效应位点,需要对此类研究非常熟悉,以及了解相关的质控方法。

(2)针对一个基因位点的解释,不能只看一篇文献的结论,要看关于这个位点大部分研究的结论是什么,然后做出判断。

比如关于抑郁的一个参考位点 rs1360780,按照多数研究,携带T会增加抑郁的风险,TT型应该属于抑郁风险更高的人群。这个结果是经过多篇研究结论重复得出的,是更准确的结论。

我们公开所有的参考文献和挑选位点,欢迎专业人士的挑剔性阅读。

我还有问题

有任何问题,也可以添加微信人工客服-各色小助手,微信号: hellogese

祝你探索愉快:)

 

Close
Go top