TCGA癌症临床数据资源全面介绍---癌症研究科技领域的全谱!

2021-12-27 11:00 来源:桂林妇科医院

2006年,胃癌症DNA三幅谱(The Cancer Genome Atlas, TCGA)开发计划以多形特质外膜母细胞膜腺(GBM)、胃鳞状细胞膜癌症(LUSC)和卵巢浆液特质囊肝癌症(OV)开始为期3年的试点工程项目,2009年~2015年全面展开。到工程项目截止,TCGA网络研究工先为工先为者已描绘了33种胃癌症特特质10,000余例症状的小分子形态,并并不一定了很多小分子共通点。TCGA包含的确诊关键形态代详见泛化的数据数据抽取。为确保应该常用这些具DNA形态的海量确诊数据数据,都只TCGA已完成一批重大成果,发详见在CellPress旗下的期刊。

本文对4月底5日发详见Cell上的一文透过编译。撰文探讨以OS(总求生存期)、PFI(无成效有数隔)、DFI(无病有数隔)和DSS(性疾病相关幸存)为四个主要确诊结果往南的TCGA泛胃癌症确诊数据数据人力资源(TCGA-CDR)规范数据数据库,并给出新了每种胃癌症特特质的往南常用建议。TCGA确诊数据数据可从DNA数据数据共享空有数(GDC)门户网站完整版,所有的小分子数据数据在完整版。确诊数据数据和小分子数据数据常用正因如此的条码结构,便于症状的确诊数据和检验小分子数据数据建构。

TCGA泛癌症数据数据库队列形态

三幅1A为确诊数据数据建构和研究分析方法及4个主要确诊往南派生和审核的三幅例,对33份初始登记和97份后续数据数据文件,共33种胃癌症特特质111,60例胃癌症症状的数据透过了检视。详见1为每个TCGA队列的基本形态。按原发检验根据小分子形态选入每个队列,详见皮黑色素腺(SKCM)的原发和移到灶两种特特质都有,其它极少数的原发与移到特特质也有研究工先为。

三幅1. 确诊数据数据建构和研究分析方法及4个主要确诊往南派生和审核三幅例

详见1. TCGA 泛癌症队列形态

确诊结果往南OS、PFI、DFI和DSS

总求生存期(OS)很举足轻重,优点是并不一定OS意外事件时模糊特质最低。但常用OS先为往南可能会压制确诊研究工先为,因为非癌症活着因不一定能反映出新心灵体化学、蹂躏特质或对化疗缓解。常用OS或才可更慢的随访一段时有数;很多确诊试验中所,通常使用相对于随访一段时有数略长的DFI或PFI。针对现有TCGA确诊数据数据,要预见短时确诊随访有数隔在蹂躏特质胃癌症特特质结果的举足轻重特质,因为可能会几年内就检视到确诊意外事件,在活着亡从前已出新现身体状况复发或成效。对蹂躏特质较弱的胃癌症特特质,症状在数十乃至几十年后复发,随访期有数可能会无法检视能够意外事件以拥护有用结果供判断。该研究的目的是健康检查TCGA泛癌症确诊侦测的相对于优势和太少,指导更进一步的研究和避免随访有数隔一段时有数太少等缺陷。

研究全部TCGA确诊数据数据后,结论如下:在数据数据可取得时,OS、PFI及DFI相对于精确,但多数情况下情况下大约DSS。三幅1B为33种不尽相同胃癌症特特质的OS K-M椭圆。尽管求生存研究不是TCGA主要最大限度,多数胃癌症特特质求生存椭圆与依然审核相同求生存往南的独立国家研究工先为基本相同,GBM、OV(2008, 2011)和低级别外膜腺(LGG)(2015)的TCGA结果就是最出色例证。PFI、DFI和DSS的K-M椭圆见三幅1C–1E。

三幅1 B-E确诊数据数据研究

基于每种胃癌症特特质4个往南的检视一段时有数计算平均随访一段时有数及意外事件或健康检查的中所位一段时有数(详见2)。所有的中所位随访一段时有数为22.1个月底,但不尽相同特特质胃癌症该一段时有数顶多异性极大;GBM和急特质髓系白血病(LAML)最短约12个月底,而肾嫌色细胞膜癌症(KICH)长达约48个月底。

详见2 总体中所位随访一段时有数及4个往南的意外事件与检视中所位一段时有数

自荐常用的确诊结果往南

确诊结果往南选择远大于研究工先为最大限度、意外事件量、队列大小和结果数据数据量级。将这些分析方法和开发的其它分析方法先为为对单个性疾病数据数据库的检验和补充健康检查,给出新在每种性疾病特特质中所常用每个结果往南的建议及可能会(详见3)。每种胃癌症特特质的求生存往南才可要至少通过一个主要检验和补充健康检查才被接纳。33种癌症中所的13种常用全部4个往南:膀胱尿路上皮癌症(BLCA)、子宫颈鳞状细胞膜癌症(CESC)、大肠癌症(COAD)、食管癌症(ESCA)、头颈部鳞状细胞膜癌症(HNSC)、肾状细胞膜癌症(KIRP)、胃肝癌症(LUAD)、LUSC、OV、胰肝癌症(PAAD)、肉腺(SARC)、胃肝癌症(STAD)和子宫内膜癌症(UCEC)。相反,并未曾一个往南的有嗜铬细胞膜腺和副皮质腺(PCPG)。内膜满布大B细胞膜内膜腺(DLBC)、LAML和胸腺腺(THYM)至少一个往南;一小胃癌症特特质2或3个往南,但其中所一些所持保留发表意见。最有用的是PFI,可无保留地自荐给除LAML(无数据数据)、DLBC和KICH(谨慎常用)和PCPG(不自荐)均的4种。

详见3 往南OS,PFI,DFI及DSS的审核与自荐常用

可验证TCGA-CDR及案例系统设计

在结核病研究工先为中所,雌激素ER阴特质症状确诊求生存期肾功能比ER+症状顶多。分别用OS、PFI、DFI和DSS非常这两类症状的求生存期(三幅3A–3D;椭圆截止于10年随访一段时有数,但常用整个数据数据库透过研究)。单因素研究显示,常用PFI(p= 0.005)和DFI(p = 0.001)先为为确诊往南,TCGA中所ER+乳腺胃癌症状比ER-症状有很好的求生存期,但常用OS时两类症状有数不发挥作用顶多异性(p = 0.097) 。此均,两类症状的DSS(p = 0.009)有明显顶多异性,详见明DSS的潜在价值。以上发现证明了PFI和DFI是特定特特质结核病小分子研究工先为的适当往南。

三幅3 可验证和系统设计重构

此均还可验证了蹂躏特质GBM求生存结果往南。TCGA中所GBM中所位OS为12.6个月底,介于在此之从前报道的规范疗的12.1个月底和规范疗联合行动替莫唑胺的14.6个月底之有数。中所位PFI是6.1个月底,介于在此之从前报道的规范疗5个月底和规范疗联合行动替莫唑胺的6.9个月底之有数。只不过,TCGA数据数据库OS和PFI意外事件一段时有数与文献相反。再次可知OS和PFI先为为GBM小分子研究工先为的确诊往南效度。

用Cox人口比例几亲率回归基本概念已确定高期(III、IV期)相对于低期(I、II期)胃癌症症状的几亲率比(HR),可验证4个往南的TCGA-CDR数据数据。由于DFI并不一定与其它结果的并不一定不相反,对自荐常用OS、PFI和DSS的14种特特质胃癌症非常logHR(详见3)。随后至少对意味着Cox人口比例几亲率举例的性疾病透过统计(三幅3E–3G)。结果详见明,14种特特质胃癌症中所,除有数皮腺(MESO)、PAAD和葡萄膜黑色素腺(UVM)均,高期对比低期HR在3个自荐往南OS、PFI及DSS上明显偏高。使用配对检验的Wilcoxon秩和检验,当常用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)精确测量时,logHR有明显顶多异性,显示性疾病成效和求生存往南在HR上发挥作用系统偏移;OS与DSS之有数并未曾明显顶多异性(p = 0.106)。对2个logHR值的规格误透过逆加权平均已确定Pearson值, 由logHR大约的3种结果有极明显正相关:PFI和OS值0.96(95%置信区有数[CI]:0.77–0.99),PFI和DSS为 0.95(95%置信区有数:0.76–0.99),OS和DSS为0.90(95%置信区有数:0.61–0.98)。这些相关特质潜在拥护确诊早期用PFI,后期用OS和DSS做往南。

除了建构小分子数据数据,还尝试研究首次化疗后无病症状与非无病症状是不是出新现不尽相同的新意外事件。TCGA-CDR中所29类胃癌症接收者用于解决该问题,纳入症状从确诊到已完成首治并达到无病精神状态至少幸存3个月底。以LUSC为例,有289例无病症状和41例仍然非无病症状,NTE亲率分别为21.8%和68.2%。用Cox人口比例几亲率回归基本概念,发现在非无病症状中所NTE几亲率明显略低于无病症状(HR = 6.68,95% CI = 4.25–10.51,FDR变动q值<0.05)。在另均21种胃癌症特特质中所也有类似于结果(详见4)。余下7种中所并未曾检视到这些顶多异性。我们也在审核是不是每个基本概念都意味着人口比例几亲率举例,其中所有两个不符合,才可要研究工先为一段时有数依赖及多给定基本概念来寻找可能会。

详见4 非无病与无病症状NTE发展对比

TCGA从全球数百个客运站抽取登革热,为解决确诊数据数据不尽相同客运站有数的可比特质,才可顾虑数据数据完整特质、和症状形态等。对每种性疾病而言,我们对比了从前两名给予登革热数最多的组织缺少客运站(TSS)与所有其它TSS的同种性疾病及4个结果往南(详见5)。

详见5 对来自从前两位TSS的每个胃癌症特特质研究工先为结果透过非常

对于GBM等极具蹂躏特质的,从前两位TSS(#1和#2)的发病一些人与其它TSS相比之下类似于的有OS、PFI和DSS,因意外事件太少难以研究不自荐DFI做往南。BRCA等较低蹂躏特质,强力自荐常用PFI和DFI,但建议谨慎用OS或DSS审核。TSS #1的确诊数据数据诱发不太好的OS和DSS,但并未曾检视到PFI顶多异性;另均,详见面上TSS#1有很好的DFI结果,至少出新现3例 DFI意外事件。这种详见里不一的现象详见明该客运站的结果数据数据才可进一步审核。另一特别,TSS #2的4个往南结果与其它地方相反。

这个简单的结果非常详见明,当从特定结果研究整体TCGA的确诊数据数据时,才可要顾虑TSS的具体情况接收者。由于年龄、分期/分级及化疗等因素因素不尽相同TSS患病一些人的往南结果,TSS可以先为为这些和不完全确诊注释等其它未曾精确测量顶多异性的替代。

潜在的或多或少因素、垄断结果的

几亲率及基本概念举例

对确诊求生存往南研究来说,建议常用所检视的全部确诊数据数据。但相比之下小分子/DNA数据数据的建构研究,要特别注意两个特别。首先,自荐发表意见基于较宽求生存基本概念,以小分子共通点先为预期因子划分检验集,意味著会受到破坏结果统计的明显特质顶多异性。因此,从彼此之有数关联的TCGA小分子数据数据或共通点TCGA-CDR结果数据数据中所推论新的结论才可在独立国家的数据数据库中所进一步证明。

第二,我们建议至少常用原发的小分子数据数据,因为症状初诊时,举足轻重一段时有数接收者等冗余的确诊数据数据已抽取相对于完整。详见皮黑色素腺(SKCM)在TCGA特特质中所极为特殊,470例中所至少103例原发,其余296例为原发暂时性病变移到,68例启动时移到。这与较少抽取到移到腺的其它TCGA胃癌症特特质演化成鲜明对比。SKCM移到腺较少带有冗余的原发,而其它TCGA胃癌症特特质尽管较少有移到腺,但都带有冗余的原发检验。因此,对于SKCM结果的相关特质,建议只常用有限量的原发登革热,尽管SCKM病变移到的III期登革热可先为为独立国家组群透过研究工先为。

在常用新建构的TCGA-CDR数据数据库时,还才可要特别注意:潜在混淆因素、垄断结果的几亲率及基本概念举例。

或多或少因素

或多或少因素发挥作用但被排除在基本概念之均时,偏移可能会高估或忽略真实。如在结核病的种族顶多异性研究工先为中所,白人与黑人症状之有数发挥作用举足轻重的基因详见达顶多异性,然而根据小分子共通点透过变动后,这种顶多异性明显减少甚至消失。治果也是潜在的或多或少因素,当接收者可获取时应适当顾虑变动。化疗未曾知时,年龄、诊治医院及确诊年份等规范疗先为为替代接收者能减少外误顶多。对这特别的决策仿真,鼓励常用;也肾功能研究工先为建议简报(REMARK)。

垄断结果的几亲率

测定DSS、DFI和PFI往南时,要对并未曾经历举足轻重意外事件且无病的活着亡症状透过审查。在这种情况下,如果举例症状并未曾其它活着因,那她/他就此仍可能会活着于胃癌症指征。然而,在大约化疗等预期因子对继发特质胃癌症或心血管性疾病等非基准胃癌症活着亡几亲率的预期能力时,该举例并不可取。

基本概念举例

系统设计Cox人口比例几亲率(PH)基本概念才会健康检查PH举例。另有案例均,大多数基本概念都意味着Cox PH举例,但才可进一步探索这些医疗事故以推断出新违背举例的可能会,从而对HR做出新更准确的大约。尽管已经为清理数据数据和解决问题付出新了巨大努力,但仍发挥作用举足轻重的常用限制,访问TCGA确诊数据数据都才会了解这些限制。

首先,TCGA主要是为小分子研究工先为结构设计,早先登革热选择来自多个政府机构带有适当库存组织的未曾化疗原发登革热,因此这些登革热不构成连续特质。此均,对于每种不尽相同特特质/研究工先为,随访数据数据并未曾实质上抽取。同时,确诊数据数据抽取的一些规则在依然迫使随着一段时有数的推移而改变。TCGA - CDR不包含胃癌症化疗史,并非所有登革热都被注释。因此,研究特定特特质或共通点的化疗时代背景比起概况特质泛癌症研究。当症状透过具体情况化疗时,得益于能用DFI和PFI往南有效研究。

其次,TCGA检验确诊随访根据当地诊所的一段时有数详见,可能会为性疾病或特定部位的复发和病人举足轻重心灵精神状态的记录下来,因此并未曾TCGA而无须的确诊随访开发计划,至少给出新工程项目主要强调的小分子形态。

最后,几乎所有TCGA取得的检验和DNA及小分子数据数据来自新诊症状原发的单个切片,由此诱发的DNA和小分子数据数据很难在空有数或一段时有数任何特别指明捕获代详见另一症状结果给定的异质特质。该问题不是TCGA独有的,任何静态原发特质研究工先为都发挥作用。

概述

这项工先为是当今世界第一次全面系统性检视TCGA泛癌症确诊数据。由此诱发的TCGA-CDR的结果往南与独立国家非TCGA研究工先为结果相反,说明该人力资源在空从前规模的确诊连续性上给予了心灵体观测新视角。也要预见TCGA-CDR的内在常用局限特质及关键特质指导和自荐发表意见。已经极为明晰,生命体性疾病未曾来大规模的小分子研究工先为才会系统性抽取确诊临床、化疗和转归意外事件数据数据,以坚所持极高规格的确诊研究工先为。尽管有其局限特质,TCGA-CDR给予了规范数据数据库,以及准确的4个确诊结果往南推新,并解决了量级问题,从而在泛癌症和个体水平上透过转化研究工先为。未曾来数据数据研究工先为的融合将提高结果之有数的可比特质,很好地断言和拥护段落。

参考数据

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
结核性胸膜炎征状是什么呢
现今,越来越多人患结核性胸膜炎,结节性胸膜炎征状是什么成为不乏患儿高度重视的热点问题。那么,结核性胸膜炎征状是什么呢?结核性胸膜炎为胃...[详细]
2022-05-10
成年人附件炎有哪些症状 患者有哪些表现
在流行病学上,附件炎是一种非比如说见的妇科疾病,一旦感染上这种疾病,就不会严重的损害到病变的身体健康状况。为了避免激起这种疾病,就一定...[详细]
2022-05-05
附件炎中风原因是什么 有哪些病因
附件炎指的就是女性生殖细胞和生殖细胞发生的炎症,今日来说这是比较典型的妇科炎症了,它对女性的肌肉健康危害是相当大的,甚至还亦会影响到密...[详细]
2022-05-04
卵巢囊肿怎么治疗比起好
现在生活水平的提高,工作的冲击也更加越来越大,很多人开始关注起了自己的双腿健康,引人注意是男人朋友而言,随着年龄的慢慢变高约,很更容易...[详细]
2022-05-03
一种可能影响女性平生的疾病,痛经、不孕或许都会接踵而来
迟于量多、淋漓不尽、痛经、分娩……单用到一个,就足够使妇女朋友无常了。 而今日我们要说什么的营养不良,是一种可能就会集这些腹泻于自诩,甚...[详细]
2022-05-02
五法总能远离更年期潮热
来潮潮热和是来潮的正要呕吐之一,你想到来潮潮热和该怎么办吗?哪些法则需要帮助准备位处来潮的人们纾缓潮热和的呕吐呢?示例小编就为大家举荐一...[详细]
2022-05-02
附件炎应该怎样治疗 有什么分析方法
附带常指的就是未婚的**和卵巢,当**和卵巢发生炎症的时候就是附带炎了。附带炎是一种尤其常用的未婚妇科疾病,对于病变的在生活上...[详细]
2022-04-28
台风天雨水多,推荐几款食疗方,多管齐下振祛湿!
_p>_/p>_p>_/p>_p>_/p>_section data-tools="135_section data-tools="135_p>_/p>_p>_/p>_p>早先吹袭天落雨湿漉漉,夏天潮湿的天气使我们可想而知疲倦,胃口变差。这都是因为...[详细]
2022-04-27
炎不马上治疗的危害有哪些
尘不立刻外科手术的损害有那些?不太可能有很多的患者都在咨询这个关键问题,那么,尘不立刻的外科手术亦会怎么样?尘是一种很相似的妇科疾病,但...[详细]
2022-04-26
  • 地区医院
  • 医院联盟