2020年2月6日,PCAWG(Pan-Cancer Analysis of Whole Genomes,泛癌全基因组分析)联盟在《Nature》正刊发表了6篇论文,我校杨善林院士和丁帅教授是集体作者的成员。
基于新一代信息技术的肿瘤多组学测序与精准诊疗是肿瘤学、计算机科学、管理科学等多学科交叉融合的国际前沿热点,探索肺癌、肝癌、胃癌、肾癌、血癌、皮肤癌等常见癌症的多组学共性特征是全球科学界共同面临的世界性重大科学难题,需要国际携手合作实施大科学计划和大科学工程。《Nature》发表的6篇论文从泛癌全基因组数据画像、肿瘤体细胞突变的路径图谱、非编码区的驱动突变特征、基因组结构突变的特征模式、复现肿瘤的演化历程和多组学荟萃的RNA变化规律六个方面,对38种常见癌症的2658例肿瘤-对照组织配对样本的全基因组测序数据和1222例转录组测序数据进行了系统整合分析。
上述6篇《Nature》研究成果与其它国际大科学计划类似,第一篇是国际泛癌全基因组分析研究的标志性论文,The ICGC/TCGA Pan-Cancer Analysis of Whole Genomes Consortium是唯一集体作者。其他五篇论文是分组研究成果,由个人作者和集体作者PCAWG Consortium联合署名。
2013年成立的PCAWG联盟由来自世界34个国家和地区的744家科研和医疗单位的研究人员组成,旨在规范化采集常见癌种的样本及其多组学大数据,高精度、系统性地绘制常见癌症的多组学数据画像和风险图谱,以期获得能够指导临床实践的分子标识和决策基线。PCAWG设有一个由五位世界级科学家组成的指导委员会,该委员会组织领导了泛癌全基因组分析的国际大科学合作工程。指导委员会的成员是:英国剑桥大学、Wellcome Sanger研究所Peter J. Campbell教授,美国哈佛大学-麻省理工学院Broad研究所Gad Getz教授,欧洲分子生物学实验室Jan O. Korbel教授,加拿大安大略癌症研究所、多伦多大学Lincoln D. Stein教授,美国加利福尼亚大学圣克鲁兹分校Joshua M. Stuart教授。
合肥工业大学是PCAWG联盟单位之一,我校杨善林院士和丁帅教授是PCAWG联盟成员。自2016年6月起,杨善林院士团队针对肿瘤多组学大数据分析中的突变识别、关联演化模式与数据质量控制等科学难题,提出了一类多模态数据融合方法,并综合运用贝叶斯分类、支持向量机、集成学习、迁移学习等方法,较好地解决了肿瘤多组学测序数据的个性化突变检测和风险决策问题。此外,杨善林院士团队还参与了针对人群/种群数据的参数优化、高特异性检测、非常规变异检测模型和算法的研发,为全基因组泛癌分析的低质量数据溯源、质控点选择与优化、质控策略设计研究提供大数据分析与处理方法。
我国华大基因杨焕明院士团队、空军军医大学樊代明院士团队、西安交通大学王嘉寅教授团队,以及北京大学、上海交通大学、华中科技大学、香港科技大学、吉因加科技等中国大陆和港澳地区十多家单位也参与了PCAWG的工作,为此项研究作出了很好的贡献。
《Nature》论文1链接:https://www.nature.com/articles/s41586-020-1969-6
《Nature》论文2链接:https://www.nature.com/articles/s41586-020-1943-3
《Nature》论文3链接:https://www.nature.com/articles/s41586-020-1965-x
《Nature》论文4链接:https://www.nature.com/articles/s41586-019-1913-9
《Nature》论文5链接:https://www.nature.com/articles/s41586-019-1907-7
《Nature》论文6链接:https://www.nature.com/articles/s41586-020-1970-0