12月27—29日,第二十三届中国国际高新技术成果交易会中国高新技术论坛在深圳举行,主题为推动高质量发展,构建新发展格局,深圳医师学会泌尿外科分会会长,华大基因首席医官许四虎出席并发表演讲。
许四虎在演讲中表示,精准医学是最近几年来最热门的话题,为什么这么热门在于通过精准医学的手段使人们的治疗准确性更高,治疗的副作用更小,治疗的效果更好,这是精准医学的目标简单的举个例子,过去人们得肺炎的时候可能用广谱抗菌素,糊里糊涂把肺炎治好了,到底是哪种细菌引起的不知道今天的手段可以通过基因组学的方法了解得到肺炎这个病原菌是什么样的病原菌,它是哪个类型可以确定下来根据确定的特点我们对它进行治疗
就像这一次新冠的发生,就是这样检测到的这就是精准医学的核心要义,知道它是什么样的东西这是感染疾病,同样其他的疾病也是这样,要想把精准医学做好,最重要的前提就是要做好大数据的分析尤其是在基因组学跟精准医学的关系上,大数据就更加重要了
许四虎指出,基因数据助力精准医学基因组学大数据要做的话,怎么才能做好一是汇数据,二是洗数据,三是管数据,四是用数据汇数据就是要设立一个数据的管理中心,包含数据源的配置,数据源监控,字段血缘管理,元数据管理等等洗数据就是在数据中心里面,对数据的合规,配置,数据的批量处理进行完整的处理过程管数据方面,在数据中心里面对数据管理的权限,人员角色管理,基因数据文件,数据看板,统计分析等等做一系列的处理用数据,包括项目文件的管理,文件管理,数据管理,任务管理等等
既然涉及到基因数据,现在大数据管理是很重要的内容,涉及到隐私,安全,规范,我们从三个大的方面做这方面的管控一是安全隐私包括安全技术,隐私保护二是保障制度三是标准规范的建设他说
谈到基因组学大数据发展目标,许四虎对它做了一些勾勒:
一是对于大数据平台的建设,还是要基于汇数据,洗数据,管数据,用数据做好它,将来要使业务数据化,数据资产化,数据要服务化构建成基因领域的数据分析和科研平台,并且是现在出生缺陷,肿瘤,传感染疾病等数据的全覆盖
二是各个数据库也有独立的建设目标,分别是在妇幼卫生的终极目标就是要通过标准化的数据库建设,解决统一的问题,还有结构化的数据以及提高基因数据可解读的效率,促进行业的标准化发展。
病原微生物方面,要实现3D病原数据库,总体目标就是综合生命大数据,评价个体与环境自身遗传特性的关系,从数据的代表性,算法的高效性,多重数据融合性方面完善病原3D数据库存的建设和支撑。
以下为发言实录:
各位嘉宾大家下午好,非常高兴来到中国高新技术论坛,我跟大家交流的内容是精准医学与基因组学大数据。
我们知道精准医学是最近几年来最热门的话题,为什么这么热门在于通过精准医学的手段使我们的治疗准确性更高,治疗的副作用更小,治疗的效果更好我想这是精准医学的目标简单的举个例子,过去我们得到肺炎的时候可能用广谱抗菌素,糊里糊涂把肺炎治好了,到底是哪种细菌引起的不知道今天的手段可以通过基因组学的方法了解得到肺炎这个病原菌是什么样的病原菌,它是哪个类型我们可以确定下来根据确定的特点我们对它进行治疗
就像这一次新冠的发生,就是这样检测到的这就是精准医学的核心要义,知道它是什么样的东西这是感染疾病,同样其他的疾病也是这样,要想把精准医学做好,最重要的前提就是要做好大数据的分析尤其是在基因组学跟精准医学的关系上,大数据就更加重要了所以我今天围绕这个主题跟大家展开阐述
第一,说一下背景和意义。
生命健康会产生一个很大量的数据大概10个TB的数据,一个人一生的基因数据包括基因组学的数据,转录组,表观组,宏基因组等等很多,如果把生命拉开来看,从出生到终老的周期来看,这个数据量更大,这是非常庞大的数据如何对这个数据进行更有效的分析这是一个非常难做必须要做的事情
从基因的领域来说,基因要进行测序,要进行一些分析,会产生大量的数据我们仅仅从今天的生命健康,肿瘤防控,感染疾病的领域来说,产生的数据量还比较少,我列了今天在这个领域里面产生的数据量,这个数据量是比较少的比如说华大基因产生的生育的数据今天也就是2个PB,产生的肿瘤数据也就是1.2PB,我们感染的数据更少一点,未来的数据量很大就这样的数据奠定了我们今天从事基因精准诊断的基础,这是非常重要的领域
基因大数据有什么特点未来数据量都是以PB级的等级来说的,基因数据量有一个特点就是体量大,分析复杂,需要的工具也要求比较高,还有就是汇集比较难要把它形成一个统一可分析的数据才能够往下做下去那么就需要大科学的方法完成这个事,需要一个很好的平台完成它在这个平台上才能汇总大数据
这里面涉及到基础研究的内容,成为生物医学,基因组学开展研究的很重要内容,还涉及到健康领域如何归纳基因大数据才能推动我们对生命的准确理解从临床应用来说,在出生缺陷,肿瘤防控,感染方面做到更为精准我们说精准总在路上
第二,基因数据助力精准医学。
基因组学大数据要做的话,怎么才能做好我们总结几条:一是汇数据,二是洗数据,三是管数据,四是用数据汇数据就是要设立一个数据的管理中心,包含数据源的配置,数据源监控,字段血缘管理,元数据管理等等洗数据就是在数据中心里面,对数据的合规,配置,数据的批量处理进行完整的处理过程管数据方面,在数据中心里面对数据管理的权限,人员角色管理,基因数据文件,数据看板,统计分析等等做一系列的处理用数据,包括项目文件的管理,文件管理,数据管理,任务管理等等
既然涉及到基因数据,现在大数据管理是很重要的内容,涉及到隐私,安全,规范,我们从三个大的方面做这方面的管控一是安全隐私包括安全技术,隐私保护二是保障制度三是标准规范的建设
这些管理依据是什么依据就是国家的信息安全的三大基本法,《中华人民共和国网络安全法》,《中华人民共和国数据安全法》,《中华人民共和国个人信息保护法》,三大法是基本的管理数据的基本要素现在即将发布的是网络数据的安全管理条例,还正在征求意见中,我们正在密切跟踪条例的进展过程
基因数据助力精准医学,我们在保障里面包括要做一些技术加密,怎么使数据更安全,不外泄,还要做一些平台保障,有一些很好的防护措施还有权限的分级,哪些数据可以看到,哪些数据是不应该看到的,包括数据的隐私,数据的公开,哪些可以公开,这些都是需要处理的严格记录,总的目标就是使数据能够别人进不来,并且进来看不懂,拿不走,走不脱,我们要实现数据的管控
举个例子,肿瘤防控领域里面,我们在做海量数据和多组学大数据处理的时候,我们做了一些基本工作:一是要大量收集数据,包括基因数据,变异数据,免疫数据,临床数据,群正特征,构建多组学肿瘤大数据的平台我们用于公开研究,实验室研究,组学的数据研究等等
我们构建的数据库是BGI—PETA数据库,这是肿瘤很大的数据库,主要泛肿瘤跨组学百科全书,这是华大基因肿瘤大数据的服务体系,我们的使命就是从大数据的标准和对外服务做好它,愿景就是要建立一个肿瘤大数据的生态,我们希望能够为全球的肿瘤诊断来做一些服务。
肿瘤防控领域也有一些管控的东西,管控特点包括有公开研究,私有研究,通用模板,个性化模板的处理这是基本的产品,这个产品我们叫华梵安,有688基因实体瘤个体化诊疗二代测序,7个自然日快速交付,360+把向药物全面覆盖,我们采取非常严格的措施,能够适应于中国患者,靶点有效覆盖,应用于六大临床需求,包括靶向用药,免疫治疗,化疗药物,遗传风险,评估以后发检测,这是六大的临床需求这种产品的分癌种包括肺癌,胃癌,结直肠癌,前列腺癌,乳腺癌等等领域
还有在出生缺陷领域怎么做的,我们有一个朝阳平台,这个系统基于国际广泛认可的ACMG变异指南完成自动化变异位点致病性判定并生成报告出生缺陷包括数据库有凤凰数据库,这个数据库包括有基因与疾病库,致病变异库,CNV人频库,SNV人频库,真实患者样品库这是出生缺陷的网页查询版本,大家可以了解我们这样的内容
传感染疾病领域基因助力精准医学,我们也有一个平台,这个平台10万份大数据的支撑,这个库里面差不多建立了12000多种病原菌,这一次新冠能够极早研发试剂盒也是基于这样的数据库很好的科研基础做好这些工作需要有良好的关键基础设施,就是完备的IT基础能力,包括算法,算力的完善,我们有一个很好的系统平台,有数据分析平台,云计算系统,还有能够支持医学检测业务科技服务的系统我们还有一个数据中心,这个数据中心有五个高性能的计算机集群,用于存储和分析数据,分布在天津,武汉,重庆等等,我们还有灾备中心
第三,我们基因组学大数据发展目标在哪里我们对它做了一些勾勒,我们想以这些目标作为我们的发展方向
一是对于大数据平台的建设,我们还是要基于汇数据,洗数据,管数据,用数据做好它,将来要使业务数据化,数据资产化,数据要服务化构建成基因领域的数据分析和科研平台,并且是现在出生缺陷,肿瘤,传感染疾病等数据的全覆盖
二是各个数据库也有独立的建设目标,分别是在妇幼卫生的终极目标就是要通过标准化的数据库建设,解决统一的问题,还有结构化的数据以及提高基因数据可解读的效率,促进行业的标准化发展我们能够提供更好的挖掘的价值肿瘤方面的数据库存,我们要通过收集海量的癌症数据,打造肿瘤数据的百科全书,实现数据在线来进行分析还要完成可视化的快速关联分析,我们要培训很多的临床医生来共同跟我们完成这方面的事情,今天我们发现数据的解读过程中临床医生不知道解读的是什么意思,我们要带着他们一起玩才能更好的应用
病原微生物方面,我们要实现3D病原数据库,总体目标就是综合生命大数据,评价个体与环境自身遗传特性的关系,从数据的代表性,算法的高效性,多重数据融合性方面完善病原3D数据库存的建设和支撑今天利用这个把我们总体的目标来介绍给大家
我的介绍内容完毕,谢谢各位。
。郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
-
盘扣式脚手架有哪些优点?四川远方模架告诉你答案!新浪网消息:四川远方模架科技有限公司位于四川省成都市,创建于2017年。公司拥有M60型盘扣脚手架总量达30000余吨,具有...
-
区块链如何跨越未来10年“十四五”时期,随着全球数字化进程的深入推进,区块链产业竞争将更加激烈。作为新兴数字产业之一,区块链在产业变革中发挥着重要作...
-
三人篮球将首登奥运舞台 国家三人男女篮签署反兴奋剂为实现东京奥运会兴奋剂问题“零出现”的目标,近日,中国篮协反兴奋剂委员会分别前往山东济南和上海崇明训练基地,为国家三人男、女...
-
百成优品将在全国范围内开设58620家加盟体验馆搭建
2022-01-02 20:13
-
2022年一季度AirPods出货淡季不淡强劲需求推
2022-01-02 20:13
-
继1218大会以后五粮液再度发生人事变动
2022-01-02 20:07
-
中国首个跨行业企业“碳标准”正式发布,首次提出碳码、
2022-01-02 19:42
-
收评:指数高位震荡创指涨1.25%云游戏板块涨幅居前
2022-01-02 19:18
-
佛山成立版权产业发展联盟提升整体发展水平
2022-01-02 18:24
-
运动休闲鞋以其舒适和多用途的特性深受广大群众的欢迎是
2022-01-02 18:23
-
三澳核电项目是中国首个民营资本参股的核电项目
2022-01-02 18:22
-
云南宁蒗5.5级地震已造成15人受伤
2022-01-02 18:16
-
他如今的身份是浙商银行董事长我之所行
2022-01-02 18:01