应用案例 | 华大生命科学研究院:携手量旋用量子算法破解基因组组装难题

2023.06.26 · 应用案例

在过去几年里,量子计算的迅猛发展为生命科学领域带来巨大的变革潜力,例如缩短药物研发周期、探索癌症个性化治疗等。华大生命科学研究院与量旋科技开展深入合作,探索量子计算在生命科学领域的应用。利用量子算法来实现基因组组装,不仅很好地解决了基因组组装的棘手问题,而且可以使用更少的量子资源,模拟更大的量子系统,为在NISQ时代模拟大规模系统提供了可能性。

 

基因组测序关乎生命解密,传统基因组组装方法面临诸多挑战

成立于1999年,肇始于“人类基因组计划”的华大基因,是全球领先的生命科学前沿机构,以“产学研”一体化的发展模式,引领基因组学的创新发展,通过遍布全球100多个国家和地区的分支机构,推动基因科技成果转化,实现基因科技造福人类。

作为华大基因旗下的核心研发机构,华大生命科学研究院以基因组学为基础,聚焦于基础研究领域的前沿方向和关键问题,其中就包括生物信息与量子计算相结合的应用场景研究。

众所周知,基因是生命底层的密码,而基因测序技术,是解密生命的一个关键手段,不仅有助于揭示生命起源和演化过程中的奥秘,而且可以协助研究疾病的病理机制,为人类开展疾病的早期治疗以及个性化医疗提供帮助。

当前,基因组测序方面,受测序技术的内在限制,所能测序的DNA序列长度远远小于实际的基因组大小。例如,人类基因组大小约为3G(30亿个碱基对),而目前主流的第二代测序技术的测序读长通常在100bp(碱基对)到300bp之间。

在实验中,研究人员往往通过“鸟枪法”(一种直接从生物细胞基因组中,获取目的基因的方法)将完整的基因组随机切成大小适宜的基因片段,再通过测序仪器读取片段的碱基信息,并生成数据。后续,通过基因组组装技术,将海量的数据组装成完整的基因组。

而对于一些基因组复杂区域,由于存在大量的基因重复片段和高杂合度,往往使得基因组组装变得更加困难,因而影响最终的基因组组装结果。

当前,常用的两种基因组组装方法,OLC(Overlap-Layout-Consensus)和DBG(De Bruijn Graph),都无法完美地解决这一棘手问题。此外,由于经典算法应用于基因组组装时,往往会面临数据存储和计算资源的挑战。华大研究院量子计算团队负责人黄俊翰博士表示,在进行基因组组装前,需要对测序片段进行序列比对等预处理,如果在没有参考基因组的情况下,所需要的计算量往往会迅速增长,最终导致无法在有效的时间内完成计算任务。因此,团队也开始积极探索其他创新性的解决方案。

 

携手量旋科技,利用变分量子算法助力基因组测序

2022年7月,华大研究院与量旋科技签署协议,通过以量子计算技术为驱动,生命科学领域相关应用场景和数据为依托的研发合作,共同打造量子计算赋能生命科学的标杆。其中一个重要任务方向,就是探索量子算法在基因组组装上的应用。

针对实现基因组组装量子算法的诸多挑战,双方各自投入专家资源,具体分工上,华大研究院主要负责生物问题的建模,而量旋科技则负责开发量子算法,在合作中探索出一种新的基因组组装方法:

基于变分量子算法的基因组组装方法

 

首先,将基因组组装的问题,转化为组合优化的问题。具体而言,根据测序片段的内在联系生成有向图,最后求解最优路径问题。

其次,对组合优化问题进行数学建模,再映射成由泡利算符构成的哈密顿量形式。通俗来讲,就是将问题翻译成量子计算机能够识别的语言。

然后,利用变分量子算法进行求解哈密顿量的最优本征值及其对应的最优本征态。变分量子算法是一种量子-经典混合算法,它的本质是近似优化算法(一种用来发现近似方法解决优化问题的算法),被认为是在未来实际应用中,最有前途的量子算法之一。

最后,经过解码最优本征态,得到基因组组装的最优路径。

值得一提的是,这种新方法通过使用分布式量子-经典混合算法,充分利用了量子的叠加性和纠缠性,可以有效地提高计算能力,利用更少的量子资源,模拟更大的量子系统,解决了高通量基因测序组装过程中,计算资源消耗过大的问题,也为在NISQ时代(中等规模含噪量子时代)模拟大规模系统提供了可能性。

 

量子计算赋能生命科学,产业变革加速

实际上,除基因组组装外,量子计算在生命科学领域展示了广阔的应用潜力,包括制药、医疗、分子生物学等领域。

以新药研发为例。由于药物研发的风险巨大,不仅周期漫长,而且成本高昂。一款创新药平均需要投入20亿美元和10年时间才能进入市场,但是其成功率令人担忧,临床研究的成功率不足10%。然而,借助量子计算技术,企业可以通过精确地模拟量子力学来更准确地模拟生化反应过程。如此一来,企业可以在更短的时间内找到更高效的药物分子,这将大大加速药物发现和新药开发进程。

Pistoia Alliance、QED-C 和 QuPharm 联合进行的一次调查显示:82%的生命科学公司认为量子计算将在未来10年内对行业产生积极影响。

鉴于量子计算的应用潜力,有越来越多的医学机构和制药企业开始积极拥抱它。生物制药巨头诺和诺德,已宣布投资2亿美元开发量子计算机,专门用于新药研发;克利夫兰诊所与 IBM 合作,部署了世界第一台专门用于医疗保健研究的量子计算机,以加速生物医学发现;德国制药公司勃林格殷格翰(Boehringer Ingelheim)与谷歌人工智能实验室达成合作协议,致力于研究药物发现中量子计算的前沿用例,特别包括分子动力学模拟......

生命科学实验丨图源:千库网

从制药到个性化医疗,量子计算展现出明显的优势,它将为生命科学领域的挑战带来创新性的解决方案,并引领生命科学进入变革时代。随着量子计算逐渐改变传统生命科学领域的研究方式,我们有望见证更多量子计算在生命科学中的重大突破,为人类健康和福祉做出更大贡献。