随着中国(guó)疾控(kòng)中(zhōng)心成功分离出(chū)新(xīn)型冠状病毒,人们对该病毒的认识越来越深,相(xiàng)关的疫苗和特效药的研发也在紧锣密鼓地进行中。然而,这一(yī)过程需要(yào)大(dà)量(liàng)的数据分析(xī)、文(wén)献筛选和(hé)超算工作支(zhī)撑。
为了进一步加(jiā)快新疫(yì)苗(miáo)、新药的研(yán)发和上市,国内众多科技公司纷纷向科(kē)研(yán)机构免费开放(fàng)自己的 AI 算力(lì)。
阿里云
2020 年 1 月 29 日晚间,阿里云宣布在(zài)疫情期间向全球公共科研(yán)机(jī)构免(miǎn)费开(kāi)放一切(qiē) AI 算力。
阿里云高性能计算团队负责(zé)人何万青解释道:
通常来说,一款药物(wù)的研发需要经过毒株分离(lí)、测序分析、找到病毒的靶点进行(háng)识别(bié)和验证、寻找(zhǎo)对应化合物、评估研究和动物实验、制剂合成、临(lín)床试验以(yǐ)及上市等步骤。
总而言之,药物研发的过程都需要投入大(dà)量的金钱、人力(lì)以及时间。据了解,在美国研发一(yī)种新的药物,从这个研发项目启动到其最终(zhōng)通过 FDA(Food and Drug Administration,美国食品药物监督管理局)的批准,平均需(xū)要花费 10 -15 年(nián)时间(jiān),耗资超过 13 亿美元。
研究人员对新型冠状(zhuàng)病毒进行毒株分离(lí)
目前(qián),本次新(xīn)型冠状病毒疫苗和特效药(yào)的研发(fā)已经完成了毒株分离以及(jí)基因测序,这(zhè)一部分(fèn)工作主要是在实验室(shì)进行研究工(gōng)作;而接下(xià)来(lái)的研发,包括对病毒(dú)靶(bǎ)点进行识别和验证(zhèng)、寻找对应(yīng)化(huà)合(hé)物(wù)等(děng),都需要云计算的帮助(zhù)。
何万青(qīng)对媒体说(shuō)道:
特别是(shì)寻找对应化合物,一定要调用超(chāo)大规模算(suàn)力,因为可供制成药物的化合(hé)物有 5000-15000 种。要先从庞杂的(de)化合(hé)物中找到针对病毒合适的“进(jìn)攻方向”,再(zài)进(jìn)行合成(chéng)和拼(pīn)接,如果(guǒ)都要从实验室里一一比对(duì),那就(jiù)太浪费时间了。
在阿里云这次开放 AI 算力之后(hòu),全球(qiú)公共科研机(jī)构无需(xū)“排队”,随(suí)时可以在弹性伸缩、数据交流和(hé)发布都更加便捷的协(xié)同(tóng)环境中工作。
另外,在(zài)筛选(xuǎn)医(yī)学文献和分析历史数据时,AI 算力也(yě)能派上用场。此前类似的 SARS 等疫(yì)情爆(bào)发(fā)后(hòu),医学界留有大量的历(lì)史药物研(yán)发以及临床数据,还有(yǒu)很多医学文献散落全球各地,这些(xiē)都(dōu)可能成为这次(cì)新型冠状病毒治疗突破口。
腾讯
2020 年 1 月 30 日(rì),腾(téng)讯官(guān)方宣布向北京生命科学研究所/清华大学生物医(yī)学(xué)交叉研(yán)究(jiū)院的黄牛教(jiāo)授实验室、中山大学药学院的(de)罗(luó)海彬教(jiāo)授团队提供免(miǎn)费(fèi)的运超算能力、运算集(jí)群支持以及(jí)基础的云计算能力;同时(shí)成立(lì)应急工作小组,帮助(zhù)加速疫苗研发和新药筛查。
上述两(liǎng)个由腾讯提(tí)供算力支持的(de)团(tuán)队(duì)正承担新(xīn)冠(guàn)肺(fèi)炎的药物筛(shāi)选和病毒突变预测工作。
早前,国(guó)家科(kē)技部紧急启动了相关(guān)的应急研究(jiū)项目,中山大学药学院罗海彬教授团队入选了“2019-nCoV的保护(hù)性抗体、疫苗研发和药物(wù)筛选与评价研究”的课题,负责遴选具有治疗作用的候选药物等工作。
为此,腾(téng)讯(xùn)云迅速调(diào)度(dù)了一批 GPU 服务(wù)器节点,并为罗(luó)教(jiāo)授(shòu)团队开(kāi)通(tōng)了(le)高性能计算账号,免费提供所(suǒ)有计算资源,支持罗(luó)教授的团队(duì)进行抵(dǐ)抗新型冠状病毒的(de)药(yào)物筛选和病毒突变预测。
同时,北京生命科学研究所/清华大学生(shēng)物医学交(jiāo)叉研究(jiū)院(yuàn)黄(huáng)牛教授(shòu)实验室(shì), 正在推进基于新型冠状病毒靶标结构的化合(hé)物虚拟筛选的(de)工作。
腾讯(xùn)为此(cǐ)提供了大量标准的 CPU 算(suàn)力以及对(duì)象储存(cún)能力,帮助黄牛教授实验室进(jìn)行基于结构的药物分(fèn)子设计的离线计算任务(wù)。针对新型冠状病(bìng)毒的多个(gè)靶点,黄(huáng)牛教授实验室通过腾讯云秒级交付(fù)的海量高(gāo)性能计(jì)算、存储(chǔ)资源,快速计算筛选数亿级别的化(huà)合(hé)物数据库(kù),结合实验验证(zhèng),来(lái)寻找新型结构类(lèi)型的先导化合(hé)物(wù),为下(xià)一步新药研发(fā)工作提供依据。
总而言(yán)之,腾讯云较强的 CPU 以(yǐ)及 GPU 算力(lì)调度能力可以为基因测序、医疗工程提供稳定高效的算(suàn)力支持(chí),从而降(jiàng)低创新药物前期(qī)研发(fā)的成本(běn)与周(zhōu)期。
百度
紧随阿里和腾讯(xùn)的(de)脚(jiǎo)步(bù),百(bǎi)度研究(jiū)院也在(zài) 2020 年 1 月(yuè) 30 日宣布,将向(xiàng)各(gè)基因(yīn)检测机构、防(fáng)疫中心及全(quán)世界科学(xué)研究(jiū)中心免费(fèi)开放线性时间算法 LinearFold 以及世(shì)界上现有最快(kuài)的 RNA 结(jié)构(gòu)预(yù)测网站,以提升(shēng)新型冠状病毒 RNA 空间结构(gòu)预测速度,从而(ér)助(zhù)力疫情防控。
具体(tǐ)来说,2019 年 7 月,百度首次提出 LinearFold 算法,该算法让整序(xù)列、整基(jī)因组(zǔ)的 RNA 结构(gòu)预测成为可能,也是 RNA 结构预测领域的一次重大突破(pò)。
此次引起武汉肺炎的新型冠状病(bìng)毒与(yǔ) SARS 病毒、艾滋病毒、埃博拉病(bìng)毒、流感病毒一(yī)样,都属(shǔ)于 RNA 病(bìng)毒,其单链(liàn)结构导致病毒(dú)更容(róng)易变异、不易开发疫苗。但如果医学专家(jiā)们能够更(gèng)加快(kuài)速且深入(rù)地了(le)解新冠肺炎基因组的性质,这将为针对性药物的设计研发提(tí)供重(chóng)要信息。
传统上,RNA 二级结构预(yù)测需(xū)要(yào)三次方时间复杂度的(de)算法。比如说,序(xù)列(liè)长度翻(fān)一倍就要(yào)付出 8 倍的计算时间,像(xiàng) RNA 病毒(dú)基因组(zǔ)这样的超长序列(例如,艾(ài)滋(zī)病毒有约(yuē) 1 万(wàn)个碱(jiǎn)基,埃(āi)博拉病毒有约 2 万个碱基)需要很(hěn)长一(yī)段等待时间(jiān)。而冠状病毒(dú)(包括非典(diǎn)病毒和这次(cì)的新型(xíng)冠状病毒)的基因组又是所(suǒ)有 RNA 病毒(dú)里最长(zhǎng)的,长达 3 万(wàn)个(gè)碱基(jī),最快(kuài)的经典算法(fǎ)也需(xū)要 55 分钟。
不过,通过百度(dù) LinearFold 算(suàn)法,这一计算时间被压缩到(dào)了 27 秒,相当于(yú)提升了 120 倍。与此同时,百度还向全球科学(xué)家免费(fèi)开放了其 RNA 结(jié)构预(yù)测(cè)网站。这(zhè)些都将提升(shēng)基因检测、疫苗研发等(děng)科(kē)研中心的工作效率,让病毒的研(yán)究及疫苗开发(fā)速度(dù)快速提高。
值得一提的(de)是,在此之前,百度还宣布成(chéng)立总规(guī)模 3 亿元(yuán)疫情(qíng)及公共卫生安全攻坚专项基(jī)金,用于支持新(xīn)型(xíng)冠状病毒肺炎等新疾(jí)病(bìng)的治愈药物筛选(xuǎn)、研发等一(yī)系列(liè)抗击疫情(qíng)工作。
滴滴云
注:图片来自(zì)滴滴云
2020 年 2 月 1 日,滴(dī)滴也加入了 BAT 的行列——滴滴云宣布,在通力保(bǎo)障正常服务(wù)的基础(chǔ)上,成立应急战疫小组(zǔ),并免费向国内科研(yán)机构、医疗及救助平台(tái)等开放用于抗(kàng)击(jī)疫情(qíng)相关(guān)工作(zuò)的 GPU 云(yún)计算资源和技术支持(chí),包括(kuò)但不限于 GPU 云(yún)服务器、负载均衡 SLB、弹性公网 EIP 等(děng)以及相关(guān)的技术支持服务。