雷峰网 //m.drvow.com //m.drvow.com/resWeb/images/common/lp_logo.png 雷峰网 //m.drvow.com 2015 m.drvow.com All rights reserved. zh_cn Tue, 04 Feb 2025 10:05:57 +0800 专访联影智能联席CEO沈定刚:探索脑影像 AI 的无限可能 //m.drvow.com/category/healthai/hL8sVAVFveUf2Smn.html

若要细数沈定刚的过往身份,那么堪可谈论的绝不只有一种。

国内医疗AI龙头企业联影智能联席CEO、上海科技大学生物医学工程学院创始院长,两大重要任职已将他置于医学影像领域最中心。

然而,这仅是了解他过往二十多年工作经历的冰山一角。

在2018年回国之前,他还是美国北卡罗来纳大学教堂山分校的放射学系、计算机系、生物医学工程系终身教授,以及该校医学影像分析中心的主任。追溯至更久前,他还曾在宾夕法尼亚大学、约翰霍普金斯大学等高校担任教职。

凭借在医学影像的长期深耕,回馈给他的是“沈定刚”三个字形同一道公信力,确保科研项目和临床工具不出差错,沿着正轨持续演进,直至被推到极致。

当他被问到这其中有何诀窍,回答只有最简单的一句话:一个人在多个领域做出重大贡献是不可能的,因为时间和精力都是有限的。如果我有所贡献,那可能是因为我对自己的研究领域非常专注。

“在美国工作期间,我曾负责不少由NIH资助的研究项目。一般情况下,研究人员可能只能主持最多3-4个R01项目,但我曾同时主持8个R01项目(作为PI)。”沈定刚回忆当时情形,“每拿一个新的R01项目,管理机构的主任们都会开会讨论是否同意再资助。我向他们解释,一般人每天可能工作8小时,而我经常工作14-15小时,同时觉得我的效率比一般人高很多。”

相对于沈定刚对项目密度的把控,他在研究方向上的态度则始终如一,“脑影像”三个字是贯穿其科研与从业生涯的一条主线。自1999年起,沈定刚便深耕于脑科学领域,专注于通过影像学技术探究大脑的奥秘。他的研究不仅覆盖了老年人群体大脑老化的研究,还包括儿童早期大脑发育和个体化的大脑疾病诊断。

在迄今25年的脑影像研究历程中,今年沈定刚及其联影智能团队再次取得突破,推出了「MR脑静息态功能智能分析系统」和「MR脑纤维智能分析系统」两大创新工具。

前者通过静息态fMRI和T1序列数据,为神经疾病机制研究、神经和精神类疾病的诊治、预后康复评估、术前脑功能区定位等多种应用场景提供辅助。

后者则利用DTI技术,实现了全脑纤维追踪和分类的一键式智能分析,全流程压缩进十分钟内,主要用于研究大脑的结构连接、神经纤维损伤和疾病等。

至此,联影智能在大脑影像AI领域的产品线,已形成从卒中、肿瘤到神经退行性疾病,从CT模态到MR模态的全景图谱。这即是联影智能所强调的“全栈全谱”的研发思路。

值得一提的是,在4月上海召开的CMEF(中国国际医疗器械博览会)和5月新加坡召开的ISMRM(国际医学磁共振协会暨展览会),这两大MR脑新品均有亮相。与此同时,沈定刚成为新一届ISMRM Fellow,成为他继IEEE Fellow, AIMBE Fellow, IAPR Fellow, MICCAI Fellow后的第五个顶尖学术荣誉。

借此契机,近日雷峰网对话联影智能联席CEO沈定刚,深入探讨了他的科研经历、对医学影像AI领域的深刻洞察,以及联影智能在MR脑新品背后的研发故事。以下为对话(经编辑):


MR脑新品深度解析

雷峰网:今年联影智能推出的「MR脑静息态功能智能分析系统」、「MR脑纤维智能分析系统」两大工具,研发动因是什么,实际效用如何?

沈定刚:在回答之前需要做一个普及:针对MR神经影像分析,结构、功能、纤维,是三个非常重要的维度,这三者结合可以为临床诊疗及神经生理机制的研究提供更全面的信息。针对脑结构和脑功能,学术界已经进行了长时间的研究,而且已经将诸多研究成果应用于临床诊疗。

比如,评估儿童的发育过程和老年人大脑老化是否正常,以及在进行开颅手术时,功能影像技术能够帮助医生识别关键脑区,以保护重要的功能,如语言和运动能力。但问题在于,尽管临床对于脑功能AI产品的需求很明确,但因为影像数据量大,传统的后处理工具都比较分散,很难实现一站式的、多维度的特征提取和分析。

联影智能 ‘MR脑静息态功能智能分析系统’ 可基于静息态fMRI和T1序列数据,提供全脑的功能连接矩阵、脑功能连接图、图论分析等多维分析结果。该AI系统将大幅缩短fMRI的数据处理时间,实现从原始图像预处理、定量评估到结果可视化的全流程自动处理,为神经疾病机制研究、神经和精神类疾病的诊治、预后康复评估、术前脑功能区定位等多种应用场景提供辅助。

脑纤维的临床分析痛点和脑功能有共通之处。脑纤维利用了弥散张量成像(diffusion tensor imaging, DTI)技术。

DTI技术能够帮助我们可视化大脑内部的微观结构,即脑区之间的物理连接,类似于地球上城市之间的高速公路网络(或者航线)。这些高速公路(或航线)代表了大脑中的纤维连接,将不同的脑区紧密相连。DTI技术所提供的图像数据同样高度复杂,涉及到扫描时人体内水分子在不同方向上受到梯度场影响时的扩散信息等。AI系统需要从这些复杂的图像数据中准确提取脑纤维的走向、连接,并进行定量分析,快速精准地实现个体数据全脑纤维追踪和分类以及后续的脑结构连接分析、ALPS科研指标计算等等。

联影智能 ‘MR脑纤维智能分析系统’,可一键实现DTI全流程智能分析。在10分钟内,全自动完成预处理、弥散张量计算、纤维束追踪、结构连接网络构建、相关图论指标计算,无需任何手动操作。该AI系统不仅能够显著降低DTI的科研门槛,还将为医生带来便捷高效的全脑纤维分析,让医生更加专注于医学研究本身,同时为医生的临床诊疗提供关键支持。


雷峰网:能否详细介绍这两款产品的技术实现形式,相较于其他解决方案的优势?

沈定刚:在技术实现上,我可以分享两点:

一、我们的脑功能、脑纤维两大新品都做到了全自动的数据处理,进而大幅度加速了工作流。我们运用了一系列的专业技术,包括跨模态配准、信号质控、去噪、头动矫正、涡流矫正等等,这一系列的技术帮助我们实现了数据的全自动处理,也就意味着医生不需要任何操作,等待几分钟就可以得到一系列对应的参数。而传统的分析时长,可能会在几小时左右,相对来说是很耗时的。

二、我们在产品布局上都采用的是模块化的布局,所以这两个新品,联合我们的脑结构、脑小血管病的AI产品,我们把它们智能集成为一个平台--「uAI脑科学前沿科创平台」。平台搭载了上述各个产品,可以帮助医生从脑结构、脑功能、脑纤维、脑病变等各个角度全面开展脑科学研究,帮助医生去做自己个性化的科研项目。特别是一些比较长周期的、重大的脑项目,通常会涉及到多个节点或者是子课题,攻坚的脑科研方向也有所区分,这种场景下,我们的这个平台可以很好地满足这些需求。

两大MR脑新品的优势有两部分:

一、它们都实现“跨越全年龄段”的突破,也就是可以做到全面覆盖医生对于0~90岁人脑的科研需求。这也源自于我们覆盖全年龄段的数据积累,以及对应的技术积累。因为过去我们参与了多个在脑方向的国家级科研项目,这些项目的攻坚方向都涉及到了脑功能、脑纤维的维度,它们为我们打下了必要的基础。例如我们联合澳门镜湖医院、华山医院做的阿尔兹海默病的早期检测和评估项目,以及由上科大牵头的0~18岁婴幼儿、儿童青少年脑发育研究项目等等,我们的这两个产品也在项目合作的基础上进一步开发出来,并在华山医院等医院中继续打磨。

二、它们都实现了全自动的数据处理。这个优势让医生的分析时间从传统的小时级,压缩到了分钟级,甚至是十分钟、五分钟。而且全自动的另一个好处是,即使是专业并不聚焦在脑领域的医生,只要经过培训,也可以很容易上手,进行一系列感兴趣的脑科学研究,对于医生来说,其实学习成本是大大降低的。


雷峰网:在今年两大MR脑新品之前,公司在脑影像AI领域有哪些技术积累和产品创新?

沈定刚:在技术、数据、人才等方面都有相应的积累,拥有领先的分割技术。

首先,在技术方面,我们有独创,且领先的分割技术。我们都知道,大脑影像非常复杂性,对于精确的图像分析和解读提出了巨大的挑战。而准确的对影像进行分割是精确分析图像的前置条件。在这方面,我们有独创的影像分割技术,这项技术曾在世界级的分割比赛 SegTHOR Challenge 2019 中获得过冠军。

其次,在数据方面,我们在脑领域积累了多个重大项目。

这些项目涵盖了“一老一小”两大方向(后文详细提到),帮助我们实现了覆盖0~90岁的全年龄段人群的丰厚的数据积累。

最后,在人才方面,我们拥有一批长期深耕脑领域的优秀科学家。就我个人而言,我长期研究方向比较聚焦大脑方向。另外,比如还有我们的研究院院长石峰博士,也是长期深耕脑领域的科学家。我们公司类似这样的脑科学人才有很多,所以也推动了很多研究、产品的出现和落地。都说“得大脑者得天下”,所以我们也有自信地说,在脑影像AI领域的一系列成果是我们的核心竞争力,未来我们会继续走在前沿。

当然,新品之前,我们在MR模态已有产品基础,且都具备标杆意义。联影智能在大脑影像AI领域的产品成果丰富,布局全面,在CT、MR多模态,以及卒中、肿瘤、神经退行性疾病等多疾病都实现了覆盖,这在业内是非常领先的。这次两大新品属于我们在MR模态上的进一步拓展。但是在这两个新品出现之前,我们针对MR模态也布局了脑小血管病AI、脑结构AI,这些产品都具备突破性的标杆意义,脑转移瘤AI更是全球鲜有的临床-科研转化成果。它们都为我们在MR模态上的新品推出提供了很好的基础。


雷峰网:在开发这两大MR脑新品过程中,存在哪些技术挑战?从项目启动到产品问世周期多久?

沈定刚:对于我们开发AI临床工具来说,困难远不止技术难度,还有工程难度。

因为工程开发,不像重大项目的科学研究,往往数据量有限且来源固定,但我们需要确保基于这些数据训练出鲁棒性非常强的算法,才可以适用不同的厂家、不同的机器。本身就是一件有技术难度的事情。

比如脑功能,因为fMRI影像涵盖了脑活动的多维信息,每个脑区的信号又可能会受到多种因素的影响,如血流动力学响应、噪声干扰等,AI需要准确提取有关大脑功能的信息,并对大量的数据点进行信号质控和数据处理,以及后续脑功能网络的构建和脑功能连接分析等,这都需要非常强大的算法支持。

其次,在我们实际开发过程中,我们还需要兼顾各个厂家不同的扫描数据,并考虑到如何降低耗时,实现高效的数据处理工作流的过程等等问题。考虑到可以最大程度提升我们产品的可用性,我们这两个产品是在我们的两个平台(诊疗平台、科研平台)同步上线的,但这对应用本身来说,因为使用场景并不是完全一样的,会存在很多需要兼顾和调试的地方,尤其是交互设计方面,主要的目的也是让医生使用起来更方便,我们也花了一部分的精力在这里。

从产品启动开发到初步版本完成来算的话,这两个产品我们开发的时间都在三个月左右(总共半年),都属于比较正常的范畴。在开发过程中,与医生的沟通也非常重要,因为我们需要了解他们的实际需求和使用体验。这些反馈对于我们改进产品至关重要。

因此,产品开发过程中的打磨和迭代是必不可少的。这也得益于我们之前在婴幼儿脑发育的脑科学重大项目、阿尔兹海默病的科技部重大项目等等积累,让我们可以学习到优秀医生的经验,准确理解临床场景和需求。


雷峰网:与你们之前开发其他产品工具的周期相比,半年的时间算长吗?

沈定刚:对于我们而言,半年的时间既不过长,也不是过短,实际上是脑科学领域的深入研究和产品开发的复杂性使然。这次的两个新产品,对我们来说都是相当于是在开发全新的模块。

尽管我们公司倡导敏捷开发的理念,希望能够迅速推出新产品,但脑功能连接和结构链接的应用领域相对专业和小众,特定模块相对较新,需要我们投入更多的时间和资源来开发。我们需要从基础做起,逐步构建每个工具,然后将它们整合成具有实用功能的完整产品。这个过程需要很长的时间,但是,一旦这些基础组件或模块开发完成,未来开发与功能连接和结构连接相关的应用时,我们将能够更加迅速地进行。

在这一过程中,尽管主要由我们公司内部团队负责,但我们非常重视与应用端的专家,这包括医院和科研院所的专业人士,尤其是在上海地区。这些交流对于我们开发的产品至关重要,因为它们直接影响到工具的最终使用要求。除了临床使用,这些工具也广泛应用于临床研究。在临床研究中,我们不仅需要关注脑结构和功能连接的分析结果,还需要考虑如何将这些研究成果转化为学术论文,包括数据的呈现方式、图表的设计等。

为了达到学术发表的标准,我们需要进行大量的调研,了解当前领域内的研究者是如何展示他们的研究成果的。这包括对现有文献的研究,以及对图表和数据展示方法的深入分析。我们的目标是确保我们的产品不仅在技术上是先进的,而且在学术呈现上也能符合最高标准,以便能够为临床和科研工作带来真正的价值。


雷峰网:目前产品还有哪些方面有待完善,未来如何升级?

沈定刚:这两个产品我们都会持续迭代,持续和医生沟通,目标是让产品真正符合医生的临床需求。

比如在脑功能方向的产品上,我们会持续调研医生的科研需求,进一步让我们的产品可以更兼容医生的个性化需求;在脑纤维方面,我们会陆续增加一些编辑工具和交互功能,让我们的产品整体越来越适应临床的工作流等。



脑影像AI全景布局

雷峰网:总体来说,联影智能在脑方面的影像AI的整体布局是怎样的?

沈定刚:针对脑部的影像AI研究难度极大。联影智能在大脑影像AI领域的产品成果丰富,已实现卒中、肿瘤、神经退行性疾病等多疾病覆盖,CT、MR多模态覆盖。

以基层重大疾病脑卒中为例,公司已先后开发出5大智能辅诊系统+智能危急预警平台,构建「一站式脑卒中智能解决方案」,全方位覆盖卒中患者一站式CT检查流程。该解决方案具体包括:

1.  CT颅内出血智能分析系统

2.  CT脑缺血智能分析系统

3.  CTA头颈血管智能分析系统

4.  CTP脑灌注智能分析系统

5.  CTP/CTA脑侧支循环智能分析系统

6.  智能危急预警平台

我们在CT模态的布局是比较完善的,作为全国首个数智一体化卒中诊疗方案,该系列产品已深入赋能湖北枝江县域脑卒中诊疗,6个乡镇均具备基本的缺血性脑卒中的诊疗能力,落地短短数月内已拯救超50余个家庭危机,为当地60万人提供幸福保障。

总的来说,我们的脑影像AI产品线集中在两大块:

一是MR成像,包括对脑小血管病、脑转移肿瘤的研究,以及对脑科学的前瞻研究;

二是CT成像,针对脑卒中后脑组织变化的自动测量和诊断信息提供。


雷峰网:CT和MR这两种成像模式,在针对不同病种时各自有哪些特点。为什么我们这次主要选择MR来进行脑部相关产品的研发?

沈定刚:磁共振成像(MRI)的优势在于它对人体没有任何损害,因此可以用于年度体检或日常检查。而CT扫描虽然速度快,可能几秒钟就能完成,但存在辐射剂量问题。

CT在紧急情况下非常有用,因为它能迅速提供结果,MR通常需要更长的扫描时间。

但CT主要观察骨骼结构,对于软组织的对比度表现则相对有限。在细节的呈现上,MR更为精细。MR能够清晰地展示脑部微小的变化,包括白质和灰质的对比度。

例如,在脑卒中发生后,如果需要进一步明确卒中导致的脑组织变化,MR能够区分脑组织中哪些部分已经坏死,哪些部分仍有可能被挽救,这对后续的治疗计划和预后评估非常重要。此外,MR还能检测到微小的出血点,这对于早期诊断脑小血管病等病症至关重要。我们还开发了能够自动识别并标记出脑部出血点的工具。在癌症转移方面,MR也能发现脑部的小转移瘤,这些在CT上可能难以辨认。我们的工具能够帮助医生节省时间,提高诊断的准确性。

总的来说,CT和MR各有优势,我们在这两个领域都进行了大量的研究和开发工作。我们的产品体现了这些技术各自的应用价值,它们在医学诊断中是互补的,而不是相互替代的。


雷峰网:在联影智能的脑影像AI技术和产品版图中,哪些领域已取得显著进展,哪些仍处于研发阶段?在临床和科研两块的服务上,公司策略是怎样的?

沈定刚:取得显著进展的正是刚才提到的--脑卒中AI的“枝江模式”。而脑影像AI的一些细分方向则处在研发阶段,包括任务态脑功能、儿童脑损伤、核医学 MI 脑、脑肿瘤等。

所以说,我们的脑影像AI产品的定位,可以用“顶天立地”来形容,既着眼于高端的科研领域,也瞄准了基层的危重疾病应用,这样可以使得我们能够适应各种实际需求和应用场景。

对于“顶天”的高端科研产品,恰恰是最优秀的一批三甲医院、国家医学中心等医院,才有能力对极复杂、具备挑战的脑部疑难杂症进行深入的探索。我们的高端脑科研产品针对大脑疑难杂症的研究和探索提供了强大的工具。

而有力地支持和推动专家们的研究工作,进而满足脑科学调研课题时挑战性的、多样化的需求。对于像脑卒中等基层危重疾病所延伸出的“立地”的产品,恰恰对可以满足基层医疗机构的需求,因为这类基层重大疾病有着广泛性和严重性。因此,我们正持续推动将AI技术这一高质量的资源持续推向基层医疗机构,帮助他们提升对这类疾病的诊断和处理能力,从而惠及更广泛的病患群体。

在科研服务这块,我们的策略主要也可分为两个:

一方面,我们强调“授人以鱼不如授人以渔”。脑科学研究非常复杂,但也是医生们都非常感兴趣、想尝试的方向。所以我们的策略,就是以临床易用为导向,提供好用的科研工具,去降低脑研究的门槛,让医生不需要很高的学习成本,就可以学会用人工智能技术进行脑科学的探索,满足自己的个性化科研需求。

另一方面,我们坚持产学研医,针对之前提到的重大脑科研项目,我们和领域内的专家、医院都建立了联盟组织,比如儿童脑智发育联盟、中国精神影像联盟、孤独症脑影像联盟等,了解专家们认为重要的探索方向,紧密的协作创新,针对性地开展一系列的重大研究。总的来说,目前我们讨论的大多数产品都已经得到了广泛的使用。以脑转移瘤检测为例,由于癌症转移到大脑的患者本身就相对较少,因此这项技术的应用范围有限。

即便如此,我们与中山大学肿瘤医院等国内顶尖的肿瘤医院合作开发的脑转移瘤检测工具,在目标医院中的占有率却非常高。


雷峰网:联影智能在脑影像AI领域的布局,对学术界和业界也有着积极的教育和引导作用。您亲身感受的经历有哪些?

沈定刚:临床上,我们已经收到了医院的合作意向,例如与杭州的儿童医院、广州的妇女儿童医疗中心进行的新生儿和儿童的脑部研究与应用。

我们的工作不仅限于提供医生使用的工具,而且还引领了新的研究方向。特别是在儿童和老年人脑健康方面,我们主持和参与了国家级的重大项目。我们称之为“一老一小”脑研究,包括中国脑计划的0~6岁儿童的早期脑发育研究、6~18岁青少年的大脑发育研究,以及科技部重大项目中针对阿尔兹海默病的早期诊断研究。

另外,我们探索了“脑心肠轴”(脑部疾病与心脏及肠道健康之间联系)的概念,开发了基于影像的诊断工具,这些工具能够帮助识别大脑萎缩区域,从而预测和诊断老年性疾病。这些工作不仅包括产品开发,还涉及新概念、新方法和新工具的研发,旨在引领学术研究方向。这是一种双向奔赴,我们不仅提供了工具供医生和研究人员使用,如通过脑形态分析来识别萎缩区域,最终转化为实用的工具和产品,而且让我们在未来的产品开发和市场推广中更有信心。


雷峰网:目前,国内还有哪些团队在脑影像AI领域取得了显著成果?他们的工作对整个领域的发展有哪些积极贡献?

沈定刚:在国内,脑科学研究的团队规模正在不断扩大。与10年前相比,如今除了有研究人类大脑的团队,还有团队专注于动物模型,比如老鼠、猴子来研究大脑的精细结构。

相比而言,通过创建自闭症猴模型,研究人员可以观察脑结构和功能的变化,并研究治疗后的效果。这些动物模型允许进行一系列脑部操作,如手术切断特定连接,来观察大脑的变化。针对人类大脑的研究则更为被动。我们不能像对待动物模型那样干预人脑,因此,研究通常依赖于使用影像学工具进行非侵入性的观察。因此,这些研究主要集中在大脑图谱的绘制和脑网络研究上,尤其是功能网络的研究,而结构网络的研究相对较少。


个人视角与公司愿景

雷峰网:脑科学作为一门基础科学,其核心在于深入理解大脑的生物学特性;而脑影像AI则更侧重于技术应用,解决医学和科研中的具体问题。您如何看待这一分野?您个人的研究方向是后者吗,成果有哪些?

沈定刚:我的研究主要集中在宏观层面,即通过影像学方法来探究大脑的工作原理。

在脑科学研究中,我们关注的尺度可以从微观的分子和神经元连接到宏观的脑组织结构。影像学作为一种宏观层面的研究工具,能够让我们观察到大脑中每个点的亮暗变化,而这些变化背后实际上包含了大量的脑组织信息。

我的工作涉及使用磁共振成像(MRI)等技术,包括结构连接、功能连接和形态学分析,以及通过注射造影剂进行的正电子发射断层扫描(PET),来研究大脑的功能和代谢活动。

通过综合这些宏观层面的信息,我们可以更好地理解大脑的工作机制,以及在不同年龄阶段什么样的大脑活动是正常的,什么样的变化可能指示疾病的存在。

比如,自1999年以来,我和团队一直在进行纵向的大脑老化研究,从55岁开始跟踪18年。我们的目标是深入了解大脑在正常老化过程中的变化,以及在出现认知衰退时大脑的状态。通过这些研究,我们积累了大量的数据,为理解大脑的老化过程和相关疾病提供了宝贵的信息。

在这个领域,我们已经取得了一些成果,将宏观层面的脑影像数据转化为对疾病诊断和治疗有用的信息。在这一工作上的贡献,我可以说在脑科学领域中,使用计算机和机器学习技术辅助个体疾病的诊断,我是全球首批进行这样尝试的研究者之一。这项工作始于20多年前,那时机器学习还未被广泛认知,而今天它已发展成为深度学习和人工智能的基石。

在儿童早期发展方面,自2008年起,我将研究方向从成人扩展到儿童,特别是对一岁前的儿童进行研究。由于儿童的大脑结构和功能与成人有显著不同,许多成人研究中使用的工具在儿童研究中并不适用,因此需要开发新的工具。

我在美国北卡罗来纳大学(UNC)的团队开发了许多新的工具,这也是我们能够获得美国儿童脑计划资助的原因。我们的工作对儿童早期大脑发育的研究具有重要意义。我们创建了首个儿童脑图谱,称为“UNC Infant Brain Atlas”,为神经科学研究提供了新的视角。我们的研究不仅提高了分析工具的精度,还解答了关于儿童大脑如何发育的许多神经科学问题。

总的来说,在美国期间,我将超过75%的时间投入到脑科学研究中,主要集中在老年和儿童两个领域。从1999年到2008年的九年多时间里,我主要研究大脑老化。

2008年以后,我的研究扩展到儿童早期发展,特别是0~5岁儿童的大脑发育。我们的工作在国际上首次实现了多项成果,包括开发的工具、制定的图谱以及对儿童大脑发育规律的研究,这些都是我们团队的原创性贡献。近些年来,我和团队的工作还包括从传统的群体研究转向个体化研究。传统群体研究关注的是一群人的大脑特征,例如比较健康人群与患病人群的大脑差异。

然而,这种方法对个体患者的诊断帮助有限。因为每个人的大脑都像我们的面孔一样独一无二,如果我们观察大脑的褶皱和形态,就会发现每个人的大脑都有所不同,形态各异。因此,我们利用计算机和机器学习技术,对个体的大脑进行分析,只需通过一次扫描,就能判断其大脑是否正常或是否患有老年性痴呆症。

这种个体化诊断的方法在当时是非常创新的,也是我在该领域做出的主要贡献之一。值得一提的是,在脑影像学中,我们需要将这些各不相同的大脑结构进行标准化,使之在图像上尽可能相似。这个过程称为“图像配准”。因此我将机器学习技术引入脑图像配准,推出了我在该领域中一个非常著名的贡献--大脑弹性配准算法HAMMER。


雷峰网:对于个人未来的研究工作,您有何展望?

沈定刚:我还是会继续坚持我目前的研究方向。正如刚才提到的,自从1999年开始,我们一直致力于老年性痴呆症的研究,这项工作我们至今还在持续进行。2008年,我加入了北卡罗来纳大学(UNC),那里的团队对儿童早期脑发育非常感兴趣。尽管已经收集了大量影像数据,但缺乏处理这些数据的专家。我加入后,成功整合了这些资源。

现在,尽管我们回到了中国,我们仍将继续这一研究工作。我未来的研究轨迹是连贯且可预测的,不会随波逐流或追逐短期热点。

这种一贯性也是为什么我虽然不是0~6岁和6~18岁这两个国家项目的PI,但专家们仍然支持我们这所年轻的学校。当时,我们项目的PI还只是副教授,但我们的声誉是我们在这个领域深耕多年积累的结果,而不是一时兴起或仅仅为了追求研究资金。专家们知道我们是真正热爱并致力于这项研究的。

因此,经过25年的老年人脑的研究历程,包括16年的儿童脑发育研究,我打算继续沿着这个方向深入研究。


雷峰网:联影智能在医学影像AI领域,而不仅仅是脑影像领域,都有着深入的研究和布局。面对如此广泛的研究领域,您是如何分配自己的精力的呢?

沈定刚:首先,每个研究领域都需要投入时间,但并不意味着每个领域投入的时间都是均等的。只有合理分配时间,才能提高工作效率。在美国工作期间,我曾负责不少由NIH资助的研究项目。一般情况下,研究人员可能只能承担至多3-4个R01项目,但我曾同时主持8个R01项目。每拿一个新的项目,管理机构的主任们都会开会讨论是否同意再资助。

我向他们解释,一般人每天工作8小时,而我经常工作14-15小时,因此在时间上我已经占有优势。

其次,我的工作效率也比大多数人高,这使得我能够承担更多的工作量。

从结果来看,无论是每年还是前几年的成果,包括发表的文章数量,都证明了我的工作量和效率。项目的数量与发表的文章数量是成正比的,这证明了我在时间投入、工作效率以及成果产出方面的努力都是合理的。

当然,我不可能在每个项目上都花费相同的时间。对于刚开始的项目,我会投入更多的时间来引导它们走上正轨。随后,我可能会每周进行一次审查和讨论,以确保问题能够得到及时解决,从而提高整个团队的工作效率。

随着时间的推移,我能够处理越来越多的事务。我本人在多个领域拥有深厚的经验,而我的团队成员们,他们中的许多人是从海外归来的专家,每个人都在自己擅长的领域中有着深入的专业知识和多年的深耕经验。因此,当我们将这些人才的力量汇聚在一起时,我们能够覆盖广泛的研究领域和疾病类型。

自从2017年底加入联影智能以来,这六年里联影智能打造了十几种平台和超过100款应用。这些成果的取得,可以归功于我们所倡导的敏捷开发方法。我们开发了许多基础工具和组件,这使得我们能够快速地将它们应用于新的研究领域,通过简单的调整和数据训练,迅速形成新的产品。

如果我们不是采用这种组件化的开发方式,而是逐一从0开始开发每个产品,那么我们肯定无法达到目前的成就。目前在医学影像AI领域,我们可以说提供了全方位的服务,覆盖了从疾病的基础研究到临床应用的整个链条。


雷峰网:在本届ISMRM会议上,这两大MR脑新品重点展示。选择在这一国际平台上展出MR脑产品的策略考量是什么?

沈定刚:考量有三。

首先是将我们在大脑磁共振领域的最新AI产品和技术分享给大家。

ISMRM是磁共振领域的顶级国际舞台,汇聚了来自全球的专家领袖。而磁共振,恰恰也是研究人脑最常用的成像技术之一。大脑磁共振影像AI技术,是脑科学研究中很好的切入点,但因为大脑磁共振影像很复杂,研究难度也同样非常大。所以我相信,业界会对大脑磁共振领域的最新进展都有着比较高的关注和期待。我们在大脑影像AI领域一直处在比较前沿的位置。

在这次ISMRM会议上,我们展出了我们在MR脑方面的很多产品,其中就包括了两个今年最新推出的新品--MR脑静息态功能智能分析系统、MR脑纤维智能分析系统,都很有标杆意义。这次展会期间,有神经领域的专家也有提到,我们的这些AI工具会对自己的研究产生帮助。

第二个重要考量是向学术界传递关键信息:以临床导向做学术。

以临床为导向进行科学研究,是我在学术研究过程中一直持有的想法。过去学术界许多研究成果往往仅仅停留在理论方法和发表的论文上,真正能够转化为实际应用,为临床实践带来帮助的方法却并不多见。但临床导向意味着我们的学术研究目标是以寻求解决实际临床问题、满足临床需求为主的。它能够确保我们的研究工作不仅停留在理论层面,而是能够转化为具有实际应用价值的技术和产品,从而产生真切的社会效益。

举一个我们脑产品的一个例子,是我们这次同步展出的“MR脑转移瘤智能分析系统”。脑转移瘤属于分布不定、多发常见的很微小的转移灶,对医生来说非常容易漏诊。

针对这个痛点,我们与中山大学肿瘤防治中心影像科合作来开发了这套系统。这套系统临床价值很高,相关的科研成果也非常好,在一年内就有两次在神经肿瘤的顶级杂志中做了发表,这个转化案例是非常成功。这也证明了具备显著临床价值的学术研究,它的价值也会非常之高。

第三个重要考量是向产业界传递关键信息:以全栈全谱为导向做产品。

全栈全谱,就是从全流程、全模态的角度来研究和开发医学影像 AI,因为只有这样全面的AI融入,才可以给临床和科研带来更多价值。我相信这目前也是我们这个行业的大趋势。正是基于这样的思考,我们针对脑科学研究领域的产品,在脑结构、脑功能、脑纤维上都已经做了覆盖。因为结构、功能、纤维是脑科学研究最全面的维度,通过这样全面的布局,我们可以支持医生对像脑发育、神经退行性疾病、神经血管性病变等等的各领域研究。


雷峰网:您作为获得ISMRM FELLOW荣誉的专家,能否分享此次获选的理由?

沈定刚:ISMRM是一个全球性的学术组织,专注于医学磁共振成像(MRI)。今年大约有6000多人参加其年会,有不少中国区的参与者。ISMRM是一个非常大的国际学会,其成员主要是从事MRI相关工作的专业人士。我的研究领域,特别是在图像分析方面,比如MRI图像分析,在该学会中属于少数派,并不是主流。

在这样的背景下,获得Fellow荣誉的难度自然更大。尽管我不是主流领域的研究者,但ISMRM的成员对我的工作非常了解,尤其是我在脑科学研究方面的贡献,以及我如何将机器学习、深度学习以及人工智能技术应用于MRI图像分析。我的工作在学术界得到了广泛认可,特别是在MRI图像快速重建方面,以及MRI在老年性痴呆症和儿童早期发展等应用领域的研究。

在2014至2015年期间,当深度学习刚开始兴起时,我被ISMRM邀请去讲解这一领域的知识。那时,深度学习在磁共振成像中的应用还鲜为人知,但我的讲解为听众们介绍了这一最新技术,并展示了如何利用深度学习加速MRI图像的重建。

在随后的十年中,我持续推动了深度学习在MRI领域的应用,不仅获得了学术界的认可,也使得整个领域开始重视深度学习和人工智能的应用。


雷峰网:今年的ISMRM会议,有哪些报告或产品给您留下了深刻印象,透露出接下来医学影像AI的发展趋势?

沈定刚:在ISMRM会议上,无论是大会报告还是特别主题报告,一个特别强调的议题是“低场磁共振成像技术”。之前的趋势是向越来越高的磁场发展,如从1.5T到3T,甚至5T和7T。

然而,这种向高场发展的趋势意味着能够负担得起的机构越来越少。此外,维持这些高场系统的运营成本非常高,并且需要稳定的电力供应和良好的维护条件。在非洲等边缘地区,由于电力供应不稳定,经济预算有限,因此很难普及这些昂贵且维护费用高昂的设备。

因此,低场磁共振成像技术正成为一个新兴的方向。

例如,最近香港大学的研究团队发表了一篇关于0.05T磁共振成像的论文。这种设备只需简单的电源连接即可使用,就像家用吹风机一样方便。虽然初始成像质量可能不如高场设备,但其易于获取和使用的特点,意味着它将来可能在贫困地区和边远地区得到广泛应用。

我一直认为低场磁共振成像技术是一个极其重要的研究方向。这也与上海科技大学生物医学工程学院的研究方向相契合。学院建立时,我们就将其作为一个重要研究领域,后来我们从美国引进了一位教授来专注于这一领域的研究。

我相信,这种易于获取和使用的磁共振成像技术--低场磁共振技术--将成为未来医学成像的重要方向。就像我们使用工具一样,有时候需要大锤来破碎大石头,而有时候则需要小锤或精细的雕刻工具来进行细致的工作。磁共振成像技术也是如此,不同的应用场景需要不同的成像工具。

可以想象,低场磁共振成像设备将来可以放置在社区中心或大型商场内,方便公众使用。尤其在商场里,你就像准备理发一样坐下,很快就通过磁共振成像技术,结合人工智能分析,为顾客提供脑部健康状况的快速检测。

这样的技术不仅可以告诉我们当前的健康状况,还能与之前的扫描结果比较,展示出脑部的变化。虽然大规模普及可能还需要一段时间,但我坚信这是正确的方向。这也是我们学院在人才引进和研究方向选择上的一个重要决策。


雷峰网:作为公司的CEO,您如何看待联影智能在医学影像AI领域的整体布局?对于公司的未来发展,您有何愿景和规划?

沈定刚:首先,技术的发展日新月异,我们必须紧跟时代的步伐。GPT等大型模型技术正在引领新的技术革命,但我们不仅仅接受新技术,更重要的是理解它们内在的规律,并将这些理解深入地应用到我们的产品开发和应用中。

比如在大型模型技术出现之前,我们在学校里就已经进行了大量的研究,这些研究成果随后也被整合到我们的产品中。

在公司中,我提出了“快速迭代”的理念,并且倡导利用大型模型的概念来推动产品开发。大型模型的能力在于它可以同时学习多个任务,这将改变我们以往的产品开发模式。这意味着我们将从过去逐个开发AI产品的方式,转变为利用大型模型批量开发应用,大大提高我们的开发效率。

联影智能强调的是开发自己的组件化工具,深入理解大型模型中的关键技术,如transformer,并探索如何将这些技术融入我们现有的代码和产品中。我们的研发方向始终保持聚焦和深入,通过不断的技术创新和产品迭代,将联影智能打造成医学影像AI领域的领导者,为医疗行业带来更多的价值和可能性。


]]>
医疗AI //m.drvow.com/category/healthai/hL8sVAVFveUf2Smn.html#comments Wed, 22 May 2024 15:12:00 +0800
上万医疗人奔赴,这场“展”到底兑现了哪些承诺? //m.drvow.com/category/healthai/72Wx2cu992AGpXtM.html 2024年5月10日18点17分,为期三天的“第八届未来医疗生态展会”(以下简称“VBEF”)正式落下了帷幕。

据悉,本次VBEF以“新青年”为主题,由动脉网、VB100、蛋壳研究院、动脉橙主办,天津滨海中关村科技园管委会、北塘湾数字经济产业园战略合作支持,未来医疗生态展区联合健康智谷共同呈现。会议全程共有上万人参与,包括国家院士、专家学者、企业创始人、机构合伙人、地方招商代表、渠道商以及“海外买手团”等在内,他们在过去三天的时间里,大量分布在趋势峰会、产品发布会、细分领域论坛、项目路演、展台以及对接会等各大场合。

 (火爆的VBEF现场)

而在人头攒动的会场,我们也非常关注实际的“交付”,尤其是在当前市场寒冬以及新一轮行业竞争重启的时代背景下,以结果为导向已经愈发重要。于是,在本届VBEF上,我们看到了数百万交易合作的达成;同时也看到了印尼知名专家选品团、俄罗斯大药企等不远万里来到现场,并已经与中国企业签订了意向合作;另外在项目路演以及创新产品发布端,某位高校教授兴奋地在朋友圈表示,下一轮融资即将到账;而在业务合作方面,某家高端眼科器械企业在展台上与某地招商团队已达成一致,后续将推动产品快速落地。

当然,我们也看到了参与人的具体变化。2021年,在第五届“未来医疗百强榜单”上,某位创始人获得了“年度医疗健康青年企业家”,而在今年,他所创立的企业又斩获了“年度潜力企业”。面向未来,他还表示,“争取在下一次,能够进入‘中国创新器械与智能制造榜TOP100’。”

事实上,这些“交付”只是冰山一角,在本届VBEF上,诸如此类的交易、合作以及成长还有很多。

创新器械、创新药齐上阵,成果转化“交易”多

在此次VBEF上,“成果转化”无疑是一个关键词,不仅有大量科研院校以及知名学者专家深度参与,另外还有近300款创新医疗产品在路演、发布会以及展台悉数亮相。这刚好验证了全球健康产业创新中心执行主任王竟菁在科研成果转化论坛上发出的感叹,她提到,未来10年,科研成果转化将有一个好的收益和发展。

但在此之前,仍有一些问题需要直面解决。对此,在心血管创新论坛上,厦门大学附属心血管病医院院长王焱就谈道,“医工结合加上创新药械研发,在五到十年前发展势头较旺,但近两年受挫明显”。这一方面是因为创新的要求在不断提高,已经从“跟随式创新”过渡到“颠覆性创新”;另一方面则是因为成果转化本身也到了需要兑现成果的关键阶段,因此需要更完善的创新与转化生态链条来作支撑。

而沿着这两大逻辑往下,在此次VBEF上,我们看到了很多医疗成果“转化”的高光时刻。

比如围绕技术本身,在脑科学、合成生物学、心血管、AI医学影像、再生材料、核药、医疗机器人等前沿创新领域,基于技术层面的科研合作正全面展开。以某位清华大学教授为例,通过创新产品发布,他与某家器械企业已达成初步意向合作,双方未来将在高端器械方面开展更进一步的研究。

 (成果转化合作正在全方位展开)

另外在医工结合方面,某家医疗设备企业创始人在“中国医工结合大会”现场,已经与某位临床专家一拍即合,未来将在现有技术上进行再升级转化,将在未来三到五年内推动产品落地,以此满足心血管疾病领域的临床需求。事实上,诸如此类的医工合作对于成果转化意义重大,为此,清华大学数字健康创新中心常务副主任冯晓彬就谈道,“工程化技术对于外科而言是非常重要的推动力”。

当然,基于医疗创新与转化链条搭建方面的“合作”也在大面积发生。就比如此次参展的粤港澳大湾区高性能医疗器械创新中心,据悉,他们已与多家医疗企业以及投资机构达成意向合作,未来将在创新转化赋能方面探索更多的可能性。另外还有中国科学院先进医疗器械产业孵化联盟,通过“2024创新成果发布会”,不仅帮助多项创新技术与产业方牵线搭桥,另外也借此吸引到了诸多生态合作伙伴,创新转化产业链正在逐渐完善。

已对接上百家意向企业,即将落地

在此次VBEF上,天津经济技术开发区可谓收获颇丰,据相关人员透露,他们派出了专业园区、政府引导资金、国资运营公司、产教联合体,共同与医疗企业和投资机构交流,在过去三天已与近百家医疗企业、投资机构建立了联系,其中有多家已明确表示将在会后进行实地拜访,就后续落地与业务合作展开进一步地沟通。除此之外,天津经济技术开发区还与投资机构、科研院校、海外买手团以及各渠道商等进行了交流,未来将在推动天津医疗产业发展方面展开各个维度的业务合作。

而除了天津,北京、上海、深圳、佛山、武汉、山东、湖南、四川等地的产业园以及招商代表也都在VBEF现场达成了不少合作协议。对此,某区域负责人谈道,“参与此外VBEF,我们最大的感受是不虚此行,一方面我们了解了行业的最新动态,这对我们后续进行战略调整有一定指导价值;另一方面我们也接触了很多产业资源,包括企业、投资机构等,其中有七八家已经约好下周要当面进行更进一步地沟通。” 

当然,合作是双向的,对于诸多产业方来说,与地方交流密切,实际上也是在抢抓行业发展机遇。 

以某家器械企业为例,他们今年计划将在西南地区开展业务合作,但一直苦恼没有相应的对接资源。而在此次VBEF上,创始人刚好与成都当地招商负责人进行了直接碰面,在交流各自的合作意向及需求之后,双方在展台现场就已经初步拟定合作纲要,未来将很快兑现落地。 

另外还有投资机构,在美元基金大范围退出的市场背景下,地方引导基金当前已成为中国医疗投资市场的源头活水,因此对于众多投资机构来说,除了要链接更多有价值的创新项目,同时也要与地方基金产生联系,以便于后期募资。于是在此次VBEF中,投资人与地方代表交流的场面层出不穷,相关专项基金或将在未来快速落地。

近20国别深度参与,出海一触即发

当下,出海正成为医疗产业的热门话题。

背后原因有二:一方面,出海是一个巨大的增量市场;另一方面,前沿创新与国产替代不断推进,我国诸多医疗产品已经具备与全球最强对手同台竞技的技术实力。正是基于此,出海一触即发,众多创新企业都欲抓住本轮机会。

VBEF也为此做足了准备——在展会期间,近20国别单位/机构深度参与出海讨论,现场更是集结了一支庞大的“海外买手团”;同时,包括阿斯利康、君联资本等在内的出海“先行者”也深度参与其中,并就最新的出海实践和经验进行交流碰撞。 

比如在“医疗器械出海论坛暨全球医疗创新产品选品会”上,包括澳大利亚、比利时、爱尔兰、新加坡、英国、德国、印度尼西亚、西班牙、俄罗斯等多国驻华机构、国际经销商、行业领军企业等,围绕市场趋势、热门出海目的地、技术创新等议题展开深入研讨,共同探讨行业发展的新模式、新路径,分享成功经验。

“爱尔兰是欧洲第二大医疗器械出口国,年出口额达130亿欧元在爱尔兰,有75%的MNC选择在本地开展研发工作,重点优势行业为心脏、心血管、骨科、诊断、眼科等。值得一提的还有,中国企业在海外最大的一笔生命科学的投资就在爱尔兰。”爱尔兰投资发展局中国区生命科学行业总监肖嘉表示。

英国驻上海总领事馆生命科学和医疗科技领事韩睿提到:“英国提供了较多的融资机会,以促进处于不同发展阶段的医疗健康企业迅速顺利地扩大规模。英国高校、研究组织、企业、慈善机构和政府合作,为研发创造环境此外英国通过研发出口支出抵免政策降低了税收,旨在持续与中国投资者合作,推动双方开展商业合作。”

“加泰罗尼亚在西班牙的经济体量相当于中国的长三角、珠三角。加泰罗尼亚设立了为促进企业发展和贸易交流的政府性机构,以帮助来自不同国家、不同地区的企业开展业务。当前,加泰罗尼亚的当地企业向全球公开募集技术解决方案,尤其想寻求关于心理健康治理的数字化解决方案。”西班牙加泰贸投局资深贸易投资官张淑敏表示。

此外,以单一地域进行深度交流的专场对接会也是本届VBEF的一大亮点。5月9日,在“出海(印度尼西亚)专场对接会”上,众多想了解印尼市场情况的参会人员挤满了门口,论坛嘉宾分别从印尼市场需求、政策法规及投资环境、如何与印尼企业建立紧密合作关系等话题进行了分享和探讨。

不仅如此,印度尼西亚企业也表示,借此机会了解了中国企业的技术实力、产品优势及市场布局,并寻找到了合适的合作伙伴,后续会共同推动双边经贸合作,加速产业的全球化发展。

 (来自全球各地的海外巡展团)

而在展厅现场,来自海外的专业巡展团也与展会企业进行了深入交流,并重点关注与寻求心内、麻醉、肝胆、呼吸、血管内导管、泌尿、牙科、口腔、医美原材料、睡眠、基因技术等产品,为进一步合作提供了契机;同时,在涵盖欧洲、北美、澳洲、中东以及东南亚等独立展区前,往来人员同样络绎不绝。

“此次巡展在前期做了大量工作,包括需求梳理和招募,最终吸引到近20个国别的海外巡展团。”此次负责海外巡展团对接的工作人员介绍,“在大量调研的基础上,我们会把各个展商最想出海的目的地询问清楚,并做好记录和梳理,并将相关项目提前给到海外巡展团,看是否感兴趣。需求匹配后,当大家来到展会现场时,就能高效、精准对接。”

帮助企业出海的第三方服务商在展会现场也受到了广泛关注。以位于新合作展区B19展位的Lumina为例,就涌进很多前来咨询的行业人士。

“出海不仅是当下医疗创新企业需要重视的事情,也是一个需要长期坚持的动作,这就要求有一个完整的生态体系作支撑。所以在后续,无论是VBEF作为桥梁,还是政产学研医投等各方参与者一起行动,都要积极共建良好生态,一起把出海事业做大做强。”一位在现场的投资人告诉动脉网。

 超500款医疗创新产品悉数亮相,对接次数逾万次

在VBEF现场,创新产品成为最受行业关注的议题之一。整个展会期间,有超过500家企业和产品参加展会,涵盖医疗器械、医药、数字医疗、消费医疗、医疗供应链服务等赛道。而从三天的情况来看,新产品展区涌进了大量人流。 

“这几天来展台加我们微信的人应该有近百人,大家对产品都很感兴趣,不少专业观众也表示后续会到公司来参观,估计有超20家潜在意向客户。”一家参展企业的客户经理表示。事实上,在三天展会期间,诸如此类的创新产品对接(包括产品咨询、意向合作、现场签订合同等)次数多达上万次。

(VBEF现场咨询、体验、建立联系的人络绎不绝)

值得一提的是,“医疗健康产业创新力产品榜”首次面向产业发布,这些产品的评价标准来自最具技术先进性、国产替代价值高、满足临床未满足需求、具有全球竞争力、行业引领效应突出等维度,共计200款具有代表性的创新医疗产品及解决方案上榜,它们主要来自生物药及生物制品、高端智造及医疗器械、数字创新技术及供应链赋能产品、医疗产业链四大领域,其中高达80%的产品和解决方案属于全球首发/首创医疗产品,向世界集中展示了中国医疗健康产业的创新实力。

比如上榜的上海源奇生物医药科技有限公司独立研发的人MET基因扩增数字PCR检测试剂盒,该产品就填补了数字PCR技术在肺癌筛查领域的应用空白;又比如登榜的迈迪斯医疗的“超声用电磁定位穿刺引导设备”,突破了电磁定位“卡脖子”技术,通过将电磁导航与超声影像结合,实现了介入手术的全程实时可视化。 

一位在现场的医疗器械公司联合创始人告诉动脉网,能一次集中看这么多全球顶尖的创新医疗产品实属难得,特别是来自多个领域的众多产品已经掌握了核心技术,真正为临床带来了价值,这让他对国产创新势力有了更多信心和期待。

不仅如此,在现场展示的还有一些科研院所的前沿新产品,例如5月8日在展会的中心舞台,中国科学院先进医疗器械产业孵化联盟2024创新成果进行了发布;5月10日,中国院校优秀科研创新成果发布。

放大创新产品的传播势能也是本次VBEF的重要看点。比如5月10日,在VBEF分会场上,动脉网、VB100联合高特佳投资主办的“医疗器械出海论坛暨全球医疗创新产品选品会”受到了与会嘉宾们的广泛关注。

其中,作为论坛的重要组成部分,全球医疗创新产品选品会集中展示了中国医疗器械的创新成果和优质产品,国际经销商PT. Lumina Procare Meditech、 MedRhein GmbH、PT.MBA Group、Access Tech、Eco Medtech等,医院采购方Susilo Chandra、Tommy Daindes、Ragil Nur Rosyadi、Syarif Bakri,出海赋能方ASK Health、MDCC、国贸通、健商出海、希毅医学等专业观众亲临现场,深入了解了中国医疗器械的创新实力和产品优势。

不难发现,极具引领性和创新力产品的集中展示,让中国首发首创的医疗创新成果得到了最大程度的发声,也向医疗创新者诠释了未来趋势,真正呈现出创新的力量。

正在发轫的新周期

2016年,第一届“未来医疗百强大会”在北京举办,而在之后的八年时间里,百强大会先后去到了苏州、上海等地,在感受医疗行业真实变化与产业变迁的同时,也见证了上万家医疗企业和投资机构不断地在向各自的里程碑迈进。 

而时隔八年后,百强大会已全新升级为“未来医疗生态展会”,并重新回到了北京,这在很大程度上是希望以此为节点,开启一个全新的周期。

这极具战略意义,因为当前临床需求的不断更迭以及医疗行业的显著变化,正在催生一场新的产业革命,新的问题需要解答,新的困难需要克服,新的机遇当然也需要抓住。对此,蛋黄科技创始人李大韬在大会致辞中也谈道,“我们正处在一个非常关键的新时代入口中,这一新时代的增长动力一方面来自基于新技术平台所产生的新解法和新范式,另一方面则来自新的市场增量。” 

而透过此次VBEF,我们看到了诸多“有为青年”正站在这个新时代的入口中,他们正在为这个行业带来更多全新的变化。所以,作为“引路人”和“见证者”,“未来医疗生态展会”也将在未来兑现更多可能性。 

因此,非常期待下一次的会面。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/72Wx2cu992AGpXtM.html#comments Thu, 16 May 2024 15:40:00 +0800
百度何明科:大模型为医疗健康行业带来了哪些新可能? //m.drvow.com/category/healthai/e5qSrGdb5vjMX5M5.html 5月8日-10日,以“新青年”为主题的2024年VBEF未来医疗生态展会(以下简称“VBEF”)在北京召开,吸引了包括政府、医疗企业、投资机构、媒体等超万名医疗行业相关人士参与,共话未来医疗行业的创新趋势。

百度集团资深副总裁、大健康事业群组总裁何明科受邀出席并发表题为《大模型,“道生医”》的主题演讲。 

为什么是“道生医”?何明科解释到,“道”是指AI已从一个单纯的技术演变成引领人类命运共同体和共同富裕的“大道”;“生”是指AI已从辨别式到了生成式;“医”是指百度大健康事业群目前从事的医疗健康行业。“大模型,‘道生医’”即大模型如何利用生成式AI为医疗健康行业赋能。

何明科谈到,AI已逐步改变了互联网、人类,乃至世界,“因为世界是信息、能量、物质三要素组成的,大模型很有可能改变这三个要素都改变”。AI在医疗健康产业亦是如此演进发展,譬如未来或许能由AI来制出一款真正的新药。

医疗健康行业被誉为是“永远年轻”的行业,在中国的市场规模已达到万亿级别且始终保持着稳定的增速。作为始终被资本市场密切关注、聚集了最高端人才、使用着最新技术的“永远年轻”的行业,医疗健康行业同样也会因AI技术发生变革。何明科表示,虽然AI不能直接给人类看病,但AI却是在加速渗透医疗健康行业,譬如改变大家的就医决策和就医行为,辅助医疗终端设备和软件分析平台用于健康管理,驱动新药研发等,应用范围非常广。

那百度是如何实践的呢?何明科表示,是用互联网+AI共同促进:用互联网消灭“信息差”去实现医药患各方的精准匹配;用AI赋能“千行百业”, 举例来讲,百度对外发布的灵医大模型,在四层架构中的最底层设计了信创版、CPU版和ETG版,以适用于医院端的很多封闭场景,从算力层到能力层到应用层也能兼容SAAS、API等接入方式,适用于各类应用,分别服务医生、患者、药企。

何明科表示,百度关于大模型在医疗健康行业的落地探索,可以从前述“信息、能量、物质”三个维度来理解:

首先,信息层面即“AI+科普”,利用大模型在“理解、生成、逻辑、记忆”上的能力,形成一个“全能助手”,实现更便捷的阅读、更高效的检索(AI健康助手)、更精准的医患匹配(全网找医生/医院),以及更智能的交互(AI数字医生/AI用药说明书)。过去三年来,健康科普成为高频需求,其线上渗透率快速提升;随着健康中国战略的进一步深化落地,通过科普提高全民健康素养已成为各界共识,AI技术革新也给科普带来了重要的新机遇。

其次,能量层面,通过AI+的方式能够实现医疗资源的精准调配。一方面,在患者从未患疾病、出现症状、诊断治疗,再到预后康复的全流程下,提供对应的线上线下一体化诊疗,实现分级诊疗;另一方面,提供CDSS、医生Copilot等基层医疗系统和医生的赋能工具,助力提升基层诊疗规范及质量。目前,中国医疗资源结构整体有待优化,需要AI、数字化等手段来帮助解决。

最后,物质层面,通过AI+医药创新,即前期筹备(GBI医药行业情报数据库)、临床试验(患者精准招募平台)、上市推广(流量入口搜+推双引擎)、医生教育(CDSS规范化诊疗)、患者服务(灵医Bot大模型能力)等药企产品线全链路提供创新赋能,帮助药企进行一个更正向的循环。

何明科表示,百度大健康正全力通过AI+互联网赋能医疗健康行业,也希望通过这种尝试抛砖引玉,打开行业新格局,创造出更多更好的医疗解决方案,促进行业繁荣发展。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/e5qSrGdb5vjMX5M5.html#comments Fri, 10 May 2024 10:42:00 +0800
专访携云启源CEO张鑫磊:要把生物信息学的商业化做好,只做一环远远不够 //m.drvow.com/category/healthai/B4TSweq5A4LG0V8B.html

精准医疗,是以个体化医疗为宗旨的新型医疗模式。它考虑了个体在遗传、环境和生活方式上的差异,通过基因组、蛋白质组等生命组学技术,结合多维度的生物大数据整合,精确发现疾病的检测标志物和治疗靶点。生物信息学是实现精准医疗有效落地的关键因素。然而,生物信息学企业的商业化并非易事。

它要求创业者不仅要掌握前沿的算法技术,还需在市场调研、数据合规性、数据安全、产品用户体验等多个维度进行深入的思考与积累。

张鑫磊博士,作为北京携云启源科技有限公司(下称“携云启源”)的CEO,正引领企业在这一领域进行探索与实践。

实际上,这家公司早在2018年成立,却鲜少对外宣传。

究其原因,是因为生物信息的商业化落地,绝不仅仅只是数据分析这一个环节,上游的生物样本库、专病数据库如何建立,新发现的分子标志物和靶点怎么和下游的药械 企业对接,整个过程实则环环相扣。

“真正的价值来自于技术的深耕和闭环的完善。只有当内部的数据流转和分析能力形成一个高效、安全且符合临床需求的闭环时,公司才算是迈出了生物信息商业化的第一步。”张鑫磊博士表示。

换句话说,这便是携云启源提出的“数据驱动的医工转化”模式。从一份血液样本的管理,到临床数据的整合,精准医疗数据的产生,再到疾病的检测,整个流程都要参与进去,做一站式的服务。

张鑫磊博士之所以有如此的战略眼光,实际上要追溯于他学生时代的研究经历。

他的学术生涯始于南开大学物理学院生物物理专业,但他很快被生物信息学的魅力所吸引,加入了中国科学院生物物理研究所蒋太交教授团队。在研究所读书和工作期间,他参与了多项重要课题,包括基因组和蛋白质组的大数据分析平台构建,以及流感病毒的监控和演化规律研究。

这些经历为他日后的创业打下基础,也悄然塑造了他的科研观。

“生物信息学不仅是科研手段,我们开发算法更希望能够解决一些与健康直接相关的实际问题,比如精准医疗和传染病防控等。”

然而,即便拥有长期的学术熏陶和明确的创业愿景,他的团队也不得不面对生物信息学创业的多重挑战。诸如技术门槛高、数据获取成本高与管理难度大、法规遵从性要求严格、市场教育需求迫切,将问题的出发点指向一处:组建一个包含生物学家、数据科学家、软件工程师的跨学科团队。

现在,随着团队建设、服务闭环和市场条件的逐步具备,携云启源已经为多家顶级医院和国家临床医学中心建立了精准医疗数据基础设施和临床决策支持系统。在生殖衰老、过敏性疾病、自闭症、儿童肿瘤等专病方向上,已建立国内最大、最全的样本和数据库资源,在数据源头积累上也打造了难以被替代的竞争壁垒。

张鑫磊透露,作为一家AI医疗初创企业,在很快实现盈亏平衡之后,公司预计今年能实现近千万元的利润。但这并非终点,“长期来看,我们希望建立一个数据驱动的转化生态系统。”

确切来说,这是一个系统工程,需要多方协作,正如携云启源上游有用于生物样本存储的低温样本存储系统,下游动则有分子诊断和制药公司协作,在一些专病领域中,也会通过将新标志物或新药靶点专利授权给第三方机构,联合开发产品。

术业有专攻,对每一个有共同愿景的合作伙伴保有尊重,已然成了当下携云启源的价值观所在,以及商业模式能够落地的基础。

近期,2024年度「第二届生物信息与转化医学大会」落下帷幕。本届大会以 “人工智能时代的转化医学”为主题,由北京携云启源科技有限公司承办,旨在促进临床工作者与科研工作者的沟通与合作,加大科研单位、临床医院及生物医药科技企业间的有效联动。同时,这也是打造数据驱动的医工转化生态的一次卓有成效的交流平台。

借此契机,雷峰网与携云启源CEO张鑫磊进行了深入对话,以下为对话全文(经编辑):

从物理学到生物物理学,再到生物信息学

雷峰网:世纪初,您本科从物理学转为生物物理,又在博士选择了生物信息学专业,为什么二换专业?

张鑫磊:我本科(2002年~2006年)是南开大学物理学院的物理学专业,但我在大二就转到了生物物理专业。

主要的原因是在大一寒假,我阅读了罗静初老师翻译的《生物信息学概论》,这让我对计算生物学产生了浓厚的兴趣。当时我个人认为,基础物理学的研究已经达到了一定的高度,想要取得新的突破并不容易。

在生物学领域中,数学以及计算机技术的应用才刚刚起步。为了更加深入地从事这方面的交叉科学研究,我决定在硕士和博士学习期间(2006年~2011年)转向生物信息学领域。

蒋太交老师2005年从麻省理工学院回国,加入中国科学院生物物理研究所,他是最早一批回国的生物信息学研究者之一。我觉得这是一个很好的机会,便与蒋老师进行了沟通。他也非常鼓励具有数理专业背景的学生从事生物信息学研究,我就顺利地加入了他的实验室。

雷峰网:过去进行过哪些研究课题,它们如何塑造了您的专业技能和研究视角?

张鑫磊:在生物物理研究所,我参与了众多课题,大致分为两类:

一类是与我后来创业密切相关的精准医疗方向,即基因组和蛋白质组的大数据分析平台的构建以及相关的算法研发。我们实验室可以算是国内最早将人工智能算法应用于生命组学研究的团队之一。

另一类是蒋老师团队的代表性研究工作,即流感病毒的监控和演化规律研究。这部分虽然不是我牵头的工作,但也积累了很多自主研发算法的经验,实验室的研究成果曾被评为“中国科学十大进展”之一,并荣获中华医学会的一等奖和二等奖。

通过这些研究我有两个感悟,一是重视数据、二是重视应用场景。

对于我们这些专注于从事算法研究的人来说,算法本身更像是是一种技能,是相对而言更容易把握的一个环节,但对数据的把握能力往往更加关键。

国内真正的AI医疗场景落地,无论是公共卫生领域的传染病监控,还是医疗领域的多项应用,都需要高质量的数据进行支撑,然而在数据管理基础设施方面还非常薄弱,数据源头的质量保障不足,导致后续开发的AI模型如空中楼阁,不能产生实际价值。

另一方面,我们在选择课题方向时,可以有偏生物学机理机制的研究,也有偏应用的研究。我个人更倾向于开发算法应该能够解决一些关乎疾病诊断与公共卫生的实际问题,比如精准医疗和传染病防控等方向,这让我更能体会到所从事数据和算法工作的目标,在过程中也更容易产生兴趣和动力。

深度的“应用科学”,不只在学术界

雷峰网:什么原因促使您在2018年创立携云启源,而非继续在学术界发展?

张鑫磊:由于家庭的一些综合原因,我没有在博士毕业第一时间选择出国。同时,我认为自己所从事的方向,是有很大的应用需求,所以觉得产学研转化也是一条值得尝试的路径。2011年到2015年,我在中国科学院生物物理研究所工作,任助理研究员,这期间我参与了很多转化方面的课题,与一些IT企业合作搭建生物信息平台,尝试生物信息学来实际应用中的各种可能。

雷峰网:公司自成立以来,有哪些重要发展阶段和关键项目?

张鑫磊: 主要的里程碑事件包括公司2018年在北京的成立。不过最初的三年 ,我们是一家IVD企业的全资子公司。2021年12月,在母公司股东的支持下,我们进行了一次剥离,开始了独立运营。我们也迎来了一个快速发展的阶段,人员规模从最初的十几个人开始扩充。公司独立初始,也遇到了资金短缺的困难,感谢伽利略资本对我们持续的关注,在2022年3月获得了种子轮融资,使得公司能够顺利启航。2023年度的第三季度,我们完成了一轮由伽利略资本和零以资本共同领投的天使轮融资。尽管目前整个医疗创投行业,在前几年的热潮之后已经有所降温,但我们依然获得了新老股东的认可和帮助。

然而,作为一家数据公司,软件产品本身只是对数据源头进行质量控制的一个基础,数据能否产生衍生价值,这才是最关键的。

我们参与的重要项目很多,目前已经与八十多家三甲医院合作,建立了数百项精准医疗信息化系统。其中,我们与中日友好医院、北京协和医院、同仁医院这三家医院的合作中,更有代表性意义,我们不仅部署了平台软件,更从积累的样本和数据中发掘出了新的疾病检测分子标志物,这也是“数据驱动的医工转化”模式得到的实际应用和验证。

此外,我们还承担了一些具有里程碑意义的大型生物信息平台项目,如“慧眼蛋白质组学大科学设施平台”重要信息模块的开发建设。这是由贺福初院士团队牵头的蛋白质组学领域的重点项目,平台在推动基于蛋白质组学的精准医疗落地方面,打下了坚实的基础。

雷峰网:能详细介绍下你们的盈利模式和服务内容吗?当算法、软件系统以及一站式解决方案在内的服务,提供给临床客户时,带来了哪些实际效果?

张鑫磊: 简单来说,我们将目前的盈利模式概括为---“精准医疗信息化”。精准医疗数据与传统的临床大数据相比,更强调了队列信息与生命组学数据的整合。

我们的服务是从样本收集、队列管理、实验管理到实验产生的生命组学数据的全流程管理和挖掘。主要分为两块:一是精准医疗数据的管理、二是数据的应用。

数据的管理,这是从“临床样本”到“专病队列”的全生命周期。

在做法上,我们首先建立样本库,管理医院中的血液、尿液、病理切片等生物样本。然后围绕特定的专病建立队列数据库,进而创建组学数据库。

在数据不断积累和挖掘的过程中,可以发现新的分子检测标志物、数字标志物,和新药的靶点。进一步就可以进行相关的成果转化,包括开发试剂盒通过LDT的形式在院内开展检测项目,申请体外诊断试剂的认证等。

总的来说,我们构建的是一个数据驱动的医工转化平台体系,旨在通过数据管理和挖掘,推动医疗科技成果的实际应用和产业化。

雷峰网:你们为多家顶级医院建立了精准医疗数据基础设施和临床决策支持系统。您能列举一个最典型的案例吗?

张鑫磊: 在与北京协和医院妇科内分泌与辅助生殖中心的合作过程中,非常充分地体现了全生命周期的精准医疗数据管理与应用。

在与我们合作之前,该中心对女性生殖衰老样本和数据的管理方式较初步,主要基于人工录入数据表格的形式,效率很低。

经过与临床医生有效的沟通,以及持续的迭代开发。我们在中心不仅建立了高效的临床样本管理系统、多个跨中心的队列信息化系统,还建立了用于进行辅助诊断的组学数据应用平台。

在高质量数据汇集的基础上,我们还拓展了合作范围,与药厂开展联合研究。

以与扬子江药业的合作为例,我们利用更年期专病数据库对一款中成药进行了疗效评估和治疗机制研究,为临床医生在药物的合理使用方面提供了重要依据,也为药厂带来了新的研究视角和商业机遇。这个案例充分展示了精准医疗数据在有效管理之后,能够衍生出来的应用价值。

雷峰网:你们什么时候开始向医院推广这些服务?

张鑫磊: 2018年和2019年,我们主要还是服务于科研客户,但开始进行临床市场的拓展。直到2019年底,我们才有了第一个生物样本库的临床种子客户。我们也越来越全面地了解了临床的需求,逐步开始考虑如何规模化地向医院推广我们的产品和服务。

雷峰网:你们在北京和长沙等地都设有办公地点,能否说一下不同区域的功能定位?以及能否介绍一下公司团队构成和专业背景?

张鑫磊: 目前我们在山东设有子公司,在长沙和广州有分公司。北京的团队成员构成比较综合,涵盖了各个部门,但IT工程师相对较多。此外,由于北京丰富的临床资源,我们在这里与多个国家临床医疗中心建立起了具有示范意义的合作。长沙团队中90%的成员是生物信息工程师,专注于生物信息学算法和产品的研发工作。

CTO黄泽炽是生物学背景出身,凭借在算法方面的扎实基础,获得了2018年的全国人工智能金融算法大赛的个人冠军,他选择继续在生物信息与转化医学领域深耕,于2019年初加盟了公司,负责团队的研发工作管理。

生物信息主管苏明明本科是电子工程专业的,博士毕业于协和医学院。IT开发主管李红磊则是从研究生阶段才开始接触生物领域的IT专家,参与了多个国家级生物信息平台的直接开发工作。我们的技术团队是一支将信息技术和生物技术充分融合的团队,这支撑我们能够在生物信息创业道路上走得更稳健、更长远的重要基础。

不谋全局者,不足谋一域

雷峰网:在国内外,还有哪些公司与你们在业务范围上有所重叠?

张鑫磊: 这个问题非常好。我认为,我们与国内其他公司最大的区别可能体现在---我们能够有效提供精准医疗数据的全流程解决方案。

例如,在临床机构广泛开展的生物样本库平台建设过程中,有很多家提供低温存储解决方案的企业。但是,临床客户面临的进一步问题是,除了购买超低温冰箱进行样本存储外,在投入了大量的人力和物力之后,还需要考虑如何有效地利用这些样本,发挥进一步的数据价值。

我们提供的不仅仅是基础设施建设,更重要的是下游价值的实现,包括临床科研、医工转化和辅助诊断等方面。我们现在与低温存储的龙头企业海尔生物也是战略合作方,在下游的数据管理与利用环节,提供完整的解决方案。

从全行业来说,实现数据驱动的应用转化,从最初的样本采集到最终的成果转化,需要一个系统性的全流程管理。

瑞典私募股权基金Summa Equity收购了三家生信软件公司:Pierian、Seven Bridges 和 UgenTec,将其整合成了新公司Velsera。

其中Pierian是美国基因组数据三级分析和解读公司,主要集中在肿瘤方面,提供软件平台和知识库用于出具临床报告。

Seven Bridges提供了基因组及多组学数据分析管理的平台。

UgenTec是一家比利时的公司,本质上提供了实验室信息管理系统LIMS,为实验室、化验制造商和仪器合作伙伴带来样本流智能管理。

整个并购行为,从业务逻辑上体现了精准医疗数据全链条的重要性。如果链条中的任何一个环节上的衔接有瑕疵,整个数据的质量和完整性都无法得到保证。

雷峰网:相较而言,你们有哪些独特优势?

张鑫磊: 在技术层面,我们拥有强大的原创生物信息学算法和医学信息学算法研发能力,同时也开发了生物医药行业内的首个低代码软件框架,这大大提高了我们的产品交付效率。

我们拥有BT+IT(生物技术+信息技术)交叉融合的丰富经验,我们的IT团队不仅要熟悉信息技术,还需要深入了解生物医学和生物信息学的背景知识。

医院客户并不过分关注使用哪种IT技术或模型,他们更关心的是产品如何满足他们的需求,解决实际问题。因此,我们的IT团队必须深入了解临床背景,以更高效地支持医院的实际需求。

除了技术优势外,我们还有资源优势。

我们合作的伙伴包括在妇产、儿童、过敏、呼吸等多个领域的国家临床医学中心。通过与这些权威医院的长期合作,以及国家临床医学中心的网络覆盖能力。在生殖衰老、过敏性疾病、自闭症、儿童肿瘤等专病方向上,已经建立了国内最大的专病样本和数据资源平台。这是多年积累的结果,也是一个重要的先发优势。

生信产业化时代已经来临

雷峰网:您是如何认识到生信领域背后的巨大市场潜力,并将其转化为创业机会的?

张鑫磊: 在很多情况下,无论是在科研还是产业领域,生物信息学往往被视为一种工具。在科研中,它被当作数据分析工具使用;在产业中,它被用来提供科研服务。

生物信息学的创业,我认为关键在于时机。

在早期,由于数据产生的成本高昂,加上客户对这一领域的认知并不充分,开展创业的可行性并不大。然而,现在情况已经发生了变化。在过去五年中,数据产生的成本降低了十倍以上,数据量激增。现在,每位患者都可以很方便地进行组学方面的检测,而且很多检测被纳入到了医保,因此总体上产生的数据量非常庞大。生物信息学真正独立产业化的机会已经到来。

另一方面,从政策层面来看,生物安全法和遗传资源管理条例的出台,使得对遗传资源进行高质量管理成为刚性要求。现在,市场和数据成为两个关键点,政策导向促使大家开始重视这一领域。

我们公司一直以业务为导向,专注于做市场认可的事情。与其他很多AI+医疗企业相比,我们在继续投入研发的同时,已经能够实现盈亏平衡,并开始产生利润。我们坚信,只要紧跟市场需求,即使过程中有些困难,也是正确的方向。这是我们一直以来坚持的经营信念。

对于公司的持续发展,我认为AI行业中昙花一现的企业太普遍了。很多企业在获得高额融资后,长期来看也是难以为继,根本原因在于缺乏被市场认可的产品,以及持续的盈利能力。

因此,对于想要长期发展的公司来说,关键不在于成为一时的焦点或所谓的“独角兽”,而在于能否持续创造价值。

换句话说,我们是要追求短期的VC投资?还是真正想要建立一个能够持续数十年、为社会带来价值的企业?

对于携云启源来讲,我更希望我们的产品和解决方案应该能够解决实际问题,为我们的客户在临床应用中提供辅助诊断和医工转化的实际价值。只有这样的价值才能支撑公司的长期发展。

否则,如果只是空中楼阁,仅仅卖出一个概念,即使VC提供了资金,但如果找不到持续变现的途径,或者公司的业务与核心算法和数据并无真正的关联,那么公司就会陷入一种表面上看起来很好,但长期发展仍然非常迷茫的状态。最终,这样的公司可能无法承受市场的检验,难以持续下去。

因此,我认为,能够创造真正价值并得到市场认可,才是公司能够持续发展的基础。

雷峰网:当生物信息学与医疗健康领域深度融合时,对于有志于进入这一领域的企业来说,应该如何发挥作用?

张鑫磊: 我认为应该从算法和数据两个角度来考虑。

首先,生物信息学是一系列通用的方法,但在医疗健康领域,存在许多具体的应用场景,不同的科室,甚至同一科室内的不同病种都需要具体分析和应用。

作为通用方法的生物信息学,在进一步深入到临床场景中时,也应该注重细分的应用,因为一套标准化的算法很难适配所有的场景。不同的疾病、不同阶段的需求都是不同的,从早期检测到后期预后,需求各有差异。

因此,生物信息学与医疗健康场景的融合是必要的,但要实现良好的融合,就需要更深入地了解医生的需求,理解不同环节的数据特性,并据此改进我们的方法。这是基础性的工作。

从企业的角度来说,我们的角色肯定是创造价值,这就需要注重实际应用场景的落地。在落地的过程中,我们既要注重算法的本地化和细分化,也必须建立在数据质量的基础上。

目前,许多企业和医疗从业者对数据质量的重视还不够。很多生物样本在采集后与临床数据是脱节的,这样的数据是没有价值的。因此,我们特别强调要把握数据质量的源头,这对于做算法的公司来说是至关重要的。

除了细分算法,我们还要提倡建立相关的数据标准,这对整个行业的发展将具有积极的推动意义。然而目前很多从业者,在这方面的意识还是比较淡薄。

雷峰网:鉴于生物信息学领域的快速发展,您预测未来几年可能会出现哪些创新性的突破?这些潜在的进展将如何影响未来的医疗实践和科学研究?

张鑫磊: 生物信息学是一个发展非常迅速的技术领域,它也会与数据产生的上游技术和设备紧密相关。

目前,测序成本已经大幅降低,这不仅包括基因组数据,还包括蛋白质组、转录组和微生物组数据。随着数据量的增加,我们将看到更多的应用场景落地,这将涉及到多组学数据的整合,以及多模态数据的融合,包括临床数据和影像数据等。

这种更高维度、更高质量的数据整合将为精准医疗带来更多的可能性。

过去,由于测序成本较高,我们可能只关注单一组学的检测,这实际上是非常有限的。未来的精准医疗将不可避免地涉及到多组学和多模态数据的综合应用。

其次,在精准医疗数据检索和产品形态方面,大模型技术的影响也将日益显著。

我特别强调的一点是,当前医院在转化医学研究方面的趋势。尽管新技术层出不穷,但临床科研的趋势越来越倾向于成果能够转化为实际应用,而不仅仅是基础机制方面的研究。

因此,我们也在与Olink(蛋白组学公司)进行密切的技术合作,构建实验与计算技术的结合,拓展蛋白质组学层面上的诊断标志物发现。

雷峰网:作为北京携云启源科技有限公司的领导者,您对公司的未来发展有何规划和愿景?同时,您认为公司目前面临哪些挑战和待解决的问题?

张鑫磊: 短期内,我们希望尽可能提高在精准医疗信息化领域的综合市场占有率。

这里所说的“综合市场”实际上涵盖了科研、医疗和公共卫生三个方面。我们所指的医疗市场与传统的医疗信息化有所不同,我们更侧重于精准医疗,建立临床队列和生命组学数据库,我们在这一领域的工作已经非常深入。

在科研领域,我们会广泛参与到十四五期间的生物计算大型信息化设施的建设。在公卫领域,我们关注的是智慧疾控,这不仅仅是记录疾控系统的检测结果,而是要利用病原体和宿主的基因序列,结合生物信息学方法,实现对新发和突发传染病的监控与预测预警。

我们即将推出的基于大模型的精准医学智能化数据分析平台,将大大降低生物信息分析和精准医疗应用的门槛,可以实现根据用户的问题和数据自动从海量的分析工具和数据库中找到合适的工具和数据完成分析或给出建议。

我们短期的目标是成为精准医疗信息化市场的领导者。我相信只要我们按计划推进,这个目标是可以实现的。

长期来看,我们希望建立一个数据驱动的医工转化生态系统。

我们在多家临床机构进行了信息化平台的建设、维护与运营,旨在促进精准医疗数据的转化应用。这是一个系统工程,需要多方协作,不仅仅是我们一家能够完成的。上游有低温存储、检测设备方面的合作伙伴参与,下游则有分子诊断和制药公司与我们协作,我们希望做成一个能够衔接上下游的关键纽带。

这需要一个广泛合作的体系来共同完成,这也是我们举办本届“生信与转化医学大会”的初衷。

雷峰网:与2023年举办的第一届大会相比,今年的第二届有哪些不同之处?未来是否有进一步调整?

张鑫磊: 这次大会最大的不同是,我们有大量临床机构的参与。

从主办方的角度来看,第一届主要由中国生物物理学会生物医学信息分会牵头,更侧重于科研方面的主题报告。

而第二届大会则由学会、医科院肿瘤医院、农工党北京市委三方联合主办,充分体现了生物信息与临床医学的融合。

分论坛的设置也不同于以往,不再以单纯的技术命名,而是加入了大量临床相关的关键词,如“传染病”、“临床队列”、“慢病与衰老”等。

未来,我们的主办方结构将保持不变,生物医学信息分会将与不同的临床机构进行合作,面向新的转化医学主题。在保持现有规模的情况下我们希望一步一个脚印的稳步发展,争取办成业内具备一定影响力和品牌力的大会。

本文作者 吴彤 长期关注人工智能、生命科学和科技一线工作者,欢迎同道微信交流:icedaguniang  

]]>
医疗AI //m.drvow.com/category/healthai/B4TSweq5A4LG0V8B.html#comments Tue, 07 May 2024 14:33:00 +0800
专访上海市生物医药技术研究院戴文韬:生信,为何是生物医学研究的「隐秘支柱」? //m.drvow.com/category/healthai/AljiNSz2LCJggcnF.html 把“冷板凳”坐热了,是当今生信人的一大喜悦。

在科研舞台上,生物信息学(Bioinformatics)有着杂糅而成的名字,却仅为角落里不起眼的存在。

其原因不外乎:“太新”“太交叉”“太应用导向”,以上三者使得很多人认为这一学科不成体系,没有理论根基。

此外,生物信息学易学难精,从业人员需要生物学知识的同时,还需掌握计算机科学和统计学等领域的技能,更要融汇数学物理的抽象逻辑思维,这种跨学科的要求又限制了该领域的普及速度。

时至今日,国内生信人仍处在尴尬境地:主导合作机会较少、长期背负着“打杂”的标签。

但不可否认的是,生信早已融入整个生物医学领域,并推动其研究方法和思维模式的持续变革,提供了高通量跨尺度多模态数据分析挖掘、药物设计、疾病机理系统研究等核心功能,是连接生命科学与计算科学、推动精准医疗和转化医学发展的关键学科。

默默无闻,却坚韧地支撑着生物医学研究的“骨架”。

与生信的实际效用相比,其声名处于波粒二象性,时而代表生物医学研究走向数字化智能化的未来,时而又是所谓“水文”泛滥的助力,这既代表着大家对这个新兴学科的关注,也说明全面客观了解这一学科的必要性。

近期,2024年度「第二届生物信息与转化医学大会」落下帷幕。本届大会以 “人工智能时代的转化医学”为主题,由北京携云启源科技有限公司承办。

来自上海市生物医药技术研究院的戴文韬研究员,以其在多组学整合和计算结构分析挖掘方法领域的深入研究,以及在肿瘤信息学和生物大分子药物设计优化方面的丰富应用实践经验,成为本次会议的组织者及分论坛主持人。

借此契机,雷峰网与戴文韬进行了深入对话,以一位毕业十年的基层年轻科研人员视角,探讨了他为何坚守在生信的道路上,以及他眼中的生信前景。

实际上,在生物信息学尚处于起步阶段时,戴文韬便投身其中,成为了国内最早一批生物信息学博士生。

在中科院生物物理研究所读博期间,他的研究课题聚焦于蛋白质折叠与三维结构预测。他表示,这一领域在当时虽然小众,却为他日后的研究打下了坚实的基础,比如统计热力学、分子模拟和分子力场的知识储备,以及数据挖掘和算法开发的落地实践经验均起源于那时。

2014年,在面临职业选择的十字路口,戴文韬放弃了转行互联网或游戏设计的机会。

他解释道,尽管互联网和游戏行业当时发展迅速,对人才求贤若渴,并且同生物信息在技能上有一定的共通之处,但他最终还是选择了继续在科研的道路上深耕。

如今,戴文韬的科研轨迹已经十分明晰。他提到,受到“科学四象限”中“巴斯德象限”的启发,他将“应用需求引起的基础研究”作为自己科研工作的主导方向。

至于生物信息学者能否成为科研的中心力量,他也给出了自己的回答:“正如社会分工的多样性,每个领域都有其不可替代的价值,不同环节共同构成完整的产业链。我的目标只有一个,在自己从事的细分研究领域,做出特色成果,解决实际问题,融入产业价值链,给为他人带来帮助。”

以下为对话(经编辑):

 国内最早一批生信博士生的出路

雷峰网:请您分享下教育背景和研究经历,以及这些经历如何塑造了您的专业技能和研究视角。

戴文韬:我是2004年进入华东师范大学生命科学学院,主修生物技术。2008年,保送至中国科学院生物物理研究所硕博连读,加入了蒋太交教授的课题组,专注于生物信息学的研究,并于6年后毕业获得生物信息学博士学位。

实际上,在我读博期间,国内生物信息学还处于起步阶段。因此我也算是国内较早一批获得生物信息学学位的博士毕业生。

在我的博士研究中,我专注于蛋白质折叠与结构预测的课题,这在当时是一个相对经典但小众的领域。但幸运的是,在我个人研究的早期阶段,就与许多老师和团队建立了联系,得到了很多前辈的指导帮助和鼓励,例如中科院计算所卜东波老师在中关村开设的算法课程我也有过旁听,而卜老师也参加了我的博士毕业答辩。

关于研究视角,由于我所面临的课题非常具有挑战性,需要尝试各种方法。

最初,我们尝试采用统计热力学、分子模拟和分子力场的方法进行研究。然而,到了2010年,我意识到传统计算方法的局限性,开始探索机器学习方法。

尽管神经网络当时已经开始流行,不过不同于CNN为代表的深度神经网络,效果并不好;加上数据量和其它因素的限制,我们选择了支持向量机(SVM)。

2012年CASP10比赛中,我们团队利用SVM融合序列、结构拓扑和统计分子力场特征,进行蛋白质三维结构模型选择,形成的创新方法,与实验室前期主链和侧链预测方法共同构成了一套相对独立完整的技术体系,取得不错表现,后续也发表了相关论文。这些研究成果现在依然可以在网上找到,代表了蒋太交课题组在蛋白质三维结构预测领域的探索和贡献。

所以,如果要说我的专业技能和研究视角是如何塑造的,可以说困境使然,让我不断在限制性条件下寻找可行的解决方案。

在那个时代,由于缺乏现成的数据库和工具包,我们不得不从零开始构造模板库并编写许多程序,尝试了各种可能的方法。这一过程不仅让我掌握了生物信息学领域所需的专业技能,还对物理、统计、计算化学、机器学习与数据挖掘等多个领域有了比较深入的认识和理解,后来我发现在跨领域合作和解决实际问题中,这些积累很有助益。 

雷峰网:十年前,为什么加入“上海生物信息技术研究中心”?

戴文韬:2014年博士毕业时,我面临几个选择。一是出国做博士后,这是一个比较传统的选择;二是转行,比如进入互联网行业,包括游戏产业。

之于前者,当时经典的蛋白质折叠和结构预测领域在国内相对沉寂,难以找到相关的就业岗位。如果想要继续从事计算结构生物学研究,唯一的选择似乎是出国。

之于后者,当时互联网及游戏行业对机器学习和几何三维建模相关的人才需求很大,尤其在游戏领域,进行从3D引擎到数值优化等多种工作,可迁移使用此类专业知识。

此外还有一层原因是,互联网及游戏行业的蓬勃发展,提供了非常有竞争力的薪酬待遇和大量工作机会,促使年轻科研人员转行寻求发展机会。

尽管如此,我仍然希望能够投身于科研工作,能够做一些实际应用,为人类带来贡献和帮助的研究。

这时,上海生物信息技术研究中心的肿瘤精准医疗方向,以产业化研发为导向,包括PDX模型与多组学和计算结构生物学相关研究和应用,对我而言符合兴趣,从而具有了很大吸引力。

在这样的环境中,为PDX(患者来源的异种移植模型)项目提供数据管理和分析挖掘信息化解决方案,本身就是一种典型的应用基础研究,加上该中心是当时中国首家以生物信息为主业的独立法人研究机构,李亦学老师担任该中心的主任,李园园老师担任课题组长,有这样优秀的前辈们推动,我便坚定了加入的决心。

我们当时希望将生物信息学,特别是多组学相关技术与PDX模型结合起来,探索肿瘤精准医疗的可能性。

后来,上海生物信息技术研究中心、国家人类基因组南方研究中心、上海市计划生育科学研究所,三家单位共同组建了“上海市生物医药技术研究院”,其核心职能是承担人口健康与生物医药领域关键共性技术、颠覆性技术和重大产品研发、应用转化与技术服务。同时,因为肿瘤精准医疗,在领导带领下我便与上海交通大学附属瑞金医院(尤其是消化外科研究所),以及上海市胃肿瘤实验室建立并保持了密切合作。

雷峰网:您目前在上海市生物医药技术研究院的团队规模如何?

戴文韬:我们是上海市生物医药技术研究院组学研究与应用课题组,属于上海市疾病与健康基因组学重点实验室,课题组长是李园园老师,我作为联合课题组组长,团队规模目前在十人左右,比较精干。感谢上海生研院和李园园老师给了我很大的科研自由度,这对于从事探索性创新的研究人员非常宝贵。

李园园老师自2003年以来就一直在系统生物学领域开展研究,研究方向为复杂疾病相关的生物学系统大数据整合挖掘。主要从事以识别驱动因素及其信息传递、交互机制为目的的跨尺度、多模态、多层次数据整合挖掘方法开发,比如开发DCGL等一系列有价值的计算工具;应用于肿瘤、自身免疫病等复杂系统疾病的关键调控因子、调控模块、失调事件挖掘,跨尺度机制探索,机制解释性标志物及潜在药物靶标识别,以及疾病关联网络研究,取得许多成果。她领导项目团队非常有创造性地将一些经典重要的比对算法,结合基因组数据应用于食源性致病菌的检测,成果已应用于旺旺集团的实际生产。

我本人领导的小组主要针对诊断标志物和药物研发场景中的产业实际需求,发展转录代谢调控相关时空多组学分析技术配套数据库和方法,研发生物大分子药物相关设计优化计算方法,并应用于肿瘤精准医疗相关诊断标志物和药物研发的转化实践。

因此,总的来说,有效支持转化医学有应用价值的生物信息研究,将我们课题组凝聚在一起;我们对科研工作和成果转化的期望是,能够在产业链中打造出具有特色和价值的一环。

 如何把“肿瘤转录代谢多组学挖掘及应用”做出特色?

雷峰网:注意到您当前的研究方向是转录代谢调控多组学及应用。其中包含两块,一是开发数据库和计算工具,二是诊断标志物和药物研发。能详细介绍下吗?

戴文韬:追溯起来,随着人类基因组计划的完成,研究重点相对集中在基因组、甲基化、转录组等基于NGS的组学领域。近年来,随着质谱技术的发展,蛋白组、代谢组、脂质组及相关单细胞空间多组学研究变得越来越受关注。

近五年,我在组学领域的研究主要集中在适用于转录代谢调控的计算分析领域,特别是脂质代谢和空间代谢多组学相关整合分析,同时也探索了数字病理与分子组学的跨尺度多模态学习建模,上述工作主要应用于肿瘤及其微环境研究。

这些研究工作的共性是,针对场景需求和数据特点,灵活使用了多样化的机器学习手段,并得益于跨学科合作者的支持,才能顺利进行。例如,北京携云启源,吴谦副研究员等合作伙伴,在脂质组研究领域给予我大力支持。跨尺度多模态学习建模得益于上海交通大学医学院附属瑞金医院刘炳亚教授和上海交通大学计算机系杨旸教授支持,同时刘老师团队还对我们挖掘到的计算结果进行了一系列实验验证,取得了有价值的发现。中国医学科学院药物研究所贺玖明教授、齐鲁工业大学(山东省科学院)孙成龙教授,他们在空间代谢组学检测方法领域的工作非常出色,同他们合作时学习收获很大。

我们很多方法策略是为了解决诊断标志物和药物研发中的实际问题而发展,后续也在应用中取得了不错的效果。因此,对于我的研究,产业转化应用非常重要,既是下游工作场景,也是上游需求活水。

在诊断标志物研发方面,我们基于组学领域的积累开发了一些基于差异调控识别具有机制解释力诊断标志物的计算方法,用于肿瘤伴随诊断标志物研发效果不错,申请获得了相关知识产权,包括专利和软件著作权。部分成果同企业合作紧密,进行了转化探索。然而,由于大环境的影响,诊断标志物的成果转化目前并不算好时机。不过,我们的相关研究仍在继续,相信未来终会改观。

在药物开发领域,我有幸参与了一些抗体和特殊治疗性蛋白质药物的结构设计与改造优化工作。针对研发场景中的一系列实际问题,比如调节亲和力、消除非特异性脱靶、克服CMC成药性困难等。我不仅利用专属序列比对、深度学习、结构模拟等计算方法挖掘序列和结构信息,而且积极通过转录、蛋白、代谢等高通量组学手段获取有效信息;更充分借助生物、化学理论、免疫信息和蛋白质工程领域的经验知识及工具,通过视觉审查等人工手段实现创造性的决策优化,支持实验研究人员高效解决了相关问题。“人机结合迭代,知识数据融合”弥补了高质量标注数据不足和通用计算模型在具体场景不适用的短板,我们的策略方法已在scFv、TCR、VHH、T细胞抗原表位肽等多种形式的蛋白质药物研发中有过成功案例。虽然还没有找到理论上的通用方案,但算是工程上有意义的实践,达成了降本增效的目的。

雷峰网:您和团队也在做数据库吗?

戴文韬:是的,高质量数据是计算方法的重要基石。我们去年与携云启源合作发表了一个名为“人类脂代谢相关脂质和蛋白数据库(DBLiPro)”的数据库。

这是一个细分的专业领域数据库,系统地收录了与脂质代谢相关的各种蛋白质,并提供了多种特色高质量标注信息,以及适合以脂质为中心多组学整合挖掘分析工具。

我的工作往往专注于非常专业的小领域,这些细分领域往往是研发链条中缺少的某个细分环节,我们的目标就是补充这一环。 

雷峰网:您在进行肿瘤多组学数据整合和分析时,采用了哪些方法和技术,遇到过哪些挑战?

戴文韬:在进行肿瘤多组学整合分析时,我们团队采用了一种知识和数据融合驱动策略,灵活使用图神经网络、随机森林、遗传算法、多种统计回归等,研发适用于多组学数据挖掘和机制解释性标志物发现的差异调控分析方法。

目前该方法用于胃肠道肿瘤为代表的复杂疾病研究,识别具有机制解释力的关键调控因子和关系,助力发现潜在药靶和标志物;得益于实验合作伙伴,比如瑞金医院刘炳亚教授团队,我们共同验证了计算发现的一系列新的胃癌关键调控基因和作用关系。上述实践推进转化医学产生新知识的同时,验证了我们计算方法的有效性。

在这个过程中,我面临很多挑战,同时发现大数据和人工智能技术在生物信息学中的应用和潜力是巨大的,不过需要同场景需求和实验工作者密切合作,多角度相互促进,避免自我循环论证。

因为过去很多时候,生物信息学的研究可能会让人觉得“做了肯定好,不做也没什么”,这显得有些尴尬。但是,高通量多组学技术天然需要大数据和AI的加持,会推动生物医药和生命科学进入数字化智能化时代。

在这一过程中,我认为最大的挑战是,我们不能仅仅满足于生物信息学的计算分析和挖掘,而应该充分了解待挖掘领域的知识和需求,同具体领域专家一起推动研究成果的实验验证,并形成正向的反馈迭代。毕竟,生命科学和生物医药领域本质上是实验科学。

雷峰网:在转录代谢调控领域,除了您所在的团队,国内外还有哪些团队在这一领域做出了杰出的工作?

戴文韬:在代谢领域,大家可能首先会想到上海交大医学院附属瑞金医院的宁光院士、武汉大学的宋保亮院士、厦门大学的林圣彩院士、大连化物所的许国旺教授等知名科学家。

我们的研究方向是肿瘤的转录代谢调控,更准确地说是基于高通量组学的转录代谢调控系统生物学,专注于肿瘤转录代谢调控的高通量组学分析方法研发和应用。相对于经典代谢领域,我们属于系统生物学的代谢多组学,是相对边缘的新兴学科。中科院北京生命科学研究院赵方庆研究员、加拿大麦吉尔大学夏建国教授、上海交通大学王卓研究员等科研人员,从不同角度通过出色工作推动了代谢多组学数据分析方法,大家共同推动该领域更好地发展,并服务于生物医学。

因为我们团队规模较小,所以希望能够做出特色工作,与其他团队形成互补的合作关系,通过关注应用的成果,助力推进基础研究前沿成果的产业转化。 

雷峰网:后续您和团队在前沿研究和成果转化上,有哪些规划?

戴文韬:我希望能够在未来几年,围绕自己的研究领域,做一些场景导向的、有特色应用价值的成果。

我希望针对未满足的生物医药关键共性场景需求,融合领域知识和高质量数据,研发转录代谢多组学分析和生物大分子药物计算设计优化方法,应用于诊断标志物和药物的发现,特别是新型生物大分子药物的发现。

代谢组学不仅可以用于标志物的发现,还可以帮助解释药理作用,包括药物的耐药性、敏感性以及ADMET特性(吸收、分布、代谢、排泄、毒性)。生物大分子药物,因其自身特点,在安全性、有效性、可成药性等方面有着完全不同于小分子化学药物的需求,这都对计算设计优化提出了独特诉求。

个人认为AI通用大模型是人类的追求,但在我所从事的应用基础和转化研究领域,应该尊重具体领域的已有积累和客观规律,循序渐进,小步快跑推进落地,比如云计算和边缘计算不是替代关系,而是互补增效关系。我希望将主要精力集中在细分领域上,寻找好的合作伙伴,共同推进成果转化。

当然,每个人内心都有一股推动产业链发展的冲动,想要将一个产品从实验室原型推向最终产品。但在实际工作中,我始终坚持需要克制这种冲动。

因为术业有专攻,在成果转化方面,产业链是很长的一环,确实有杰出的人才能够全面掌握,但坦白说,我目前并不具备这样的能力。我只是一个年轻的基层科研人员,所以我对自己的定位是专注于产业链中的特定环节。

我的目标是在产业链的特定环节上做出特色,创造出有价值的工作,成为产业链中不可或缺的一部分。至少,我希望能够在这里打造出具有特色且对他人有帮助的一部分。

应用VS理论、合适VS先进

雷峰网:如果抽象来说您当前的工作,您和团队是否有一套科研观念,以及您是如何在前沿基础研究与技术转化之间架起桥梁的?

戴文韬:我可以用“科学四象限”来回答这个问题。 

这个图展示了四个象限,每个象限代表了一种研究模式。纵向的两端分别越接近理论、应用;横向的两端分别越接近知识的发现、数据的积累(即使我们可能无法直接发现新知识,但我们可以有效地积累数据)。

这就产生了区别:

第一象限侧重于理论和知识发现,这是典型的基础研究,有时被称为波尔象限或牛顿象限。

第二象限侧重于理论和数据积累,被称为整合经验或技能训练的象限,有时被称为第谷象限或皮特森象限。

第谷是天文学家,他一生完成了当时最完整的天文观测资料,但他坚持地心说,因此没有取得重大发现。而继承了他所有数据资料的是开普勒,开普勒从这些资料中推断出了行星运动,命名为开普勒三定律,这逐渐过渡到了牛顿的万有引力定律。这就是第谷象限和牛顿象限之间的关系。

第三象限侧重于经验、数据积累,属于纯应用研究,典型的代表是爱迪生。他通过大量实验找到了适合制作电灯的材料。例如,为什么白炽灯的发展会用到钨丝,研究者可能并不关心其性能为何优越,只知道它好用就足够了,这是一个纯应用的象限。

第四象限侧重于应用引起的基础研究,代表人物是巴斯德。

巴斯德在防止红酒和牛奶变质的过程中发明了巴氏消毒法,但他同时也做出了重要的科学发现——微生物的存在。这一过程是典型的从应用需求出发,为了更好地满足这一需求,进而推动了知识的进步。

实际上,我从上海生物信息技术研究中心开始,个人研究方向就已经进入了巴斯德象限,而我现在参与到“上海市生物医药技术研究院”中更是如此。

如果用一句话来概括我的研究重点,就是专注于转录代谢调控相关的时空多组学和生物大分子计算体系的研发及应用。

这不是纯粹的理论研究,强调以应用需求为出发点,旨在满足应用目的,但同时也会带动新知识的发现,进而指导形成更有效的工程化解决方案,这其实是一个知识发现落地反馈迭代优化的闭环。

因此,我对串联前沿基础研究与技术转化的理解是:

首先要场景导向,明确在特定场景下我们需要什么;

其次以产业场景为导向,针对产业需求,将前沿基础研究中的合适理论和技术应用到问题的解决中。

合适的解决方案并不意味着它一定是最新或最先进的,但它必须是最适合当前条件的,因为时间和资源都是有限的。

更近一步说,我对“智能”的理解在于,无论是人工智能还是其他形式的智能,其重要性在于能够在有限的资源和时间内,为问题提供一个相对可行的解决方案。最好是能够从这个解决方案中进行理论升级,即从应用到知识的转化。

雷峰网:如果将人工智能的发展分为几个里程碑,比如统计学习、机器学习、深度学习等。那么如今的大语言模型对于您目前从事的肿瘤转录代谢调控和生物大分子药物计算研究有何影响?

戴文韬:在进行空间多模态数据分析时,深度学习在图像处理方面确实带来了新的突破。未来,对于文本相关的多模态数据分析,大语言模型将会发挥重要作用。

但大语言模型并非万能,仍需要与数据相适配。

比如,在组学数据挖掘中,尽管我们尝试利用了一些领域知识,但可用的高质量数据仍然较少,单纯依靠算法和数据驱动难以解决问题。

再比如,在生物大分子药物研究过程中,具体药物研发管线和案例,往往没有足够的高质量标注数据来进行训练,通用模型难以落地应用。

尽管现在大家也在讨论零样本(zero-shot)和少样本(few-shot)学习方法,但面对梯度爆炸等问题时,遗传算法等技术,在很多时候仍然是一个很有效的解决方案。

因此我的观点是,研究始终应该是场景和需求导向。

过去学术研究有个常见问题是“拿着锤子找钉子”,而没有考虑到可能需要发展其他工具。

但事实上,在工业软件中,小模型仍然占据主流,这类似于前几年大家都在讨论云计算,但最终发现仅有云计算是不够的,还需要边缘计算。

因此,对于大数据和人工智能,我认为在解决实际问题时,找到最合适的解决方法是最重要的。我们不应该只是追随潮流,而应该针对具体的应用场景和需求,找到最合适的解决方案。

当然,我非常积极地拥抱大型语言模型。实际上,我每天都会使用国内外的多种大型语言模型,并在研究中已经在有所应用。我也会告诉我的学生,在大语言模型技术领域,我们站在同一条起跑线上。不过,以大语言模型为代表的AI技术,已形成资源需求巨大,产业界主导的趋势,这对于更自由灵活的学术和技术团队在该领域的研究和应用构成巨大挑战,长远看会制约技术生态多样性和实际落地,个人认为该趋势和挑战非常值得重视。

归纳一句话,在解决具体问题时,我认为“不管黑猫白猫,能抓到老鼠的就是好猫”。

雷峰网:这次在大会上,有哪些人的报告让你特别感兴趣?

戴文韬:我对这次会议中的三个主题非常感兴趣。

首先是肿瘤多组学整合研究与转化应用。

其次是单细胞时空多组学的应用越来越广泛。在这两部分中,可以看到知识库和数据库发挥了重要作用。

第三部分是临床队列与转化医学,这涉及到大数据的采集、管理和应用。

简而言之,这三个主题可以归纳为肿瘤多组学整合研究与转化应用、单细胞多组学,以及支持这两个领域的数据库,进而是更为基础源头的自然人群和临床大队列。

在会议上,我的感受是生物医药正在迅速进入一个真正的大数据时代,包括队列研究和组学研究,也正在从过去的静态单点式研究进入到时空多组学的时代。

在这次会议上,公开场合的报告中还没有看到很多关于大语言模型的工作,但在会议交流中,大家都非常关注这一领域。我认为在未来两年,这类工作会逐渐增多。大家已经广泛地将大型语言模型作为日常助手使用。 

生信人迎来春天了吗?

雷峰网:您如何看待当前中国生物信息学和转化医学领域的科研环境?您能否根据自己的经验,谈谈如何推动跨学科领域合作,以及对于年轻人的建议?

戴文韬:关于生物信息学和转化医学领域的科研环境,每个人可能都有自己的感受。

我自己自2008年进入生物信息学领域,从早期开始就一直在这个环境中成长。生物信息学至今尚未没有自己的一级学会,但在生物医学领域中,它确实是一个重要的辅助学科。就像社会分工一样,每个领域都有其独特的价值。我们要做好自己的本职工作,为大环境做出贡献。

随着时间的推移,相比当年,生信这个领域已经得到了更多的认可。

在当下时代,有组织的科研得到了大力提倡,这是科研范式变化的结果。在有组织科研和当前科研环境下,自由探索型团队越来越感受到,自由并非没有代价。但我认为学术自由仍然是最宝贵的,对于细分特色和非共识研究领域尤其如此;上海市生物医药技术研究院和李园园老师为我提供了相对自由的学术环境,对于部分科研人员这是很难得的事情。从生态进化角度,多样性是应对不确定性的最佳手段[WD6] ,在当前这个大变革的时代,个人认为这个观点很有价值。

在跨学科合作方面,我的经验是首先要彼此尊重,然后是在尊重和信任的基础上实现互补,这样才能从彼此那里学到新的东西,有助于合作各方的利益。

我与物理、化学、药学、医学等不同领域的专家都有合作。在合作过程中,尊重不仅体现在对合作者的尊重,更重要的是尊重对方学科的研究历史、脉络和研究范式。

跨学科合作就是寻求互补共赢,比如我与生物物理领域的吕军鸿教授、分析化学领域的贺玖明贺和孙成龙教授,以及医学领域的刘炳亚教授等都有合作,我自己在合作中学习收获很多,非常感谢他们。这种合作最重要的是,一开始的利益和动机要纯正,互相信任,实现共赢,这样合作才能长久。

至于对年轻人的建议,我听了您的话后突然意识到,尽管我自认为还是年轻人,但我博士毕业已经十年了。对于年轻人,我的建议是,十年后你在学校学到的知识可能都已过时,与时俱进是关键。

同时,虽然许多具体的技术模式和技能可能已经发生了变化,但我认为十年来思考训练凝结成的科学思想和意识,发现问题、定义问题、解决问题的能力是不会过时的。

雷峰网:多年前人们对跨学科并不感兴趣,认为只有本领域做不下去的人才会选择跨学科。但现在,随着 AI 制药的发展,以及像英伟达这样的公司在芯片算力方面的推动,生物信息学变得非常有用。您自己的感受是怎样的?

戴文韬:对,这是一个巨大的变化。一批生信领域的前辈从冷板凳走到聚光灯下,他们的感受颇深。

特别是周耀旗老师,我是他博客的忠实读者。当年在生物物理所读书时,每年都要进行考评。有老师直接问我们生物信息专业的学生,你们整天不做实验,就只是对着计算机敲敲打打,对学科的意义和价值如何。

当时我们只能尴尬地笑笑,弱弱的表示我们期待未来取得进展。但现在,经过了大约十年的时间,再也没有人这样说了。

更重要的是,这个学科的从业者大多都还活着,再次证明生信是一个非常年轻和新兴而充满未来的学科。

我可以再举一个例子,关于我之前提到的科学四象限。

我的学术研究起步于生物物理研究所的蛋白质折叠与结构预测。实际上,我本科时加入实验室和进行毕业论文研究时,最初的目标是计算神经生物学,后来发现生物信息学的数据积累更为充分,加上其它原因,我就走上了现在的研究道路。

但说实话,无论是计算神经,还是生物信息,在当时都是一些非常冷门和小众的领域,但现在这两个方向相关的脑机接口与神经解码、类脑智能,生物信息、精准医疗、CADD/AIDD等领域均已成为不可忽视的热点研究方向。

所以说,如果要给现在的年轻人提建议,那就是一句话:首先要选择自己感兴趣且擅长的领域,但不一定要选择当前最热门的方向。

GPT-2.0等模型在技术圈崭露头角时,虽然大众不知道,但从专业角度判断,新的理论已经构建完成,后面需要工程上的突破和大量的资源。在这种时刻,除非你的目标是进入产业界,否则作为一个年轻的学术人员贸然进入自然语言学习领域的很多方向可能都会很危险。

雷峰网:您的分享非常有启发性,包括谈到一些从事生物信息学的人还能转行做游戏设计,那么这两者还有哪些关联?

戴文韬:在当时的环境下,生物信息学的就业非常困难,大家都在寻找出路,人总是要先吃饭。

事实上,游戏行业的发展对技术进步,尤其是GPU技术和强化学习的发展起到了推动作用。这种技术的发展对生物信息学同样有益,因为生物信息学中的许多计算密集型任务,如三维结构模拟和数据分析,都需要强大的几何图形计算能力;另外游戏行业对合成数据技术的推动,对许多领域都非常重要。

回想我在生物物理所学习时,我最早接触到了IBM推出的异构计算和多线程处理技术。这种技术在当时是非常先进的,但同时也带来了编程上的挑战,因为它要求开发者自己管理浮点运算和字节存储。

随着时间的推移,像英伟达、谷歌、Meta等公司提供的现代编程库和工具,极大地降低了异构计算和并行化的工程化门槛。这些工具使得非专业程序员也能够更容易地进行开发和创新。

有时我问00后学生,他们甚至不知道IBM是什么,这让我感到惊讶;想来这是时代在变化,江山代有才人出的真实写照。

所以说,在合适的时机做合适的事情,非常重要。如果无法确定合适的时机,或者没有合适的条件,我宁愿不烧热灶,不追风口,选择一个自己感兴趣的小众冷门领域,尽管这很有可能失败,但也有机会做出自己的特色。

总的来说,技术的进步为各个领域提供了打破藩篱,相互促进的机会,比如生物信息和游戏;而个人则需要根据时代的变化和自身的兴趣,争取一专多能,做出合适的职业选择。

本文作者 吴彤 长期关注人工智能、生命科学和科技一线工作者,欢迎同道微信交流:icedaguniang  

]]>
医疗AI //m.drvow.com/category/healthai/AljiNSz2LCJggcnF.html#comments Sun, 28 Apr 2024 10:56:00 +0800
大模型“上新”应用,国家医保局与百度打造赛事AI助手 //m.drvow.com/category/healthai/Ibyv3MvnZkBaz5DV.html 4月23日,国家医保局举办发布会,宣布正式启动“2024全国智慧医保大赛”。国家医保局党组成员、副局长颜清辉出席本次发布会。

颜清辉表示,2021年-2022年国家医保局曾经举办过智慧医保解决方案大赛,共有133家科技企业提供了156个解决方案来参赛,有效地激发了社会各界参与到智慧医保的创业热土上来,为促进我国医保事业高质量创新发展营造了良好氛围。国家医保局决定在充分总结吸收上次大赛成功经验的基础之上,组织开展以数字中国智慧医保为主题的2024年全国智慧医保大赛。

为了给参赛团队提供更好的赛事服务体验,组办方在大赛官网上设置了赛事AI助手,其技术底座为百度文心大模型,由百度医疗健康事业部建设实施。

通俗地理解,相当于一个“7X24”小时的智能客服,能为参赛团队提供赛事公告、赛道设置、赛程赛制等赛事相关的答疑和查询服务。

据了解,这也是国内首个基于大模型生成式人工智能的赛事AI助手。在会上,主持人对其功能做了现场演示,充分体现了AI助手的内容创作生成能力。

演示效果一览 

国家医保局办公室副主任付超奇表示,这个AI助手是经过前期公开征集和专家评选的基础选择而来,最后选择了百度的文心大模型作为技术底座。他还表示,当前大模型AI应用还处于起步阶段,但未来应用前景非常广阔,“希望通过开放赛事服务这个小的应用场景来展现AI大模型应用的巨大潜力和宝贵价值。

作为全球领先的AI科技公司,百度在打造垂类大模型具有天然的优势和深厚的积累,在数据量、技术底座等方面均领跑行业。

以百度打造的首个产业级医疗大模型——灵医大模型为例,它持续输入百度沉淀的覆盖“医-患-药”全场景的医疗健康数据和权威医学知识,保证了大模型的回答有源可溯和专业权威。在百度的大模型和专业权威信息的加持下,此次上线的赛事AI助手也能充分助力本次智慧医保赛事顺利开展。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/Ibyv3MvnZkBaz5DV.html#comments Tue, 23 Apr 2024 18:04:00 +0800
数坤科技携“数字人体”3.0亮相CMEF,树立医疗技术革新标杆,引领新质生产力飞跃发展 //m.drvow.com/category/healthai/WiGKYKOkx5WdPLJq.html

作为在医疗健康AI领域深耕的企业,数坤科技始终坚持原创不断在行业加速创新。

继2021年数坤科技在CMEF会上首次推出“数字人体”1.0版本后,2023年的2.0版本接踵而至。而现在,借助刚刚结束的CMEF盛会的契机,数坤科技宣布将“数字人体”平台升级至3.0版本,研发周期已缩短至一年。

这一速度出乎了很多人的意料,却也合乎行业发展的逻辑。毕竟,在医疗健康与AI融合的竞技场上,从不允许懈怠。

“整个行业都在全力以赴,追求大模型、软硬件一体化、全生命周期管理。无论是顶尖的AI研究机构,还是各行业的领军企业,无一例外。”这是行业内部人士的普遍共识。

而在这场竞争中,能够全面而深入地掌握这三个方面的企业屈指可数。“数字人体”,作为数坤科技自主原创的产业级AI技术平台,如今正是将三者合而为一的重要载体。

对应来说,这也是“数字人体”3.0平台的三大亮点:

其一,它在2.0版本的基础上,引入了先进的大模型技术,推出了“ShuKunGPT”,实现了从专用小模型到通用大模型的飞跃。

其二,2.0版本是通过软件形态实现了医疗设备(如,CT、核磁、DR、超声等)的全面AI化,那么3.0版本,则进一步赋予硬件以人工智能的能力,实现了从软件到软硬融合的创新突破。

其三,对比最初的1.0版本,仅仅将原创AI技术赋能在医学影像领域,数字人体3.0已经把原创AI能力,拓宽到医疗健康全场景领域。

在与雷峰网的对话中,数坤科技CTO郑超用一句话总结:“医学影像与AI必然会继续深度结合,尤其是今年以来,以AI为代表的‘新质生产力’被写进政府工作报告,这既是行业所乘的东风,也是一场反哺行业的考验。”

如今,数坤科技已行至成立的第七年,做对了什么?下一步又该向何处走?

大模型带来的底层思维之变

“我们一直坚持医工结合,希望每一个创新都能转变成产品,融入医生日常工作流程中,真正服务广大医生和患者。”这是数坤科技自成立第一天起所秉承的发展理念。

这一理念贯穿于公司的每一位成员,从创始人、CTO到基层员工,都致力于紧密贴合客户需求,也就是理解医生患者们的真实痛点,以此推动技术的精准应用、产品体验和迭代效率。

数坤科技CTO郑超在与雷峰网对话时强调:“技术落地和用户体验永远都是功夫活,既有苦功也要巧劲,用户需要的是什么没有现成答案,数坤科技依然是深入临床环节,做自己的观察和思考。”

正如在过去的一年里,大模型为代表的AI技术走向千行百业,同一时期,数坤科技也在加速探索这一技术在医疗领域的应用潜力。

郑超认为,“Scaling Laws”(规模法则)是洞察这一现象的关键。他指出:“我们见证了规模法则的不断验证,这意味着从单一模型到通用模型、从单一模态到全模态的发展,将成为下一代智能化医疗解决方案的重要基石。”

具体而言,Scaling Laws揭示了模型规模(包括模型参数数量、训练数据规模及计算资源投入)的增加,其性能也会随之提升,并遵循某种幂律关系。在医疗场景中,这意味着无论是问诊、影像辅助诊断、手术治疗还是健康管理,AI的应用都在变得更加高效和精准。

与过去企业和医生对“AI+医疗”的质疑截然不同,现在“医疗全面AI化”已成为行业的迫切需求。沿着这一思路,数坤科技自主研发了医疗健康大模型--ShuKunGPT,并将其作为“数字人体”3.0平台的基础设施。

在全球最大的中文医疗评测榜CMB发布的榜单中,数坤科技GPT排名第一。同时,数坤科技也通过科研合作、与卫健管理部门合作等方式,将技术实现落地。

 

CMB中文大模型测评榜单(部分)

按照场景划分,ShuKunGPT提供了“数字医生助手”和“家庭数字医生”两大功能:

在医生端,ShuKunGPT旨在提升医生的工作效率、辅助精准诊断,并赋能临床全链路。

当患者来到基层医院筛查时,数坤数字医生支持全人体器官病灶识别,协助医生倍数级提升影像阅片和诊断效率,自动生成影像诊断报告。数坤独有的“1+X”智慧联筛功能,可实现1次检查,筛查多项疾病,以低剂量、低成本造福百姓,以高效率、强医技赋能基层。

当中高风险患者因疑难病症来到三甲医院就医时,数坤数字医生不仅能基于筛查内容帮助医生更好地掌握病人情况,还能帮助医生记录标准化病历,从个性化、多学科角度辅助诊断和治疗。提高三甲医院诊疗效率的同时,让疾病鉴别更快速更精准。

在患者端,ShuKunGPT提供以患者为中心的全生命周期健康管理。

它能全面理解用户和患者的医疗数据,像医生一样深入理解患者的需求。无论是居家、社区医院还是复杂的疾病诊疗场景,ShuKunGPT都能提供全方位的个性化解决方案。

对于患者场景的挖掘,数坤科技创始人、董事长毛新生在发布会上解释道:“医学影像是临床诊断、疾病治疗及健康管理的基石,也是数坤科技AI研发的切入点。随着医学影像场景的全面布局和领先,数坤科技已实现‘AI+’能力的外溢,无论是复杂的疾病治疗还是居家、养老的健康管理,我们都能提供全方位、个性化的解决方案。”

而更进一步说,这也暗示了数坤科技从“to B”向“to B+to C”双轮驱动模式的转型。而在这背后,数坤科技的一系列战技术部署已经初步成型。

 数坤科技为何看重「AI原生的智能制造」?

 在“数字人体”3.0的发布会上,除了大模型技术的引人注目之外,“软硬一体化”同样成为了一个焦点。

数坤智慧超声解决方案,以软硬融合的方式定义了全新一代超声工作流程。数坤科技将AI系统与超声设备融为一体,全球首创的“图灵大脑”和“图灵鹰眼”硬件技术。

“图灵大脑”具备实时、快速检出和诊断的能力,“图灵鹰眼”现实增强技术克服了依赖“第二屏”查看检出、诊断结果的不便问题,能够即时在原有超声屏幕上显示病灶的详细信息,进一步优化了疾病检出和诊断流程,引领超声AI行业的发展。智慧超声解决方案目前已应用于乳腺、甲状腺、产科等多个领域,显著提升了医疗服务的质量和效率。

此外,数坤科技从肺部、肝胆、泌尿等手术临床需求出发,全新推出智慧手术解决方案。其可实现外科手术全景地图重建、智能识别血管变异、创新楔形切除术式、穿刺手术导航定位等,全面覆盖外科手术。智慧手术解决方案打破传统手术经验壁垒,以原创AI技术赋能临床手术全流程,使年轻医生也能从容手术,使外科手术更智能、更精准、更安全。

随着大模型技术不断加码AI系统,对于如今的医疗健康AI企业,最需要补齐的就是自身的硬件能力。

“更进一说,是打造‘AI原生的智能制造’能力。”数坤科技创始人、董事长毛新生在“数字人体”3.0的发布会上分享到:软硬一体化协同,是AI持续突破技术边界的关键,更是对用户体验的重构。

数坤科技创始人、董事长毛新生

现如今,数坤科技以全流程自主研发和生产的手术机器人、智能超声等为标志,已经从最初的单一软件平台,逐步转型为实现软硬件、端到端深度融合的企业。

从这个角度来看,“数字人体”3.0不仅是数坤科技AI原生智能制造能力的集中展现,而且每一步骤、每一秒钟医生与设备的互动都将得到AI的加持。这不仅仅是技术的一次飞跃,更标志着AI将重塑医疗物理世界的每一个环节,打开提质增效的第二增长曲线。

 数坤科技的下一步

如果作一个比喻,AI和智能制造无异于两条腿,已经将数坤科技引向了反哺行业的关键期。

据悉,数坤科技的科研成果被《Radiology》《Nature Communication》《Science Bulletin》等国际顶刊接收,产品在RSNA、ECR等国际盛会上受到关注和追捧,并已与美国、欧洲、日本、东南亚、中东等多个国家和地区的医疗机构和研究院校建立了合作关系,都是在切实推动全球医疗AI行业的进步。

此外,数坤科技已经参与了多项国家级行业标准制定项目,比如《胸部CT肺结节人工智能辅助诊断系统评测标准》《冠状动脉CT影像处理软件专用技术条件》等,推动医疗AI的标准化建设。

这也意味着,对于如今的数坤科技而言,顶层设计已完成,后续挑战在于,如何将这些创新技术有效地落地执行。

数坤科技CTO郑超告诉雷峰网,数坤科技的优势在于,原创技术已经获得临床极大认可,规模化、产业化应用全面领先。

例如,数坤科技是在行业中原创且率先推出“心肺联筛”概念和产品的公司,仅需一次低剂量胸部螺旋CT,就可以完成肺部疾病和冠心病隐患等多个早筛结果预警,填补了健康体检场景下冠心病风险早筛的市场空白。

目前更是可以根据具体场景需求升级为“一扫多查”,对肺结节、肺炎、肺气肿、胸部骨折、骨质破坏、骨密度、非门控钙化积分等多项疾病,实现全面筛查与智能评估。

数坤科技的一站式卒中解决方案,在帮助宣武医院卒中绿道建设中起到了极大作用,最大程度缩短了患者的DNT时间。

最近发表于《Science Bulletin》的论文展示,数坤科技一站式全自动CT-FFR技术与半自动CT-FFR相比,操作时间缩短了3倍,不到4分钟即可完成全部处理,医生的鼠标点击次数也从平均60次缩短到1次,可以说性能遥遥领先于行业,是真正适合常规广泛的应用于门急诊临床实践的技术。

除了技术方面原创和领先之外,数坤科技已经覆盖了全球近4000家医疗健康机构,在规模化、产业化应用方面独具优势,且在区域独创了AI+医疗健康新型分级诊疗服务模式,在北京昌平、苏州吴中已经成功落地,全方位提升基层医疗服务的质量和效率。

此外,郑超表示,数坤科技将继续探索国际化市场的可能性。目前数坤科技已经获得FDA和CE认证,并在新加坡、埃及、美国等地进行了注册和科研合作,为全球医疗健康事业的发展贡献力量。

随着数坤科技的不断进步和创新,我们有理由相信,它将继续在全球范围内引领医疗AI技术的发展,为医疗行业的未来带来更多的希望和机遇。

]]>
医疗AI //m.drvow.com/category/healthai/WiGKYKOkx5WdPLJq.html#comments Thu, 18 Apr 2024 17:28:00 +0800
平安2023年报出炉,重押「医疗养老」的生意 //m.drvow.com/category/healthai/Hq8JVEcNiT66rs2x.html 在平安的未来蓝图中,医疗养老业务已经崛起为一股不可忽视的力量。

这一业务板块如何理解?它的发展潜力该如何评价?它又将如何与平安的保险金融主业形成协同效应?

这些问题在中国平安近期于香港、上海两地举办的2023年度业绩发布会上,得到了集团高管们的详尽解答。

简而言之,平安正通过整合其庞大的资源网络,精心打造一个包含医疗服务、健康管理、养老护理等在内的--综合性医疗养老生态系统

在业绩发布会上,平安集团高层以一个生动的比喻阐述了公司的愿景:平安正努力将自己塑造成为“富国银行+联合健康”的升级版——在提供全面的金融服务基础上,通过构建医疗养老生态,为客户提供更全面的健康和长寿保障。

这是一项极具想象力的企业发展规划,一旦打好地基,平安就能代表支付方,整合供应方,提供最佳性价比的服务,同时也将为平安的金融和保险生意带来全新的可能性。

平安新战略:综合金融+医疗养老

根据2023年的年报数据,平安精心打造的寿险及健康险、财产保险以及银行三大核心业务展现出了稳健性,合计为母公司贡献1409亿的利润,同时拥有超过2.32亿的个人客户群体。

同时,平安注重股东回报,拟派发2023年末期股息每股现金人民币1.50元,全年股息为每股现金人民币2.43元,同比增长0.4%,分红总额已连续12年增长。

然而,当我们从整体的角度审视时,将平安简单归类为“保险公司”或“金融公司”并不全面。在平安发布的2023年报和业绩发布会上,医疗养老生态的成就被单独凸显,才是平安的深意所在。

以寿险业务为例,平安通过代理人渠道、银保渠道、社区网格化渠道以及下沉渠道(百万兼职代理人)这四种获客策略,大幅降低了获客成本,仅为同业的5~7成,甚至低于平安自身的历史成本水平。

正如平安集团副总经理付欣所强调的,庞大的客户基础、低廉的获客成本、高效的客户获取效率、高客户留存率以及低风险成本,已经成为平安未来发展医疗养老业务的坚实基础。

从金融服务的角度来看,平安也在积极吸引和保留客户方面取得了显著成效。

数据显示,平安拥有的可投资资产超过50万的客户数量增长了7.6%,2023年的客户留存率达到了90%,而30至45岁年龄段的客户占比超过了50%。这些数据共同构筑了平安的“三高”客户群体——高价值、高成长、高留存,他们正是平安未来持续稳健发展的基石。

那么,问题在于,拥有了这些基础的平安,是否能够成功构建一个综合性的“医疗养老生态圈”?

在最近的业绩发布会上,平安集团的高层特别强调了公司在医疗养老领域的战略布局,将其视为应对人口老龄化挑战和把握健康时代机遇的关键所在。在平安的蓝图中,公司致力于通过整合旗下资源,打造一个包含医疗、健康管理、养老护理等多元化服务的医疗养老生态系统。

有人形容,这是平安在保险+金融主业之外寻求的第二增长曲线,更有人形容,这是平安发起的一场“侧锋出击”的战斗。

如今,医疗养老战略赋能主业,已成为平安集团写进年报的战略规划。

本次年报中,平安的核心战略表述,由之前的“综合金融+医疗健康”,进一步明确为“综合金融+医疗养老”。中国平安的战略布局并未停留在纸面,近几年正在加速落地,并开始差异化的为主业提供赋能。

截至2023年12月末,在平安2.32亿的个人客户中,有近64%的客户同时使用了医疗养老生态圈提供的服务,其客均合同数约3.37个、客均AUM达5.59万元,分别为不使用医疗养老生态圈服务的个人客户的1.6倍、3.5倍,享有医疗养老生态圈服务权益的客户覆盖寿险新业务价值占比超73%。

加之平安在科技、运营管理等多方面的能力优势,一份中国版“管理式医疗模式”已经悄然浮出水面。

用「人货场」思维理解平安

2024年初,国务院办公厅发布了《关于发展银发经济增进老年人福祉的意见》,该文件鼓励金融机构依法合规地发展“养老金融”业务,并提供养老财务规划、资金管理等服务。

这一政策旨在加强金融机构在养老金融产品的研发力度,并促进其与健康、养老照护服务的有效对接。

在这样的背景下,平安在医疗健康养老服务方面的布局尤为值得关注。

借鉴电商运营中的“人货场”分析框架,我们可以更深入地理解平安在这一领域的发展状况。

在“人”的层面,平安已经与超过3.6万家医院建立了合作关系,实现了国内百强医院和三甲医院的全面覆盖;与此同时,合作药店数量达到了23万家,较年初增加了近6000家,覆盖率超过37%;此外,还有超过10万家健康管理机构的合作,以及约5万人的内外部医生团队。

在“场”的层面,平安实现了线上与线下服务的全面整合,推出了包括到线、到店、到家的“三到”服务模式,这些服务已经具备了一定的规模,并对综合金融业务形成了有力的反向赋能。

在“货”的层面,平安致力于提供高质量的服务。目前,平安已经能够实现从健康到亚健康、慢性病再到重疾的全病程管理,通过家庭医生为客户提供终身陪伴,深化了医疗健康、居家养老、高端养老三大核心服务领域。

这便是平安在市场中的差异化竞争优势。具体来说:

在医疗健康服务方面,平安集团通过其子公司平安健康,为个人和企业客户提供了全方位的医疗健康服务。这些服务包括在线医疗咨询、健康管理、疾病预防等,通过科技手段实现了医疗服务的高效和便捷。平安健康付费用户数接近4000万,显示出平安在医疗健康服务领域的强大竞争力和市场影响力。

而平安集团2023年报则明确说明,平安的医疗健康相关付费企业客户超过5.6万家,健康险保费收入超过1400亿元,进一步证明了平安在这一领域的领先地位和品牌价值。

在养老服务方面,平安推出了一站式养老服务平台,提供从居家养老到社区养老的全方位解决方案,旨在为老年人提供更加舒适和便捷的养老生活。截至2023年末,中国平安的居家养老服务已覆盖全国54个城市,累计超过8万名客户获得了居家养老服务资格。

平安推出的“护联体”和“平安无忧护”产品体系,通过创新的服务模式和护理方案,为老年人的居家生活提供了极大的便利和安心。这些服务不仅包括日常生活照料,还涵盖了健康咨询、疾病管理等健康管理服务,极大地提升了老年人的生活质量和幸福感。

此外,平安积极探索“保险+高端养老”的新型模式,并已在4个城市启动相关项目。通过在一线城市和核心城市启动高端养老项目,为有特定需求的客户提供了更为优质和尊贵的养老生活选择。

这些高端养老项目不仅提供了舒适的居住环境,还配备了完善的医疗设施和专业的护理团队,确保了老年人在享受高品质生活的同时,也能获得及时和专业的医疗护理。

在最近的业绩发布会上,联席首席执行官兼副总经理郭晓涛特别提到了一个关键数据:73%。这是2023年享有医疗养老生态圈服务权益的客户覆盖寿险新业务价值的比例。

郭晓涛指出,这一数据显示了两个重要趋势:首先,医疗健康养老服务在中国具有巨大的增长潜力,它满足了客户的基本需求;其次,客户对所提供的高质量服务的认可度很高,这种认可反映在服务使用率的增长上。

值得注意的是,在本次业绩发布会上,股价的话题也被多次提及,近一步显示出平安对医疗养老这一业务的关注。

平安集团经理兼联席首席执行官谢永林强调,公司的综合金融服务和医疗健康业务均属于具有巨大潜力的行业,坚信市场最终会认识到公司的真实价值,股价将回归至与其内在价值相符的水平。

平安独有的想象力:一个客户、多种产品、一站式服务

随着平安集团在医疗养老领域的不断深耕和创新,其未来的发展蓝图已经清晰可见。

一是顺应中国老龄化社会的深入发展和健康产业的快速增长,将平安集团的医疗养老业务打造为未来业绩增长的重要驱动力。

二是继续秉承平安“一个客户、多种产品、一站式服务”的经营理念,为实现“让每个家庭都拥有平安”的愿景而不懈努力。

三是对科技创新与数字化转型的持续投入,通过运用大数据、人工智能等先进技术,平安能够更精准地分析客户的需求和偏好,从而提供更加个性化的服务,最终优化每一位客户的体验。

至于平安能否在今年更好地资源共享和业务协同,其在医疗养老领域的深度布局能否影响更多金融保险公司参与进来,新的故事已经拉开帷幕。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/Hq8JVEcNiT66rs2x.html#comments Mon, 01 Apr 2024 09:54:00 +0800
从实验室到现实,AI+手语识别,路向何方?|GAIR live //m.drvow.com/category/healthai/Qwo8nbOfgRFJk70m.html

在数据和算法塑造的现代世界中,人工智能正快速地推动社会变革。

在此背景下,一群学者将关注投向了社会边缘群体——听障人士。他们通过深入的研究和开放的对话,探索科技如何成为沟通的桥梁,为每个人带来温暖。

最近,雷峰网组织的“AI+手语识别:技术革新与应用前景”线上圆桌论坛,汇聚了田英利、倪兰、苏剑波、方昱春四位教授,他们凭借对听障社群和AI技术的深刻理解,进行了一场内容丰富的对话。

两个小时的时间里,他们谈到手语与计算机视觉技术、语言学技术的结合,还讨论了伦理、隐私保护和实际应用等关键议题,为理解听障人士如何与科技融合提供了新的视角。

这不免让人回忆起乔布斯所言:“技术本身并不足以改变世界,关键在于技术背后的人。”这四位教授正是通过技术实现社会变革的代表。

田英利教授,作为计算机视觉领域的权威专家,这十年来专注于将手语识别技术应用于改善听障人群的沟通。疫情期间,她团队的手语识别系统的远程测试引发了一个关键猜想:手语识别系统的有效性可能更依赖于上下文语义理解,而非细致的多层标注,这一发现为实际应用开辟了新的可能性。

倪兰教授,拥有丰富的语言学背景,二十年来专注于“手语语言学”的研究。她探讨了语言学对手语识别的深层意义,提出了在AI时代重新定义语言学家角色和贡献的必要性。

苏剑波教授,从产品开发视角出发,强调了手语识别技术面临的实际挑战,尤其是样本采集的场景特定性与技术和产品通用性之间的平衡问题。

方昱春教授,同样作为一位CV学者,指出手语识别的复杂性远超人脸识别,并基于七年的研究经验,对手语数据的收集和管理提出了见解,指出面部隐私保护技术“DeID”,可能为手语数据的安全共享提供新的解决方案。

这场论坛不仅促进了技术交流,更是跨学科合作的典范,正如在圆桌结束后观众所言:如果说交叉学科研究中最稀缺什么,那一定是敞开心扉的对话。

以下是线上圆桌的全文(经编辑):

01 全球视野下的突破

田英利:欢迎大家齐聚线上,也感谢雷峰网的组织。我相信大家和我一样,都对接下来手语识别讨论充满期待。在开始之前,请大家介绍下自己。


倪兰:我是倪兰,来自上海大学文学院,语言学及应用语言学专业。我进入手语研究领域至今已经整整二十年。在上海大学,我们成立了中国手语及聋人研究中心,这个中心致力于手语的学术研究和聋人群体的社会调查,以此增进社会对这个群体及其语言的理解。


苏剑波:大家好!我是苏剑波,来自上海交通大学和上海灵至科技有限公司。很高兴有这个机会与大家交流我在手语识别方面的研究。我的工作最初源于人机交互领域,最开始并非专门针对聋哑或残障人士。我的初衷是让机器人能够通过人类的下意识行为、表情和肢体语言来识别意图和情绪。在这个过程中,我逐渐意识到手语在表达情感中的重要性,并开始专注于聋/哑人群的手语识别。

我目前的研究仍未完全区分健听人和听障人士的手势识别,我将继续在这个混合领域进行探索。希望今晚能与大家分享我的研究成果。


方昱春:我是方昱春,来自上海大学计算机工程与科学学院。自2017年起,我开始涉足手语研究,并深感荣幸能得到倪老师的支持和指导开展交叉学科研究。手语作为一门自然语言,远不止是符号系统那么简单,这深深吸引了我。我们有幸获得国家文字语言委员会和上海市科学技术委员会科研经费的支持,在上海大学建立了专门的语言采集实验室和推广基地,并开展了相关教学课程建设。期待未来能与大家进行更深入的合作。


田英利:我是田英利,自1998年在美国卡内基梅隆大学开始接触人的表情识别研究。在那里,我与导师和团队共同创建了第一个微表情识别数据库,多年来被同领域广泛使用。在IBM工作三年后,我于2008年加入纽约城市大学,开始思考如何将计算机视觉研究应用于帮助有特殊需求的人群,特别是盲人和聋人。

手语作为聋人与外界交流的主要方式,不仅包括手势,还涉及面部表情和身体动作。掌握手语对聋人和健听人来说都不容易,因此,如果能开发出自动识别手语的技术,将极大地帮助聋人在就业和社交方面。

尽管各国都在努力,但手语识别仍面临挑战。我希望今天的论坛能让我们更深入地理解这一领域,为未来的研究和产业应用提供实际指导。


田英利:第一个问题,关于手语识别领域的进展,尽管众多团队和个人已在这个方向上努力多年,但仍有许多值得探讨的空间。国内外有哪些学术和工业团队在这一领域取得了显著成就?他们的研究成果是如何推动手语识别技术发展的?倪兰教授,请您先开始。


倪兰:作为从事语言学研究的学者,我对手语识别领域的认识可能不够深入,但可以和大家分享一些我所了解的情况。

2003年当我们开始手语研究项目时,哈尔滨工业大学和中国科学院的自动化所、计算所等已在进行相关研究,早期侧重于穿戴式设备而非计算机视觉(CV)。随着CV技术进步,这个领域发生了显著变化。

目前,国内活跃的从事手语识别技术团队不仅包括哈工大和中科院的团队,还有中科大的周文罡教授团队已在该领域深耕十多年,北京联合大学的姚登峰教授,作为听障学者,他的研究具有独特视角,他也正在建设中国手语和汉语的平行语料库,让聋人学生进入团队采集手语数据,取得了不少成果。天津理工大学的聋人工学院多年前开始建设中国手语长篇语料数据集。我所在的上海大学自2017年成立手语研究中心起,就开始建立实验室,采集手语视频视频,借鉴了国外数据采集的经验,在较为纯净的背景下进行拍摄,便于计算机后期建模,尽管在实验室采集,我们也尽量使用各种方式以诱导更自然的手语表达,以便获取自然语料。


苏剑波:我对手语识别领域的研究,起于对机器人领域的人机交互理论和技术的关注,并非一开始就专注于聋人手语。我更关心的是如何让机器人能够通过对人的手势,乃至肢体行为的自动识别,来理解人类的情绪和意图。

因此,我对相关团队的关注点可能与倪老师提到的有所不同。

在机器人学领域,国内外许多研究机构如中科院自动化所、哈工大,以及我所在的上海交通大学和曾做过访问研究的香港中文大学等,都在进行相关研究,尽管尚未形成完整体系。这些研究通常基于特定项目或产业化需求,利用计算机视觉技术和工具积累,在企业提出的应用需求上,开发各种能帮助残障人士或聋哑人交流的技术或工具。

应用场景如政府机关职员或医院中医生与聋哑病人的交流,所需的语料库相对有限,侧重于典型词汇的表达意图或含义,而非全面的语言学研究。

但相似的是,我们的研究同样从视频入手,专注于语义和含义的识别,更侧重于通用语料库的应用。


方昱春:作为计算机视觉专业的学者,我踏入手语识别这一研究领域,最初是受到手语语言学的启发,激发了我的研究热情。

国内,中国科学技术大学手语识别团队在手语识别领域取得了显著成就。国际上,德国亚琛工业大学的研究团队同样在这一领域享有盛誉。这两个团队凭借超过十年的研究积累,发布了多代数据集,推动了孤立词识别、连续手语识别和手语翻译等关键问题的研究,并引领了整个领域的发展。

此外,中科院计算所、西安电子科技大学、清华大学、香港科技大学、西湖大学,中科院自动化所、合肥工业大学、东北大学近年来也在手语识别领域持续发表了高水平成果。天津理工大学也建立了数据集。

特别值得一提的是,中科院计算所陈益强研究员团队,在基于数据手套的手语理解领域取得了显著成就,他的团队在聋校进行了教学应用和人机交互场景的探索。在2017年我们正准备采用计算机视觉技术进行手语识别时,陈益强教授鼓励我们尝试,尽管当时成功的可能性并不确定。毕竟,当时“人脸识别”取得了限定范围应用,“手语识别”的难度无疑更高。

2023年,参与手语识别研究的学校和企业数量进一步增加。

国内外企业如小米、华为、腾讯,以及微软、谷歌等也都积极参与这一领域的研究。很多企业关注开发具备手语能力的数字人,以提升人机交互体验。

手语识别领域近年来的快速发展,新的数据集和相关竞赛的频繁发布预示着这一领域的未来潜力。


田英利:我接着谈谈我在美国做手语识别的经验,以及对国际手语识别领域的观察。

相比较而言,欧洲比美国更早关注残障人士研究,但美国很快跟上了步伐,我很高兴看到中国许多单位也开始这一领域的研究。这背后最大的推动力是人工智能和机器学习的进步,以及计算机算力的提升,使得原本不可能的研究变得可行。

正如刚才倪教授所说,早期手语识别研究,包括与语言相关的研究,一开始是依赖于穿戴手套等设备来捕捉手指运动,实现基本词汇的识别。但现在,随着技术的发展,尤其是微软为游戏设计的RGBD摄像头的应用,许多学校开始使用RGBD技术进行捕捉。这不仅提供了视频信息,还增加了深度信息,极大地提高了计算机视觉算法的精度。

目前,手语识别的主要瓶颈是缺乏通用的大型数据库。尽管自然语言学习领域数据库技术已有显著进展,但手语识别仍面临挑战。美国、德国,希腊、土耳其等国也在进行数据采集和识别工作。

我们的团队自2004年起研究手语识别,结合计算机视觉技术和语言学研究,希望将人的表情、手势和身体动作结合起来进行识别,满足聋人的真实需求。

这个过程中,我们与很多高校建立起合作,比如罗切斯特理工大学(RIT),他们拥有规模庞大的聋人学院,超过1000名聋人学生;以及纽约城市大学亨特学院的Elaine Gale教授,她是一位失聪者,精通唇语,并在手语教育方面有着丰富的经验。

所以我们团队的工作流程相当于一条龙服务:RIT负责数据采集和标注,我们负责开发系统算法,然后Gale教授的团队在他的课堂上与学生一起验证我们的系统,并提供反馈,以便我们进一步改进。

我们意识到手语是一种完整的语言,不仅限于有限的词汇。我们的目标是研究手语的语法结构,而非单一手势。目前我们打造出一条针对美国手语的语法实时识别系统,能自动反馈学生手语的语法正确性,提供快速反馈。

我期望国内能建立跨学科的、成体系的研究环境,不仅仅是语言学者或计算机学院的独立研究,而是能够整合不同学科、聚集各类人才。我相信,随着研究的深入,这一领域将会取得更大的进步。

02 从理论到实践

田英利:第二个问题:如何从零开始构建并部署一套高效的手语识别系统,在这一过程中我们面临了哪些技术难题?大家是如何克服这些难题的?还有哪些问题尚未解决?倪老师,请先开始。


倪兰:手语识别系统构建不是我的专业,我可以从语言学的角度提供一些参考。在我看来,手语识别的过程类似于人类学习一门新语言的过程,我们需要理解词汇的意义、语法结构,最终达到理解整个语言系统的目的。从某种意义上说,手语识别就是将人类的语言学习经验传授给机器的过程。

在构建手语识别系统时,我们需要解决的关键问题是如何匹配形式和意义。刚才田老师提到的方法,似乎是将整个句子视为一个结构来处理,而不是单独识别每个词。这种方法似乎更侧重于语言单位的整体性,而不是单个词的识别。

在国内,许多团队可能是先从识别孤立的词汇开始,然后逐步扩展到整个句子或段落的识别。但田老师提到的方法是不要求具体词的精确识别,而是关注整个句子的意义匹配。这实际上涉及到语言学中的“语块理论”,即“以意义为单位进行语言分析”。

我很想知道,田老师的方法是否需要人工标注句子的意义,以及在形式和意义的匹配过程中,如何界定语言单位,以及如何进行标注。这些可能是我们在构建手语识别系统时需要深入讨论的问题。


田英利:倪老师,您提到的问题非常关键。确实,手语的连续性和句子间的切分对于理解整个表达非常重要。机器学习在切分方面可能与传统语言学的方法有所不同。在我们的研究中,虽然我们没有对每个词进行识别,但我们确实对一些与语法相关的关键词进行了识别,比如表示时间的“昨天”、“前天”以及“明天”、“后天”,这些都是通过手势、位置和表情来表达的语法元素。

我认为,随着对手语每个词识别精度的提高,我们将能够更好地理解整个句子。就像我们在说话时,即使每个词都听得懂,但如果没有上下文的理解,我们也无法完全把握说话者的意图。同样,在手语中,上下文的理解也非常关键。同一个手势,在不同的上下文中可能表达完全不同的意义。

总的来说,我认为,对手语中单个词的理解是必要的一步,但同时,我们也需要关注上下文和整体句子的理解。这样才能更全面地把握手语的含义。再次感谢倪老师您的宝贵意见,它们对我们的研究工作具有重要的启发意义。


倪兰:田老师,您刚才提到了语言理解,包括语法中的时间词和疑问词等。您在处理这些问题时,会考虑句子的语序吗?比如,时间词在句子中的位置,我们是将其放在句首、句中还是句尾?例如在汉语中,我们可能会说“我昨天去了哪里”,这里的“昨天”是放在中间的。您在研究中会考虑这种语法结构吗?


田英利:是的,我们会考虑这些因素。我们不仅关注词的位置,还关注它们的时间因素。

例如,我们不能在说出“倪老师,你吃饭了吗?”这个问题之后,过了很久才做出询问的表情(比如眉毛上挑),这样的话,表情就与问题脱节了。因此,我们不仅要考虑表情发生的时间,还要考虑它与关键词、问题句子的相对时间关系。这样的考虑才能赋予其语法意义。在美国手语和中国手语中,这些都是关键问题。


苏剑波:这个问题确实是手语识别领域中非常核心的技术难题。我很难说我们已经克服了哪些挑战,或者更准确地说,我认为在手语识别方面,我们仍然面临着大多数问题尚未解决的现实。

正如方老师刚才所指出的,手语识别是一个比人脸识别要复杂得多的领域。确实如此,十多年前,我有一个硕士研究生专注于人脸识别研究,他取得了非常好的成果,并发表了优秀的论文。毕业后,他去了香港中文大学攻读博士学位,那里的导师希望他能将他在人脸识别研究中的经验和成果应用到手语识别上。他深思熟虑了好几个月,最终还是放弃了,因为他了解到手语识别的难度,所以没有继续这个方向的研究。

手语识别领域的要求和对不同场景的适应能力,以及对语言语料库的积累,都使得它在模式识别领域中独树一帜。尽管我也是从计算机视觉和模式识别技术起步的,自然而然地会寻找能够代表某一类模式的特征集合,这是我们这些受过模式识别专业训练的人的本能反应。

但这种传统模式识别领域内有效的方法,在手语识别领域可能就不那么适用了。手语的多样性和变化性——场景、人物、职业的不同,甚至不同地区和方言的差异——使得手语的特征选择和定位变得异常困难,远远超出了人脸识别等其他模式识别任务的复杂性。手语识别不仅包括静态手势的识别,还包括动态手势的识别,这就像文字断句一样,不同的断句方式可能导致完全不同的语言含义。手势的这种“断句”差异可能会导致真实含义的巨大变化,甚至完全相反的意思。更不用说不同国家和方言的差别了。

在实际研究过程中,我们可能都会遇到类似的经历。如果我们基于公开的标准数据库集进行手语研究,相对来说进展会比较容易。但如果我们基于真实人物采集的数据库进行研究,难度就会大大增加,因为手语和手势的特征提取也会变得非常个性化!因此,如何将这些研究成果转化为广泛接受的手势或手语表达形式,是手语研究中极具挑战性的问题。

在模式识别领域,无论是语音识别、人脸识别还是指纹识别,都有专门针对这些领域的工具和技术。然而,针对手语识别,我们似乎更多地是将其他领域的成功方法应用到这里,而没有针对手语识别开发出专门的技术手段和算法。

这反映了我们在这个领域开发特定技术难度的问题,或者说是通用性的难以实现。我们现在所做的工作,大多是基于模式识别领域内公认的技术,如卷积神经网络和各种滤波手段。然而,很难期望一个并非为特定领域中特定环境下解决特定问题而设计的工具,能够将该领域的问题解决到极致。

我们提出了所谓的“特征完备性”概念,针对常用的几百个手势,无论背景、职业、应用场景和文化背景如何不同,人们在表达同一语义时手势之间的相似性,及不同语义时的手势之间的差别,都可以通过一个足够完备的特征集合给予描述;同时,为了减少识别的计算量又期望特征的整体规模要足够小,即特征之间的正交性。这是我们把在其他模式识别领域的一些成功思想,拓展到手语研究。

通过上海灵至科技有限公司和上海追求人工智能科技有限公司两家公司的市场化合作,我们试图将模式识别的通用技术应用于帮助残障人士领域,他们拥有市场资源,能够获得特殊行业如多地聋哑学校的支持,从而采集特定的样本。

但是,我们有时也会质疑,在特定场景下采集的样本对于样本的拓展性和通用性究竟有多大的价值?这很难说清楚。这些都是我们在手语研究方面的一些困惑和难点。我提出的问题多于解决方案,接下来请问方老师,您那边有什么想法吗?


方昱春:我先回答问题的第一部分,关于如何构建和部署手语识别系统。

我的研究小组还没有开发出真正能够应用于实际场景的手语识别系统。但是,在观看了田老师的专访后,我深刻地理解了为什么田老师的工作,倪老师会认为特别有价值。因为田老师她们选择的问题——将计算机视觉方法应用于帮助学习手语的人,以便更准确地表达语法——实际上是手语语言学与计算机视觉模式识别交叉学科中的一个非常精彩的问题。

选择这样的问题进行研究,应该是非常有智慧,是交叉学科研究和应用非常好的例子。它不仅具有很高的实用价值,而且从语言学的角度来看,也具有很高的学术价值。这对我们来说是一个非常好的启示。

手语方面,最大的困难在于数据标注。与自然语言相比,我们目前拥有的手语数据集标注量非常少。自然语言可以进行字、词、语法、语义、语用的复杂标注,有大量的语言学家可以帮助完成这些工作。然而,要获得如此详尽的手语标注数据,难度就非常大了。这与手语本身的复杂性有关,它涉及到上半身多个部位的协调运动,并且具有很强的语言模式,这本身就是一个挑战。

要像自然语言理解那样去做手语理解,难度是非常高的。正如苏老师刚才总结的一些经典问题,比如复杂性光照、背景复杂性、姿态复杂性等,这些都是我们在计算机视觉问题中需要面对的挑战。这些问题可能只有一部分可以通过计算方法解决,但我认为选择一个好的应用场景也很重要。例如,田老师语法纠正的应用就是一个实例。如果我们的应用场景是限定的,那么我们现在已经实现的一些视觉方法就可能落地应用。

至于其他的难点,可能要等到前面提到的数据采集和标注问题解决后,以及一个好的应用场景的选择,我们才能慢慢理解手语,进而促进我们理解人类的语言智能和认知智能。在这个基础上,可能会逐渐发展出更加普遍化的手语识别技术。


倪兰:在讨论手语识别的过程中,我们不得不提到语言学的分类。

我们知道,目前的许多语言学研究,包括像ChatGPT这样的模型,主要处理的是文本,也就是我们所说的书面语。对于书面语的标注,我们有很多数据库,无论是现代汉语还是古代汉语,都有相应的标注资源。然而,当我们转向口语,也就是有声语言时,虽然现在汉语口语的数据库并不多。但至少在语音识别领域,我们已经有一定的标注基础,语音标注可能主要关注元音和辅音等方面。

但在手语标注方面,我很想了解你们在计算机识别或合成领域主要需要什么类型的标注。我们在使用一些软件进行语言学标注时,可以实现多层标注,最多可以达到50层甚至60层。但这样的标注对于计算机的手语识别有用吗?

我曾看过一些用于打榜的标注,比如西班牙手语的标注,主要是对个别词进行切分和语义标注,而不是完整的词汇切分。对于与语言学家的合作来说,你们最需要的标注是哪一种?你们需要标注到多少层,才能解决识别一个句子或一段话的问题?我对这个问题非常好奇。


田英利:对于视觉领域的手语识别来说,我们最关心的是语义理解。也就是说,当我们看到一整个手语句子时,我们想要知道它在表达什么意思。至于词的层面,了解孤立词的语义对我们来说已经足够了,并不需要像语言学研究那样进行50层细节的标注。

我们的主要应用目标是实现正常的交流,这是首要的一步。但是仅从视觉角度来解决这个问题基本上是不现实的,我们必须与语言学家、手语使用者,包括聋人社区合作,共同解决问题。

接下来,我们要考虑的是如何将这个复杂的问题简化。就像自然语言处理一样,即使是像ChatGPT这样的大规模模型,最初的研究也是集中在“新闻报道”这样比较官方、正式的内容上。只有在这些基础工作做好之后,我们才能慢慢扩展到不同的口语或其他领域。如果第一步做不好,后续的工作基本上就无法进行。


倪兰:那么回到这个问题上来,就是说在构建系统的过程中,我们需要对标注的规范达成一致的标准,对吗?这是我们需要明确的。


田英利:确实如此,拿我们团队来说,从一开始就明确了我们的研究方向。无论是系统开发还是视频手语捕捉,我们都事先讨论并决定了使用哪些传感器,以及捕捉的详细要求,比如是捕捉整个句子还是多个句子。我们最终选择了多个句子的方法,这样一来,我们就涉及到了不同句子之间以及不同词之间的分割问题。

另一个挑战是,正如我们在口语中不是每个词都有意义一样,手语中的手势也不全是有意义的。有些手势具有意义,而有些则没有。在实验室环境中,人们可能会刻意减少这些无意义的手势,但在实际应用中,人们会自然地使用各种无意义的连接手势。因此,如何准确地进行分割变得尤为重要。

我尤其想说一个插曲。当我们基本上开发出这个系统,并准备在课堂上进行测试时,新冠疫情爆发了,学生们无法到校上课。面对这种情况,我们不得不让学生在家中使用手机完成作业,并将视频发给我们进行系统测试。由于原本使用的是RGBD传感器,现在D(深度信息)的部分没有了,我们发现学生的视频中手的位置、远近不一,有时手势甚至超出了画面。

这对系统的考验非常大。在这种情况下,即使我们不能识别每一个词,我们也需要能够理解整句话的意义。这就像我们在网络通话中,即使偶尔丢失了几个词,我们仍然能够理解整个对话或段落的意思。因此,我认为在实际应用中,我们不一定需要非常细致的多层标注,但我们需要能够识别整个句子或段落的含义。如果我们能够做到这一点,那么这个系统就可以投入使用了。


苏剑波:我来补充一点。在实际应用中,我们面临一个挑战,那就是基于标准手语库训练出的识别系统如何应对真实用户,比如聋人在实际使用中的手势并不总是那么标准?

从模式识别的角度来看,这就像是你收集了大量的语料库,但在实际应用中,如何将系统扩展到具体用户的样本上,你的系统可扩展性到底能达到何种程度?实际上,这非常制约整个系统的实用性。


田英利:这确实是一个问题。就像ChatGPT一样,尽管它现在非常强大,但它也不能提供任何问题的答案。特别是对于帮助残障人士的系统,一定要有个性化定制的那一步。也就是说,基本系统建成后,针对每个人的具体应用,必须有一个调整过程。这是必不可少的。否则,对于个人用户来说,应用过程中会存在断层。


苏剑波:确实,我们需要一个标准系统作为基础,然后针对特定用户进行自我学习或调整的过程,这样才能逐渐提高系统对该特定用户的准确度。


田英利:是的,无论如何,还有另一个问题是关于用户界面的。无论你的技术有多好,如果你的界面不友好,用户就不会去使用它。


苏剑波:对,所以这个磨合过程往往会让用户失去耐心。


田英利:这就是为什么我们在最开始的时候就要把聋人朋友纳入到整个系统的开发中来。这些朋友对新技术充满热情,他们也愿意帮助和贡献。然后再进行推广。如果一个不成熟的产品在推广时让用户决定不再使用,那么以后想要让他们重新使用就会变得非常困难。


倪兰:我理解苏老师的困惑所在。可能因为美国手语的发展时间比中国手语要长,但在中国手语中,我们确实面临着苏老师提到的各种“地方变体”的问题。

对语言学家来说,语言的多样性是语言成熟度的表现,我们非常乐于接受。但手语有自身的复杂性,有方言的问题,还有群体内部的异质性(因为不同的教育背景、家庭情况、听损情况等,他们的手语使用情况千差万别)。

不同于普通话,我们可能只关注发音是否标准。聋人群体中,手语的好坏差异巨大。即使在公认的手语较好的聋人中,也存在差异。很多聋人并没有接受过系统的手语教育,他们大多靠自学。

手语的标准并没有像有声语言那样有一个明确的评判标准。通用手语目前只是一些词汇,而这些词汇也是从各地手语中采集来的,未来还需要进一步完善。

实际上,我们比较过通用手语常用词表和之前手语词典的词汇,发现词汇差异并没有我们想象的那么大。比如通用手语中的“安静”是一个复合词,即两个手势,但上海聋人可能只用一个手势,这种情况实际上并不影响核心意义的传达。

我特别关注田老师所做的工作,她不仅仅关注孤立词的识别,而是关注整个句子意思的理解,这对我们有很大的启发性。因为手语的方向和位置变化很大(例如我看到小孩学手语时在头的位置打出“牛奶”的手语,其他人也能看懂),如果我们能找到一些工具专门提取手语中有价值的特征,可能会对手语识别技术非常有帮助。


田英利:我认为您补充得非常好。实际上,在应用过程中,即使我们无法准确识别单个词,我们仍然可以通过视觉方法来理解整个句子的意思。

确实,要在现有技术水平下完全准确地通过视觉方法识别出所有意思有些困难。但苏老师团队的公司在针对特定场景研发技术,这非常能帮助到聋人。

例如,我们可以开发一些特定的产品,比如一个小软件,专门用于医疗场景中的对话,包含与病痛或医生沟通的词汇。这样,当他们去看医生时,只需要使用有限的词汇,比如三百到五百个,甚至几个手势,比如“肚子疼”、“头疼”,就能表达他们的不适。这样简化复杂问题,即使不能完全解决问题,也能在实际生活中为残障人士提供便利。


苏剑波:是的,这是一个很好的方法。我们在实际操作中,可以先让系统猜测病人可能的意思,然后再确认,这样的交互可能更实用,而不是追求一次性识别出完整的意思。


田英利:在开发系统时,一定要将聋人纳入系统的一部分。因为他们是系统的直接用户,所以让他们参与验证可以大大提高系统的准确率。当系统明确知道他们的意思后,可以将其翻译给医生。即使医生没有学过手语,通过语音或文字的翻译,就能理解他们的意思。


苏剑波:是的,对于福利院、养老院或专门用于照顾残障人士的机器人,它们可以通过人脸识别来识别出某个人习惯使用的手势。经过一段时间的自我学习后,它们就能快速准确地识别出特定聋人的手语。但在许多应用场景中,机器人没有这样的机会进行学习,所以这一步就无法实现。如果能让机器人长期陪伴一个聋人,那么这方面的压力就会减少很多。这就是我们的方向。

03 AI的启示


田英利:第三个问题,ChatGPT、Sora等大型语言模型在自然语言处理(NLP)领域取得了显著成就。这些模型背后的设计理念和技术路径,对手语识别研究有何启示?方老师,请您先分享。


方昱春:我认为ChatGPT作为大模型的典型例子,其成功的实用化范例很大程度上依赖于海量数据的支持。那么,这对手语识别有何关联呢?

我们认为,大型模型实际上是在大量文本语料上学习语义之间的关联性。而手语识别处理的是视觉方式传达的语义。人类在表达社会生活时,在语义空间中仍有许多共通之处。因此,我们认为大型模型的成功经验可以借鉴,特别是在构建语义空间方面,可能会加速我们对手语理解的研究。

这目前还只是一个猜想,我们尚未真正付诸实践。

此外,像Sora这样的文生视频大模型在多模态信息处理方面展现出了强大的能力。手语本身也是一种多模态形式,其形式是视觉信号,而内容传达的是语言信息。因此,我们也认为Sora这种多模态的工作方式可以给我们提供很好的启示。

主要在这两个方面——语义和多模态——我们可以借鉴和使用大模型,对手语识别技术提供支持。


倪兰:ChatGPT在2023年成为了最热门的话题,从年初到年末都备受关注。在我们语言学界,ChatGPT的出现引起了巨大的轰动。以前我们认为理解语言需要依赖语言学家来提供有价值的信息,然而ChatGPT和Sora等模型似乎表明,只要有数据就足够了。

许多学者也在探讨:人工智能时代,语言学家能做些什么?

尽管在有声语言识别,尤其是文本识别方面,人们可能认为语言学家的作用不再重要,但我认为在初期,语言学家提供的一些关于语言的重要信息是有价值的,包括语法结构等。

结构主义对我们人文领域产生了深远影响,我们知道语音、句子和词汇都是可以切分的,这种结构化的认识对于今天的大语言模型可能已经被遗忘,但它们最初的工作是至关重要的。

关于通用性,我们也在思考是否能够在手语领域找到一些最核心的信息,比如它的结构。尽管目前缺乏大规模的数据集,但也许我们可以找到一些关键的手语信息,这可能对手语识别有一定的推动作用。在与方老师和其他老师的沟通中,我们发现,许多老师认为手语是一个无法结构化的混沌整体,但一旦进行了结构化分析,就可以反复应用这些规律,这就是结构的力量。

因此,我们可以从ChatGPT中得到启示,思考在手语识别中哪些核心架构是关键的。

我记得在早期的GPT-3.0版本中,有些句子的搭配感觉有问题,但经过不断的训练后,它就能够扩展。我们是否也能在手语识别中找到一些关键的结构?比如手语动词的方向性,如果我们知道这一点,那么我们就不会将“我爱你”和“你爱我”识别成两个独立的手势,而是能够理解方向性动词的开始和结束位置是可以标记成句子的主、宾语。还有手指的朝向,它也可以表示宾语,这些都是结构化的特征。我们在分析手形时发现,中国手语中表示”钱“的时候,很多人认为必须拇、食指要捏成圆形。但实际上,在实际使用中并不会完全捏圆,这时不捏圆和捏圆的手形在意义上没有差别。当我们在语料中发现这两种手形实际上不区别意义时,这是否可以提高识别的准确性?

所以,我认为一方面ChatGPT告诉我们需要大量数据的积累,另一方面也提示我们有些核心信息需要早期放入到标注中,或者在构建手语识别系统时,可以提供给计算机一些知识库信息。

正如大家所讨论的,实际应用中,每次向ChatGPT提问得到的回答都会有所不同,我们可以在缺乏数据的情况下通过关键信息让系统不断自我学习,自我应用。

当我们缺乏足够的语言学者和标注人员时,未来实现自动标注可能是解决大数据问题的途径,因为系统可以自适应地学习。


苏剑波:这个问题我已经思考了很久。包括ChatGPT和Sora这样的工具,从技术发展的角度来看,它们都是非常清晰的人工智能工具。

ChatGPT主要是基于文本的人工智能工具,而Sora则是基于图像和视频的人工智能工具。因此,从手语识别的角度来看,我个人感觉Sora对手语识别的帮助可能要超过ChatGPT。

我们一直在思考的问题是,传统上我们总是需要从图像或视频中提取各种特征,无论是几何特征还是统计特征,并评价这些特征能否表达图像所代表的语义含义。从这个角度来看,无论是目标识别、运动分析、颜色识别,还是其他类似的任务,最终都要拓展到语义层面。

但我一直思考的是,比如我们观看一段视频或电影时,我们关注的是视频中的人物、情节和行为,我们可以从头到尾理解视频的内容和意义,而不会过分关注计算机提取的图像或视频特征。那么我们在做手语识别时,真的需要通过提取视频中的特征来识别手语的语义吗?

当然,计算机视觉的传统理论都是这样,选用什么样的特征表达关注的语义决定了基于计算的人工智能系统的性能,因此而考虑特征选择和提取的鲁棒性、速度和准确性。

Sora给我的冲击是,它是通过视频的方式来理解内容,但它的机理是什么?我不清楚。

它是通过传统意义上的计算机视觉特征提取来完成视频理解,还是通过其他手段?

这激发了我们对手语知识表达最有效的手段是什么的思考,包括语义的拓展和新的情绪、语义生成手段是什么?

如何让机器人能够生成手语来表达自己的意思,或者理解残障人士的意思,并通过手语解释给他们听?

在这个过程中,可能真的需要理解人类的思考或意图,这种计算模型是什么?

是否一定要基于我们在计算机视觉中学到的统计或几何特征?

我不清楚,但我体会到了ChatGPT和Sora给我的这种反向刺激。

观察人与人之间的交流时,包括健康听人和聋哑人的交流,人们是如何通过各种手势来理解他人的情绪或残障人士的手势含义的。

反过来说,计算机的计算能力远远超过人类,它是否一定要模仿人类不一定是计算方式的理解他人或残障人士手势的过程?

在这个过程中,它应该使用什么样的特征和模型来表达?这些模型或特征未必是人类需要或使用的。

我们以前总是说人工智能首先要学习人类是如何获得智能的,或者智能是如何进化的。我现在怀疑,计算机在发展人工智能或计算智能时,是否一定要走人类智能生成、发展和进化的同一条路?


田英利:回答您这个问题确实颇具挑战性,因为关于人脑如何产生智能的问题,目前科学界还没有确切的结论。

众所周知,任何关于人类智能进展的研究,都会对计算机人工智能的发展产生重大影响。然而,即便是小孩子的思维也不是二进制的,而计算机只能通过0和1的二进制来进行运算。计算机必须依靠其强大的计算能力来模拟,甚至达到小学生水平的智能。

最近,得益于强大的计算力和海量数据,ChatGPT似乎实现了一个飞跃。但我们也必须承认,尽管ChatGPT取得了巨大进步,它提供的想法或答案并不总是准确的。有时我们开玩笑说,ChatGPT经常一本正经地胡说八道,看似头头是道,实则可能是错误的。

为什么会出错?因为它缺乏判断能力,只能依据以往的大数据来得出结论。

Sora也是如此,它可以基于几个关键词生成逼真的视频,但这些视频真的符合我们最初的预期吗?并不一定。因此,我认为使用大数据进行手语识别仍然有一段路要走。

在我们的研究团队中,我们在等待收集数据库和标注数据的同时,采取了一种方法:我们直接从YouTube上获取那些已经有手语翻译的演讲视频,将演讲内容作为标注,使用视频中的小框内的手语进行识别,得到了不错的结果。但这些都是比较官方的内容,涵盖的范围相对有限。另外,视频中手语的质量也非常有限。

不过,我认为将来有了强大的计算力,可以将这类数据作为一种可行的备选大数据资源,利用现在的自主学习或无需标注的学习技术,自动剔除不准确的部分,提取最关键的语义信息。

这样,我们就能理解手语者在表达什么,这已经足够了。我们不需要精确地识别每一个词。这是我们自己的一种尝试和探索。


苏剑波:目前我们通过这种方法实现目标是完全可行的。但从技术的完备性角度来看,我个人并不特别喜欢所谓的标注过程,因为任何标注都可能带有标注者个人的主观意图。

正如在人工智能领域,比如早期让计算机学习下围棋,最初是通过学习人类的棋谱来进行的。但后来发现计算机无法判断人类高手棋谱中的错招和漏招,因此后来改变了策略,让计算机自我对弈。

现在,计算机只知道围棋规则是由人类设定的,但它通过自我进化来提高下棋技术,而不是通过学习人类的棋谱来达成目标。计算机围棋已经通过这种方式达到了远超人类的水平,但它并非是通过学习人类智能的方式实现的。

这个案例对我来说是一个极具启发性的思路,它表明机器智能的进化和提升未必需要通过学习人类智能来实现。这是我的观点。


田英利:然而,在最初阶段,我们仍然需要人类的标注,正如您提到的围棋例子,它有一套完整的规则。

对于手语和语言,尤其是受到地域限制的情况下,规则越明确,计算机学习的效果就越好。

但当规则不明确时,我们该怎么办?最初的时候,一定要有人来教它,告诉我们如何进行。


方昱春:算法应该还是依赖了大量的棋谱数据,展现了记忆的巨大优势。


倪兰:苏老师,这个问题在语言学上有一个解释。

根据乔姆斯基(当代著名的语言学家和思想家)的理论,所有人类都有语言的潜质和本能,但如果把一个孩子扔到森林里,不让他接触人类,他其实很难学习到语言,仍然需要激发,需要父母不断地为他提供语言数据的刺激和纠错机制。

我们教孩子语言时,并不是只教他“a是b”这样的句型,他就能照做。他会将规则用到极致,创造出我们从未教过的新句子。这其实和机器学习是一样的,我们告诉它基本规则,然后它产生新的东西。当然,人类的语言机制可能更复杂。

所以,我们目前对手语的构造了解还不够。很多时候,即使我自己的手势并不标准,但有时候一个表情就能让聋人立刻理解我想说什么。

我认为,我们的视觉捕捉到的信息比我们通过有声语言表达的信息要多得多。如果我们对手势和身势语有更深入的了解,一定能帮助我们更好地理解他人的意图和言语含义。手语虽然源自身势语,但它已经发展出了一个相对完整的体系。

我们首先对身势语了解不足,然后对发展出的手语的语法规则也没有完全掌握,这就带来了识别的复杂性。聋人在表达时,同时也会使用身势语。我们可以做一个实验,观察视频中的人边说话边打手势,当把声音关掉时,你完全不知道手势代表的含义。聋人能将他们的身势语和手语融合在起来进行表达。因此在手语识别时,我们如果不能区分身势语和手语,就会觉得复杂,没有规则。

手语是一种语言符号系统,它的表达有一定的限制性和语音规则。但因为它太复杂,融合了很多多模态要素,包括表情体态等,而我们对表情的认识和了解还远远不够,这就是为什么手语识别起来异常很困难。


田英利:我觉得苏老师提出的问题非常有趣,技术上如何解决?

倪老师谈到的也确实如此,有时候我们的语言只占交流的30%,大部分时候,尤其是在家庭中,有时甚至不需要说话,一个眼神就足以传达意图。人的交流有多个渠道,我认为不需要准确地识别出每一个字、每一个细节才能进行应用。

所以,我们现在自然地过渡到了下一个讨论议题,即尽管技术困难,包括特征提取的难度,但我们如何克服这些困难,在现有的技术条件下尽可能地帮助听障人士的生活?

04 技术与现实的碰撞

问题四:从技术研究走向实际应用,我们可能会遇到哪些现实困难?如何将手语识别技术更好地融入到听障人士的日常生活中?


方昱春:从计算机应用系统的角度来看,难点集中在“接口设计”上。

许多信息类产品,如果对使用者的约束太多,例如人脸识别时需要用户配合特定的姿势、光照条件和设备,那么用户在受限的环境中使用,体验就会不佳,最终这项技术也可能被抛弃。为了让聋人能更好地使用我们的技术,应该提供一种更自然、更无感的体验,让他们能方便地在更多公共场合中感知语言的表达。因此,我认为一个适当的接口是走向实际应用中的一个典型问题。

还有其他一些问题我们在前面的讨论中已经涉及过,比如手语的变化性很大,我们如何满足用户的个性化需求?这些都是需要解决的问题。

另外,我们也多次提到手语识别的难度很高,这会影响我们开发的技术的精度,这些情况都是存在的,这些因素都会影响到整个技术的实际落地和推广。


倪兰:去年我和方老师合作指导了一个关于应急手语的学生科创项目。大家普遍认为聋人群体在日常生活中会频繁使用手语,但实际上,聋人群体是多元化的,也包括那些不会打手语的听障人士,他们的手语熟练程度和教育水平也各不相同。他们对字幕和文本的理解能力也不尽相同,因此我们需要确定哪些场景最需要手语识别技术。

有时,我们在新闻中看到的手语翻译可能并不总是被聋人理解,但它代表了一种对语言权益的尊重。

如果手语识别技术能够发展到聋人在日常生活中都能方便使用,就像拿出手机发短信那样简单,那将是一个巨大的进步。之前vivo曾推出过手语识别和合成技术,聋人朋友尝试使用后发现,输入一句汉语可以逐字打出手势,但如果要识别一个聋人打的手语句子,目前的技术水平还做不到。

在需求分析方面,我们可能需要深入了解聋人最迫切的需求场景,比如医疗领域,中老年听障人士的需求尤其大,他们可能更依赖手语。与年轻人不同,他们可能不太熟悉语音转文字的电子设备。在这种情况下,我们需要考虑手语数据应该采集自哪些人群,以及把医疗术语翻译成手语的挑战,因为很多术语可能在手语中并不存在,直接翻译反而会造成误解。

因此,我认为可能需要将“语音识别”与“手语识别”结合起来使用,并且要考虑数据库采集对象的多样性。

另一个场景是教育领域,聋人也需要学习手语。在学习手语的过程中,提供标准化和规则化的内容是很重要的。

例如,郑州工程技术学院等院校在招收全国各地聋人学生时,会先培训他们共同使用一套手语,然后在四年的学习中不断练习和使用。

在教育领域,我们需要考虑如何为聋人提供课程支持。目前,招收聋人的学校大多使用字幕机,但我们需要更深入了解聋人在哪些场合需要这些产品,并考虑在窗口、银行等公共服务场所的应用。我认为手语识别产品可能需要结合多元化的模式,如果只依赖单一的手语识别,可能会在某些场合受到限制,因为情况特别复杂,尤其是在中国这样地域广阔的国家。手语有很多地域分支,统一的标准可能无法满足所有聋人的需求。


苏剑波:我这边的工作主要是关于机器识别聋人的手势,并将其翻译给健听人,以便在各种环境中,如服务窗口、教育场所或医疗场所,促进聋人与健听人之间的交流。

但我一直不太确定,应该使用什么样的工具来实现这一点。

比如,是否让健听人手持iPad,实时拍摄聋人的手势,然后屏幕上就能显示出他们所说的内容?

这种方式有助于促进双方的交流。然而,在实际应用中,聋人往往不愿意被拍摄。即便解释说拍摄的目的是为了翻译他们的手势,他们通常也不愿意接受。除非在迫不得已的情况下,比如在政府部门或医院需要办事时,他们才会勉强接受这种方式的翻译。但在正常情况下,比如在马路上交流,如果用设备拍摄他们,他们肯定会反感。

我一直在思考,这种技术究竟应该如何转化为实际应用?甚至连最基本的工具使用方式都没搞清楚。我们通常习惯于使用手机,比如不认识的花,就用百度拍一下识别,这是我们日常生活中常用的工具。

但与聋人交流时,我们不能总是带着iPad,或者让他们在iPad显示下进行手势,然后翻译出来。我不知道该如何应对这种情况。

倪老师提到,在特定领域,如医疗和教育,可能不得不使用某些工具来帮助理解他们的意图。但如果要设计一个适合聋人使用的产品,或者一个可以随身携带的设备,让他们在需要与正常人交流时,能够实时显示他们的意图,那将是非常有益的。

但这样的产品是什么呢?我还不太清楚。就像手机那样,但具体该如何操作呢?是通过拍摄手势,然后在手机屏幕上直接表达他们的意图,还是通过语音说出来?我还在探索这方面的解决方案。


田英利:针对苏老师的问题,我认为我们的讨论非常有益。从技术到产品的落地,确实还有许多困难需要克服,路还很长。

关于应该开发什么样的产品,近年来VR和AR技术被频繁提及。我们需要一种自然的产品,而不是让人们感觉像是扛着摄像机或iPad来录制。

想象一下,如果聋人可以戴上一种眼镜,这种眼镜内置有针孔摄像头,能够捕捉他们自己的手势,并将这些手势直接翻译成语音。

当我知道他们的意思后,我就可以回答他们。这种眼镜当然也会有麦克风,能够捕捉我的语音,这时就不需要手语,而是直接将我的语音转化成文字,显示在他们的AR眼镜上。

这样一来,我们就能理解苏老师所讲的情况,即不仅仅是通过摄像头来识别手语,而是将语音、文字和部分肢体语言这些多渠道信息综合起来,帮助我们进行沟通交流。我们不需要成为他们的“灵魂伴侣”,只需要大致理解他们的意图,这对他们的生活就已经是很大的帮助了。

此外,苏老师提到了一个非常重要的问题,即关于拍摄的隐私问题。在摄像头无处不在的今天,我们如何在保护隐私和技术发展之间找到平衡?



05 伦理与隐私

问题五:在开发和部署手语识别系统时,如何确保听障人士的隐私得到保护?我们如何在技术创新与伦理道德之间找到平衡?


倪兰:这确实是我们在构建数据库时一直面临的困扰。起初,我并没有强烈的隐私保护或知识产权意识,是方老师向我强调了在计算机领域中数据保护的重要性,我才开始重视这个问题。

我们采集了大量的数据,但在采集过程中,我们都会与聋人被调查者签订协议,确保他们的隐私受到保护。因此,在数据的公开使用上,我们非常谨慎,会明确询问数据的使用目的。

有时,一些企业会委托进行数据采集工作,我们也会非常小心,担心数据被用于其他目的。

文本数据的情况不同,因为ChatGPT所使用的大部分文本数据都是公开发表的,如新闻报道、出版的书籍或学术论文等。但手语数据无法屏蔽肖像,即使是在脸部任何部位打上马赛克,都会导致语义信息损失。眼睛是表情中最重要的部分,我们经常说它们是心灵的窗户,眼睛的睁大、闭合,甚至眼神都包含了丰富的信息。如果在处理数据时屏蔽了这些信息,就无法进行有效的识别。

因此,我们目前的做法是--有限度的授权使用。

我们确实意识到,如果不发布数据,它们就无法得到广泛应用,但一旦发布,又如何保护这些信息呢?

因此,对于表示不愿让自己的信息被发布的聋人,我们都会做出承诺。保留了原始数据,但仅在不公开的情况下,用于我们自己的研究和观察。


苏剑波:关于隐私保护的问题,我并没有一个特别好的答案。但在这个过程中,我一直在向遇到的人们解释,在公共场合,无论你是残障人士还是健听人,大家都是没有隐私的。

当然,如果有人恶意使用你的肖像或生理特征,那就是另一回事了。这种情况下,应该从法律角度对滥用者进行惩罚。

实际上,任何人只要不在自己家里,在外面就都没有隐私。所以,隐私该如何保护?如何进行过滤?

包括马赛克等手段,现在都可以用人工智能算法恢复成正常状态,这些技术已经没有什么秘密可言。在这个问题上,确实很难做到完全的过滤。当然,倪老师刚才提到的也很对,我们需要尊重使用者的个人意愿。

我会告诉他们,我会如何使用他们的生理图像,如果他们同意,我就使用;如果不同意,我就不使用。

但实际上,我也不断向他们解释,在公共场合下,你的图像很容易被别人使用。所以,让他们逐渐了解现代科技已经发展到何种程度。通过我几次解释后,他们也能理解了。我会给他们看各种各样的视频,让他们明白公共场合下的监控是多么普遍。

但如果有人恶意使用他们的信息,他们完全可以起诉对方,我也会提供帮助。这样,他们就能理解这个问题了。目前没有特别好的办法,每个人都有自己的权利,不容侵犯。


方昱春:尽管在公共场合,我们的部分隐私确实容易泄露,但从管理的角度来看,我们仍然需要建立完善的制度来进行伦理审查。

例如,针对手语识别项目,我们可以邀请专家和聋人代表共同制定符合道德伦理要求的规则。

在数据采集过程中,就像我和倪老师在制作数据集时所做的那样,我们需要向聋人透明地说明为何收集这些数据,以及我们将如何使用这些数据,并征得他们的同意。这本身就是一种保护措施。

在数据管理上,我们也应该制度化,尽量尊重并保护数据,防止泄露。尤其是在涉及商业运作时,我们需要特别注意,因为不当处理可能会让人感到被侵犯。如果能通过预防来保护隐私,那么从使用者的角度来看,他们会更加满意。

在部署手语识别系统时,我们应该避免收部署那些与个人相关的信息。对于这部分数据,我们可以进行加密,并在传输和存储过程中将安全性放在重要位置。我们需要仔细考虑哪些数据应该上传到云端,哪些不应该。

隐私保护也是我们领域的一个重要研究方向。我自己也在研究面部隐私保护技术,目前我们称之为“Face DeID”。早期DeID会对面部打马赛克或添加噪音作为保护方法,但这样就无法保留手语的语言学特征。现在,我们可以使用AIGC等技术,在保留手语语言学特征的同时,保护个人身份信息。

我认为我们的技术有可能实现一个较好的平衡:我们可以利用数据,但同时也能确保使用的数据是安全的。如果我们考虑全面,制度合理,在技术进步同时也捍卫伦理道德。


田英利:我认为各位老师的讨论非常精彩,特别是在手语识别方面,因为我们需要面部表情、手势以及身体动作的配合。所以,如果简单地对视频打马赛克或其他处理,其他人可能就无法使用这些数据了。正如方老师所提到的,信息保护在这一领域中极为重要。

我在IBM工作时,我们组参与过指纹识别项目。指纹是唯一的,一旦丢失,就无法再用于银行密码等。但我们的同事提出了一种可撤销的生物特征识别方法。这启发我思考,未来我们或许可以对手脸进行某种变换,既保留了对计算机视觉有用的信息,又不泄露个人的重要信息,这是一个值得探索的方向。

06 读者提问

1,用多模态大模型来做识别手语会不会更好?


田英利:关于使用多模态大型模型进行手语识别的问题,我的回答是肯定的。当然,采用多模态的方法肯定会带来更好的识别效果。目前,研究和开发的趋势正是朝着这个方向发展。因此,简单来说,使用多模态大型模型进行手语识别是一个明确且必要的前进方向。


2.有团队正在考虑如何建立一个类似于“手语-GPT”的基础模型,能兼容全球各地的手语。那么,手语语法和方言是难题吗?还是说,只要数据充足就能完成“暴力美学”?


方昱春:这个问题让我想起了我国著名的语言学家赵元任,他是一位能够在极短的时间内学会不同地方方言和多国语言的超级语言学家。

他掌握和使用语言的速度非常快,是人类智能的一个杰出代表。虽然这样的例子可能非常罕见,但如果我们的人类能够具备这样的能力,对多种方言和语言具有极高的适应性,那么我们也许能够让一个“手语GPT”模型也具备这种多方言的适配能力。

因为尽管语言千变万化,但每种语言都有其共性,不是完全无法互相学习的。因此,我认为这是一个值得探索的有益想法。


倪兰:语言学的终极目标是探索人类语言的普遍性原理。包括美国语言学家乔姆斯基在内,许多学者都在寻找方案,希望用一套规则来解释人类语言的共性,语言的核心在于形式如何表达意义,我们希望找到语言形式的共同规则,以及与意义的匹配方式。

比如,所有的语言都包含否定和疑问的表达,尽管表现形式各异;又比如每种语言中能够表达意义的语音数量是有限的。但我们尚未找到一套完美的规则来解释所有人类语言,这是因为我们对语言的理解还不够深入。

有时看国外的聋人电影或电视剧,我发现不同国家的手语之间存在一定的相似性。

例如,我们会看到日本手语与中国手语有很多相同的手势,这表明手语的前身——身势语——在人类中有着共通之处。如大多数人通过摇头表示否定,尽管也有的文化中使用仰头来表示否定。

我相信,手语之间的可懂度可能比有声语言高。

有研究表明,使用不同手语的人之间的可懂度,高于使用不同有声语言的人。周文罡教授也曾提到,他们使用美国手语、德国手语等其他国家的手语数据集来训练,这表明其中存在一些共通的元素。

我们目前对手语的语音分析都基于美国学者William .Stokoe对手语的手形、位置和运动的切分,以及后来加入的方向和表情体态分析。这些基本特征分析在每一种手语中都具有价值。因此,如果我们能够构建这样一个模型,并将这些特征导入手语的分析标注中,我们一定能发现许多人类语言共通的东西。


苏剑波:我的想法可能相对简单,但我认为这里有一个值得探讨的小方向。我们知道人类有多种不同的语言表达方式,包括口语、手语、肢体语言,以及各种方言等,这些都是非常个性化的表达形式。我在思考,是否有可能通过识别个体的脑波来取代对语言的感知和手语的识别?这是否是一个可行的方向?

因为脑波的感知更加个性化,这可能会为我们提供一个全新的交流方式。我提出这个问题,希望能与大家一起探讨这个可能性。


田英利:马斯克的Neuralink项目就在探索人脑与计算机接口的可能性。他们最近似乎也取得了一些进展,这可能是最直接的方式来实现人脑与机器的交流。

至于“手语GPT”,从技术角度看,如果我们能够获取全球范围内的大规模数据,我认为是有可能的。就像现在不同语言之间的翻译,曾经被认为是一项艰巨的任务,但现在ChatGPT可以轻松地在英文和中文之间切换,没有任何问题。

但从实施的角度来看,我认为还存在一些困难。毕竟,聋人群体相对较小,当需要大量的计算资源和技术支持时,是否有政府或产业愿意投入巨大的财力和数据来服务这样一个相对较小的受众群体?

他们需要考虑实际的投资回报,如果投入巨大但收益有限,甚至可能不赚钱,只有少数人受益,他们是否愿意这样做?

因此,我认为对于手语识别或帮助残障人群的项目,需要政府的政策支持和资助,以及不同产业的协助。但这些项目能盈利多少,我持保留态度。

此外,残障人士本身对高科技的接受程度可能有限,加之全球老龄化问题,一些老年人可能存在听力或视力损失。让他们使用电话或平板电脑可能更加困难。我们如何让这些弱势群体享受到科技的红利,需要政府的大力推广和支持,单靠个人力量是难以实现的。

不知不觉,我们已经讨论了两个小时,非常感谢大家的分享。由于时间关系,我们今天的论坛讨论就要告一段落了。非常感谢大家,感谢雷峰网为我们提供了这样一个交流思想、碰撞智慧的平台。

希望在未来的论坛中,能有更多有需求的人士加入我们的讨论。

也希望我们的技术能够在不久的将来,真正应用到他们的日常生活中。


本文作者吴彤,关注AI for Science,欢迎添加微信(icedaguniang),交流认知,互通有无。

]]>
医疗AI //m.drvow.com/category/healthai/Qwo8nbOfgRFJk70m.html#comments Tue, 26 Mar 2024 10:19:00 +0800
这个新的风口,与数亿老年人的健康需求有关 //m.drvow.com/category/healthai/rKPuGGBkbAHPeuyF.html 截至2023年底,全国60岁及以上人口已达2.9亿[1]。而据测算,到2035年左右,我国60岁及以上老年人口将突破4亿,在总人口中的占比将超过30%[2]。

如此庞大的老年群体,都有一个共同的突出需求——健康。

日前发布的2023年第四季度居民健康消费指数报告显示,老年人群的健康消费需求正在强劲释放。

居民健康消费指数是由健闻咨询和复旦大学健康传播研究所在华泰证券支持下合作研发编制,中国康复技术转化及发展促进会提供指导,旨在使用大数据衡量不同地区居民的健康消费习惯,从而为传播健康消费理念、倡导健康消费行为提供参考。

本期指数的测算,主要基于京东线上平台2023年第四季度覆盖全国300余个城市、涉及200余种商品的消费大数据。

结果显示,与老年人群密切相关的“三高”(高血压、高血脂、高血糖)、心血管疾病、康复护理等方面的产品和服务健康消费指数,在该季度都有明显提升。

指数报告发布会上,复旦大学健康传播研究所所长助理兼秘书长贾英男对报告进行解读时表示,提高老年群体的健康消费水平,将成为发展“银发经济”的重要内容。

何为银发经济?按照国务院办公厅2024年1月发布的《关于发展银发经济增进老年人福祉的意见》,银发经济是向老年人提供产品或服务,以及为老龄阶段做准备等一系列经济活动的总和。

据相关测算,目前我国银发经济规模在7万亿元左右,约占GDP总量的6%,到2035年,银发经济规模有望达到30万亿元,占到GDP总量的10%[3]。未来进入“长寿时代”后,银发经济在GDP中的占比还将进一步增加。银发经济的风口,也正强烈激发着产业与投资的想象力。

“任何经济都是人口经济”,在中国社会福利与养老服务协会会长吴玉韶看来,随着老龄化程度不断加深,发展银发经济,意味着相关产业都要针对老龄社会作出适应性调整,而健康是其中最关键的一环,“因为健康是老人的刚需”。

国家信息中心数字中国研究院副院长、脉策科技首席经济学家陈沁进一步指出,银发人群不仅具有健康需求,身体健康程度还决定了他们的“消费半径”,即能否产生更丰富多样的消费。比如,老人要外出旅游,产生文旅消费,至少要求身体状况能确保走出家门。换言之,老人的健康管理水平,将会间接影响到整个银发经济的规模和结构。

如何把握银发群体的健康需求?

直观地看,老年人的健康消费需求首先取决于自身健康状况。

国家卫健委2021年底的数据显示,我国大致有1.9亿老年人患有慢性病。另据国家疾控中心数据,我国16%的老人存在失能或部分失能症状,4.8%的老人处于完全失能状态。

此外,2018年中国居民骨质疏松症流行病学调查显示,我国50岁以上人群骨质疏松症患病率为19.2%,65岁以上人群骨质疏松症患病率达到32.0%。

一方面,带病或失能人群存在对疾病治疗、慢病管理、康复护理等产品和服务的需求;另一方面,相对健康的人群,也需要采取各种方式来预防疾病、延缓衰老和身体机能的退化。 

从居民健康消费指数报告也可以看出,在人口老龄化程度较高的城市,居民对于高血压、糖尿病、冠心病等疾病相关医疗产品与服务的健康消费指数也相对更高。

如果对老年人群进行更细致的划分,则可以得到不同层次的需求画像。

银发经济的内涵,包含“老年阶段的老龄经济”和“未老阶段的备老经济”[4]。AgeClub创始人段明杰认为,从熟龄到老龄到高龄,每个阶段的消费需求、消费特点以及获客渠道都不一样,消费的品类也不一样。站在产品服务提供者的角度,只有对人群定义足够精准,才能真正抓住用户的需求。

除了年龄,细分人群的维度还包括收入水平、文化程度等。收入水平决定了老人的消费能力,而文化程度则影响到消费理念和健康素养水平。一项针对老年人保健消费的调研显示,有37.8%的老年人将保健消费和疾病治疗混为一谈[5]。

而产品和服务购买主体的不同,也使得老年人的健康消费呈现出不同的特征。

根据居民健康消费指数报告,在人口流出地区,还存在“孝心经济”“感恩消费”等健康消费模式。这些地区的“三高”慢病管理、护理床等产品和服务健康消费指数较高,一个重要因素是外出工作的子女通过购买相关产品和服务,来满足留守老人的健康需求。报告指出,外出工作的子女在为父母购买血压、血糖等健康指标监测产品时,可能倾向于选择具有数据传输功能的产品,以便在异地也能随时了解老人的身体状况。 

“人口结构的变化会带来需求的变化,并且进一步带来整个消费场景和产业链的变化。”中国康复技术转化及发展促进会常务副秘书长杨涵分析,以康复辅具为例,首先需要根据老人身体健康状况来选择所需要的康复护理服务,不同的康复护理适用不同的辅具,而不同的辅具还需要进行相应的环境改造。比如,对于坐轮椅的老年人来说,推拉的房门就比平开门更为方便。

银发经济风口下,健康产业如何升级?

根据我国“90-7-3”的养老格局,有90%的老年人处于居家养老状态[6]。老年健康消费升级,关键是围绕居家养老场景开发产品和服务。

京东健康医疗器械事业部养老品类策略负责人关永皓观察到,当前养老用户的消费主要存在四大痛点:一是用户对市面上的产品缺乏了解,也就无从购买。“现在很多居家养老的专业产品,比如浴室的助浴椅、坐式淋浴器、智能穿戴设备等等,覆盖率仍然比较低。”二是商品供给不足,关永皓表示,以康复辅具为例,国内产品数量不到发达国家的5%。三是产品和服务的结合还不完善,相比年轻用户,银发人群与客服沟通难度更大,对售后上门服务的需求更加迫切,“这些痛点现在还没有解决。”四是专业人才供给不足,“导致服务供给跟不上”。

事实上,产品供给、科技创新、智慧养老、服务优化、人才培养等方面,在国务院办公厅《关于发展银发经济增进老年人福祉的意见》中都有充分的体现。

在杨涵看来,老年健康产业的发展,还需要通过政府、行业协会和产业领域的协同,形成一套严格的标准体系。“把真正靠谱的产品、服务机构、服务模式整合起来,老年人很多需求都是系统性的。”杨涵介绍,在日本的福祉用具产业,行业协会就从标准体系、产品认定、服务机构认定、人才认定等方面,制定了一整套流程。比如,每家福祉用具销售门店必须配备两名有相关专业资质的工作人员,为顾客提供专业细致的咨询服务,以便根据用户实际身体情况与需求,选择不同功能、形态和材质的产品。

支付意愿和能力,则是关系到老年群体健康消费升级和健康产业发展的另一个重要方面。“我们看到,接受养老机构服务的群体,都是以个人支付为主。”复星康养集团执行总裁李莹表示,老人自己的退休工资,和子女支付,是机构养老服务的两大主要费用来源,而在社区居家养老场景,护理产品和服务的C端自费比例和意愿相对较小。

李莹指出,投资经营养老产业的挑战在于投入大、周期长、回报慢,如果没有一个强有力的支付方,短期内产业发展挑战很大。近年来,随着长护险基金支付的逐步介入,有了资金支持,失能失智老年群体的护理服务才得到一定发展。

李莹观察到,近两三年,不仅头部保险公司,一些中小保司都开始关注和介入养老领域。不论是养老机构还是社区居家养老场景,在保险产品的撬动下,从生活照料到专业的医疗或康复护理,产品和服务供给都越来越多。

“未老阶段的备老经济”,是银发经济的另一个增长极。即将步入老年的人群,其健康程度,也将影响到未来银发经济的质量。

据陈沁分析,目前中国银发经济规模的快速增长,主要来自上世纪60年代生育高峰期出生的人口。“每年2000万以上的退休人群,是从量上推高了银发经济,但从人均消费水平看,60后和50后没有什么差别。”陈沁认为,70后的教育水平、收入水平都要高于60后,“做好70后在退休之前的健康管理,让他们的收入保持在一定水平之上,他们在进入老年阶段时,才会有更大的消费半径,我们才能够在未来迎来更高质量的银发经济。”

 [1] 中华人民共和国2023年国民经济和社会发展统计公报https://www.stats.gov.cn/sj/zxfb/202402/t20240228_1947915.html

[2] 我国预计2035年左右进入重度老龄化阶段 60岁及以上老年人口将突破4亿 http://health.people.com.cn/n1/2022/0920/c14739-32530182.html

[3] 我国首部“银发经济”政策文件出台 多个亮点勾勒出幸福晚年生活图景 https://news.cctv.com/2024/01/16/ARTIMoho2czYu4eJHpORj0I2240116.shtml

[4] 国家发改委:银发经济包含“老龄经济、备老经济”两个方面https://news.cctv.com/2024/01/22/ARTIFenQpSPCo58UnZoD7cxJ240122.shtml

[5] “健康老龄化”视角下老年人保健消费现状及其影响因素研究 https://mp.weixin.qq.com/s/jAZITXYIEGIhzdNQEjtwxQ

[6] 国家卫健委:我国养老呈“9073”格局 约90%老年人居家养老 http://m.news.cctv.com/2021/04/08/ARTIwcwUroEXDM4NPKGnmOuu210408.shtml

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/rKPuGGBkbAHPeuyF.html#comments Thu, 21 Mar 2024 10:51:00 +0800
深圳湾实验室周耀旗:填补AlphaFold 2缺口,开启所有蛋白质结构的高精度预测时代 //m.drvow.com/category/healthai/NctvhMVlK0dR4fnA.html 人类能否参透微观世界的奥秘?

如果把这个问题放在生命科学领域,直接指向就是遗传信息的最终生成物——蛋白质。

人类的体内有10万种以上的蛋白质,它们都是由20种氨基酸排列组合产生的。数十到数百的氨基酸集合成为拥有各种立体结构的蛋白质,这些蛋白质在它们的“坑洼”处和特定的物质相结合,而发挥其各种各样固有的机能。

这也就是说,只要拿到了每一种蛋白质的结构,就能得知它的功能。

那么更进一步地,人类想要在通过蛋白质结构辅助设计、新药分子设计,研制出可以带来领域变革的原创新药,就变的“十拿九稳”。

这并非随意而下的定论。以医药研发行业公认的“双十定律”来看,创新药从开始研发到上市最少需要10年,耗资最少10亿美元。但即使满足时间和金钱的双重成本,创新药研发成功的概率依然只有不足10%。

“这是一个蛋白质结构预测时代。”厘清生命科学的底层逻辑,在基础科学与临床药物之间搭起一座桥梁,是无数人的终生理想。

在蛋白质这一命题上,曾有全球科技巨头谷歌旗下的前沿人工智能企业DeepMind,将机器学习和系统神经科学的最先进技术结合起来,建立强大的通用学习算法,最抢眼的一大成果便是在蛋白质结构预测上的应用。

2020年底,其人工智能系统“AlphaFold 2”一战成名,将人工智能预测的蛋白质结构达到了实验测定的精确度。直到今年10月底,DeepMind对蛋白质结构的研究仍在继续,并对外剧透:AlphaFold 3即将推出,已用于药物设计。

具体细节可点击文章:「AlphaFold 3」要来了?DeepMind最新推出新一代蛋白质结构预测工具,已用于药物设计

除了工业界的这位常青选手外,不少学术派也置身其中。

不过,一个最新里程碑进展已经出现:人类可望实现对所有蛋白质结构进行高精度预测,弥补了AlphaFold 2对那些在天然蛋白质中难以找到同源序列的蛋白质无法进行高精度结构预测的不足。

这一成果来自深圳湾实验室周耀旗教授团队(汤金乐、张哲、詹剑、周耀旗),目前该论文成果已经上线预印本网站bioRxiv 。

链接:https://biorxiv.org/cgi/content/short/2023.11.22.568372v1

补上AlphaFold 2的一块缺口

众所周知,通过实验技术确定“高分辨率蛋白质结构”,既昂贵又耗费力。直到AlphaFold 2的出现,开启了一个基于深度学习的计算预测时代。

但,这一方法也仅适用于那些天然存在的、已有足够同源序列的蛋白质。

这是因为AlphaFold 2主要依赖于进化信息进行预测。它是通过端到端的深度学习、利用大数据和大模型,找到了多个同源序列与相应的“单一”结构之间的关系。

也就是说,AlphaFold2强烈依赖于多序列比对(MSA)中的进化和协同进化信息。对于找不到太多同源序列的蛋白质(例如抗体,孤儿蛋白,病毒蛋白,复合物等),AlphaFold 2预测的精确度就会大幅度下降。

数据显示,虽然估计AlphaFold 2可以覆盖大约98.5%的人类蛋白质组,但只有58%的残基可以被可靠地预测,而只有36%的残基可以被高置信度地预测。

拿抗体来说。抗体本身是针对新的抗原进行的快速突变,进化时间相对较短。它们是基于抗体库中挑选出来的,因此抗体的序列并不多样化,这导致过去AlphaFold 2难以准确预测其结构。

但这并非没有解法。

解决同源序列不足的蛋白质结构预测的两种方法是:

用新解析的基因组或宏基因组数据更新序列数据库,并提高同源搜索的灵敏度。这可能对某些蛋白质有效,但不能解决那些缺乏天然同源序列的蛋白质的问题。

另外一种方法是,通过学习数据库中的其他进化序列,使用隐含进化信息的蛋白质语言模型。

然而,这两种方法均无法对不同的蛋白质实现一致的、高精度的预测。

“如果天然同源序列不充分,是否可以采用人工生成的同源序列来改进结构预测?”

周耀旗教授作了一个形象比喻:既然上述蛋白质没有那么多兄弟姐妹,能否人为地制造多个,再用AlphaFold 2来预测结构。

但这一方法的难度在于:

其一,与大多数经过数十亿年进化的天然序列不同,人工生成的同源序列是在实验室进化的短时间内产生的,目前尚不清楚高度同源序列(>95%序列同一性),是否可以直接用于AlphaFold 2或相关的预测工具。

其二,大多数深度突变扫描实验都是通过功能筛选进行的。例如抗生素抗性蛋白、荧光蛋白和具有特异结合性能的蛋白。鉴于数千种蛋白质功能,不可能针对不同的功能开发不同的筛选技术,更不用说并不是所有的蛋白质功能都适合高通量研究。

因此,利用人工同源序列进行结构推断,将需要一种技术,它是基于结构稳定性来筛选结构上同源的序列。

原则上,这种技术可以适用于所有依赖稳定结构发挥功能的蛋白质,无论其功能类型如何。现有的监测蛋白质折叠稳定性的方法,主要依赖于蛋白酶诱导的蛋白质水解或蛋白质片段互补实验。

然而,每种技术都有其局限性,如筛选能力或靶蛋白的大小限制。更重要的是,这些技术并不是为预测蛋白质结构而设计或测试的。

针对上述问题,周耀旗教授介绍,“我们发现,采用人工生成的、基于结构稳定性筛选的、并通过高通量测序所获得的同源序列,作为AlphaFold2的输入,可以实现蛋白质结构的高精度预测。”

周耀旗教授

实验结果表明:

•仅一轮带有少量突变的大规模筛选,就足以实现结构的高精度预测。

•对于实验的5个蛋白质中的4个,只进行了一轮深度突变序列的筛选,就足以使预测结构的准确度达到小于2Å RMSD。其中3个蛋白质的表现甚至优于使用天然同源序列的AlphaFold2。

•唯一一个预测结构RMSD大于2Å(2.92Å)的蛋白质,有一个完全暴露在表面上的β发夹,在非结晶条件下可能是可以灵活变动的构象。

值得注意的是,该研究通过将简单的分子生物学实验(深度突变扫描加体内或体外筛选)与高通量测序相结合,显著降低蛋白质结构测定的成本,并提高周转效率。

也就是说,这种具有成本效益的技术可以在任何分子生物学实验室进行,而不需要昂贵的设备。相比用实验方法解析这些结构,如X射线衍射或冷冻电镜等,费用要低至少一个量级,而且该方法实验操作简单,后续有望改写蛋白质结构的研究范式。

此外,这一技术可以进一步扩展到预测蛋白质复合物,以及具有翻译后修饰的蛋白质的结构。

据悉,这一方法命名为“Sibs-Seq”,兄弟姐妹的测序。

目前该论文成果已经上线预印本网站 bioRxiv,标题为《Effective High-Accuracy Prediction of Protein Structures from Easily Obtainable Artificial Homologous Sequences by Structure-Stability-Based Selection》(基于结构稳定性的筛选,从容易获得的人工同源序列中高效高精度地预测蛋白质结构)。

回到新药研制的社会话题上,该方法也将有极大的应用价值。

通过预测蛋白质的结构和变化,可以更好地了解蛋白质与药物相互作用的机制、抗体与抗原相互作用机制,从而设计出更有效的药物。

此外,该方法还可以应用于合成生物学领域。通过预测蛋白质的结构和变化,可以更好地了解合成生物学中的生物系统如何响应外部刺激,从而优化生物系统的设计和性能。

“低突变无用论”成为过去

“在我们的工作过程中有一大惊喜,反而成为了这一研究的重要转折点。”

周教授意思是指,利用AlphaFold 2进行蛋白结构预测时,如何处理自然进化和人为变异的差异方面,已经有了一些新发现。

由于自然进化需要几千万年甚至几亿年的时间,这个过程中许多氨基酸发生了变化,且氨基酸变化的范围广泛且变化量大。因此,许多人在处理进化信息时会排除相似同源的信息,认为这些信息量太少没有用处。

周耀旗团队虽然认为人工低突变同源序列很有用,可以从中萃取出比较准确氨基酸接触图,并在RNA上证明了这一点,但AlphaFold 2是用高突变的同源序列来训练的,可能需要人工进行多轮进化的多突变序列,才能到达一定的效果。他们没想到,即使只改变一个或两个氨基酸,只要有足够的数量就可以使用AlphaFold 2来预测蛋白质结构,达原子精度。

他们这次实验一共做了的5个蛋白质,里面有3个,利用获得的人工同源序列,预测的蛋白质结构比用天然同源序列还要精确,这是一个意外的发现。这表明,尽管天然同源序列对许多蛋白质可以通过搜索获取,但人工同源序列有它的优势。

周教授认为:

首先,突变少,意味着对结构的影响小,完全相同结构的可能性远远超过天然同源序列,因此大量少突变的人工同源序列比少量多突变的天然同源序列应该对结构预测更有用。其次,不像天然同源序列,人工同源序列的数量是可控的,如果覆盖率不够高,可以再做几轮实验来达到目标。

其次,自然进化的序列还受功能以及其它与折叠不完全相关的因素决定,也包含着测序、比对可能错误等过程带来的噪音,而人工同源序列则信噪比好很多。

最后,该方法不同于利用功能筛选的方案,比如抗性基因的功能,利用结构的稳定性来筛选,保证了方法的普适性以及突变序列与原来序列结构的一致性。

据周耀旗介绍,这一方法包括深度突变、稳定性筛选、高通量测序和结构预测等四大关键步骤。

1,深度突变:对基因进行深度突变。这意味着对基因的整个序列进行随机突变,以单突变和双突变为主,涵盖了所有的位置,突变种类至少10^ 6次方以上。

2,稳定性筛选:突变后的>10^ 6的基因库会被装入一个设计成能够进行稳定性筛选的质粒,并电转到大肠杆菌里,其中突变后的蛋白质结构稳定性高的基因变体,它会把鼠源二氢叶酸还原酶两个片段拉在一起,形成有功能的结构,导致甲氧苄啶耐药性,大肠杆菌能够在甲氧苄啶存在的条件下生存,繁殖,和扩增,导致稳定性高的基因变体被富集。反之,对于那些突变后的蛋白质结构不稳定的基因变体,大肠杆菌没有甲氧苄啶耐药性,从而这些变体会减少或者消失。

3,高通量测序:在经过一段时间(如12-36小时)的培养后,稳定性高的蛋白质会生长得更快,这样其序列数目就会更多。通过高通量测序可以测量出很多序列,其中有些序列的数量特别多,有些则非常少,还有的序列已经消失。

4,预测结构:通过比较不同突变体的富集度,可以估算其稳定性。然后把结构稳定的蛋白变体作为同源序列放到AlphaFold 2进行结构预测。这个预测结构的过程就是该方法的最后一步。

回国以来的里程碑工作

2021年3月,周耀旗结束了长达36年国外留学及教学生涯,加入深圳湾实验室,担任系统与物理生物学研究所副所长。

现阶段主要工作是蛋白质和RNA结构的预测、功能蛋白质设计、以及开发和应用蛋白质和RNA新语言模型。

在RNA结构预测上,周耀旗团队成功地开发了目前最大的核酸序列数据库MARS,大大改进了通过RNAcmap进行优质同源序列的搜索,并由此发展了RNA同源序列比对语言模型RNA-MSM,可以更加准确地预测RNA的二级结构和三级结构稳定的碱基对。

此外,团队也发展了一个基于接触图神经网络的蛋白质设计模型SPIN-CGNN,比目前的方法在多个计算指标上有不少的进步。

而此次所有蛋白质结构的高精度预测工作,也是周耀旗这两年来研究工作的一大里程碑。

“这是我回国后比较满意的一个工作。”周耀旗表示。

同时他也指出,“在AlphaFold出现之前,靠测序来解析结构这个念头就有了。我2006年之后在美国印第安纳大学开始做这个项目,在澳洲与詹剑、张哲、熊鹏等合作利用RNA证明了低突变的同源序列具有高质量的结构信息,如今在汤金乐加入团队后总算证明了人工同源序列的独特优势。”

该文以汤金乐,张哲为共同一作,詹剑和周耀旗为共同通信作者发在预印本网站 bioRxiv。先发预印本,周教授期望能够得到更多的同行们的建议和指正。

詹剑,于2004年、2010年获得中科大学士和博士学位。2010-2013年在美国印第安纳大学与普渡大学印第安纳波里斯联合分校作为博士后,2013-2021年在澳大利亚格里菲斯大学糖组学研究所做研究员,现在是深圳湾实验室研究员,最近作为创始人建立了砺博生物,从事靶向RNA的小分子药开发。

汤金乐,于2016年获得苏州大学的博士,2016-2021年在北京大学深圳研究生院化学生物学与生物技术学院做博士后和助理研究员,2021年起加入周耀旗课题组担任助理研究员。

张哲,2013年本科毕业于中科大生物技术专业,2021年通过GU-CAS联合培养博士项目,获得澳大利亚格里菲斯大学哲学博士学位,后续跟随周耀旗回国加入深圳湾实验室,今年6月起留任周耀旗课题组担任助理研究员,主要研究方向为RNA相关的结构生物信息学。

詹剑、汤金乐、张哲

值得注意的是,回国以来,周耀旗教授也开始做一些比较偏应用和转化方向的工作。

2022年9月,他联手詹剑、方超,利用三人分别在计算、生物和化学领域的专长,共同创立了砺博生物(Ribopeutic),从事靶向RNA的小分子药物的开发。目前基于人工智能、干湿闭环的RNA靶标发现平台,砺博生物已发现多个选择性高、活性好,靶向 RNA 的小分子,在癌症、罕见病和病毒性感染等领域布局。

据周耀旗介绍,他们正在进行另一个与RNA相关的工作,并预计很快就可以投稿。

“在RNA结构预测上,我们希望能够在RNA结构数量少的情况下,建立可以泛化的、有较高精度的预测模型。为产业界,特别是我们砺博生物的靶向RNA的小分子药物研发引入AI4S的前沿进展,并提供一系列基于基础科学研究的源头创新。”


|深圳湾实验室周耀旗课题组,博士后招聘中

周耀旗教授,于2021年3月起作为资深研究员全职加入了深圳湾实验室。

他于1984年获中国科技大学学士学位,于1990年获美国纽约州立石溪大学博士学位。

曾在北卡州立大学、哈佛大学进行博士后研究,师从诺奖得主Martin Karplus教授。相继在纽约州立布法罗大学担任助理教授、终身副教授,在印第安纳大学任终身正教授,在澳大利亚格里菲斯大学任正教授。主要从事蛋白质/RNA的序列、结构与功能和表型关系方面的基础研究,以及生物分子检测、药物开发方面的应用研究。

周耀旗课题组主要围绕着RNA和蛋白质的序列、结构及功能之间的关系,以及生物高分子的应用开发等几方面进行科学研究。

课题组研究的特色是结构生物信息计算和现代高通量、自动进化生物技术相结合来实现对序列、结构及功能之间关系的深刻理解,从而达到生物高分子在多方面应用的这个目标,其中包括精准医疗服务的针对性药物设计和个性化生物标志物的检测。

课题组主页:http://zhouyq-lab.szbl.ac.cn/

有意向者请发送至邮箱:zhouyq@szbl.ac.cn


本文作者吴彤,长期关注医疗科技方向,欢迎添加微信互通有无:icedaguniang 雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/NctvhMVlK0dR4fnA.html#comments Mon, 04 Dec 2023 11:11:00 +0800
达摩院迎战「癌王」 //m.drvow.com/category/healthai/47g0E0X1dLSmTkJP.html 癌症早筛,普遍被认为是一个潜在的千亿级产业。

但胰腺癌,却是例外。

从商业角度看,这是一个长期“被否定”的选项。因为比起肺癌、结直肠癌、胃癌、肝癌等,胰腺癌并不属于高发性癌种,但擅长伪装、先天耐药、手术切除率只有两到三成。最致命、最难发现、扩散最快,“癌王”,成了胰腺癌的公认的代号。

要蹚胰腺癌这条路子,基本上可以预判:钱少事难,要么情怀,要么诈骗。

这也正是矛盾所在。在临床医生看来,胰腺癌作为癌王是“悲哀”的。无论是国内还是国外的临床指南,都不推荐胰腺肿瘤筛查,因为迄今为止,没有一种方法适合所有人,而且保证筛查结果可靠。

因此,超过80%确诊患者,一经发现即晚期,存活率在1年左右。但是根据美国约翰霍普金斯医院最近发表的重要临床工作,早期或者偶然发现的胰腺癌患者的生存率可以很高,比如9.8年。

胰腺癌是一次有组织的、秘密的人类攻击,从癌前病变进展到癌症1期2期可能10年,但是越到最后是突然间指数级增长。也就是说,上帝并没有宣判死刑,但几乎没有人会逃过诅咒。

五年前,一项最有望扭转这一困境的技术,CancerSEEK(基于ctDNA的检测方法),由全球癌症遗传学大牛Bert Vogelstein教授和团队提出,成果发表于Science期刊,曾一度解决了包含胰腺癌在内的多癌筛查问题,覆盖了大部分致命癌症,引发全美投资热潮以十亿美元计数。

时至今日,这一技术离转化为产品还遥遥无期,致命弱点就在于这一技术并不通用。

如果这场声势浩大且令人耳目一新的技术让人有过短暂的着迷,那么它真正的价值在于激起人类的挑战欲望。

阿里达摩院便是其中之一。

面对多癌筛查这一宏大且迷人的命题,达摩院毅然选择了另一条看似更易、实则更难的路径——AI。

迎战癌症之王

故事的开始,源于2018年的一次不幸。

来自上海市胰腺疾病研究所的曹凯医生,在某三甲医院临床轮转的时候,其导师A教授后来不幸确诊胰腺癌,发现时已是晚期,最终因医治无效在2018年逝世。

痛惜之余,曹医生在翻看A教授的病历数据时发现,其在确诊胰腺癌的十个月前曾在医院体检时拍过一次胸部平扫CT,仔细察看,胰腺部分有一丝病变痕迹。

这让曹医生萌生一种大胆的想法:假若所有胰腺癌患者都能在确诊前的十个月甚至更早,通过体检提前发现癌症病灶,并进行根治性的手术切除,将获得更好的生存质量。

Bert Vogelstein教授也持有类似的观点,任何一个穷凶极恶的晚期肿瘤也都是从癌前病变到1期2期一步一步进化而来。

这件事的难度相当于重新开辟一块“新大陆”。

由于平扫CT图像的对比度极低,多用于肺炎、肺结节等日常疾病诊断,医生也没有在平扫CT上受过癌症诊断的训练经验。而当年AlphaFold的面世,让曹医生意识到,通过引入人工智能的能力,是有可能识别CT上那些肉眼难以察觉的病灶信息,从而攻破胰腺癌的早筛难题,这也成为他此后的临床科研重点。

此去经年,曹医生一直在寻找合适的技术合作方。直至几年前,他与达摩院接触,发现这个研究部门很不一样,既有充足的AI技术储备,同时也有着丰富的临床实践经验。

达摩院医疗AI团队长期注重以技术解决临床的真实需求,与一线医生保持紧密的科研联动,了解到曹医生的科研方向与其导师的故事,也敏锐注意到,假如AI能把最难识别的胰腺癌都搞定,这将极大推动这一领域的前进。

双方一拍即合,随即联同全球10多家顶尖机构发起研究课题,正式向“平扫CT+AI”的大规模胰腺癌早期筛查发起挑战。

其中包括:上海市胰腺疾病研究所、浙江大学医学院附属第一医院、中国医科大学附属盛京医院、复旦大学附属肿瘤医院、上海交通大学医学院附属新华医院、约翰霍普金斯大学、布拉格查理大学第一附属医院、哈佛大学等。

这显然是一支堪称豪华的研究团队。这种阵容的组合搭配,或许才是人类与“癌症之王”在这场旷日持久的斗争中胜出的底气所在。

11月21日,Nature Medicine正式刊发这项研究成果,一个名为“PANDA”(PAncreatic cancer Detection with AI)的胰腺癌早筛模型正式亮相。

PANDA的发布意义在于,证实了在平扫CT上使用AI进行胰腺癌筛查的可行性、而且是中国放射影像领域的科研成果首次刊登Nature Medicine。

论文题目:基于非增强CT和深度学习的大规模胰腺癌检测

达摩院是怎么做胰腺癌早筛的?普通人什么时候能用上?以及一个直击灵魂的拷问:这真的不是企业AI研究院做着玩?

论文成果一出,围绕着AI能否用于胰腺癌筛查的争论也刚刚开始。

近日雷峰网对话达摩院医疗AI团队负责人、IEEE Fellow吕乐,他回复到:Nature Medicine在审稿时也是这样的疑问。首先要看你的training code,然后还要三位资深审稿人独立审稿,其中有一位美国医生在审稿里面问了我们58个问题,说明他这个大临床专科医生(从他提出的的问题的专业性,广度和深入程度上看,肯定是胰腺癌这方面的大专家)多多少少是有点不太相信的。

“因为我们的最大创新之处在于,首次证实了在平扫CT上使用AI进行胰腺癌筛查的可行性,并达到了之前认为可能达不到的高性能。”

直白点说,要把“大规模胰腺癌早筛”这个问题拆解开,最终会发现,这不仅是个技术问题,也是一个是经济问题。

对于任何一个关乎临床的服务,大规模临床数据是技术的最有力背书,再进一步转化为产品,则需要配合现有医疗条件降低落地成本。

有着临床医学背景,曾在美国爱荷华大学和国立卫生研究院(NIH)临床中心从事疾病和人工智能研究的张灵,是达摩院本次胰腺癌早筛工作的项目负责人。

他补充到:“在我们之前,大家不知道平扫CT可以用来检查癌症。过去对肿瘤的检测和诊断,主要使用增强CT,需要给病人注射或者口服造影剂,并不适合大规模筛查使用。”

相比较而言,平扫CT普遍被百姓所接受,在体检和门诊等场景中更为常见,不增加额外费用、检查、辐射等。因此,“让AI配合影像,而非影像配合AI”,成为达摩院最先确立的准则。

吕乐、张灵

在实际应用中,敏感性(即不易漏诊)和特异性(即不易误诊)是评价医学影像类AI筛查工具的两大标准,但往往需要在一定程度上进行权衡。提高敏感性可能会增加误诊的风险,而提高特异性可能会增加漏诊的风险。

这里分享一组真实的数据和案例:

在历时一年多的开发与验证中,通过对在20530名真实世界连续病例的多场景验证,达摩院训练的这款胰腺癌早筛工具达到了92.9%的敏感性、99.9%的特异性,发现了31例临床漏诊病变,有2例早期胰腺癌病患已完成手术治愈。

其中1例是患者每年都会定期去某三甲医院体检中心进行体检,并安排胸部CT检查,在今年的体检并没有发现任何异常。在其体检后的第7个月,该患者的CT图像数据被纳入到该研究的回顾性临床验证,被检出“有95%概率患有胰腺神经内分泌肿瘤(PNET)”。

在经过多学科会诊后,院方决定召回患者进行磁共振增强检查并成功手术,后续结合术后病理报告,这名患者最终确认为属于早期PNET(G1级别,1.5cm)。接下来半年的随访显示,这位患者的肿瘤并没有复发或转移。

这是实实在在的早发现、早治疗的临床案例。吕乐表示,“癌症如果治疗得当,在指数生长之前抓住它,这个人就有治了,就是会很好治。在美国,一半的医疗费用是患者死前的三个礼拜花掉的。”

这项研究已在阿里云上开放API调用接口,以便医生体验和使用。目前已在医院、体检等场景被调用超过50万次,本地化部署的模型每次检测耗时约40秒,每检测1000次只出现一次假阳性,随着迭代未来还有提升空间。

怎么定义一款好用的AI?

针对这次的研究成果,Nature Medicine罕见地刊发评论文章,称“基于医疗影像AI的癌症筛查即将进入黄金时代”。

论文共同一作、上海市胰腺疾病研究所的曹凯医生认为,“PANDA将拓宽业内对胰腺癌筛查的认知边界,推动临床治疗的发展。”

另一位共同一作、复旦大学附属肿瘤医院放射诊断科的汤伟医生表示,“PANDA提出了一种有潜力的大规模胰腺癌筛查方法,在提升检出率的同时,又不会给病人带来额外的辐射与经济负担。”

上述观点,反映了当下临床医学的一大趋势:在医疗数据与人工智能的交织碰撞下,医生面对各种疾病时的治疗思路和就诊流程都会发生直接变化。

张灵提到,医生是否愿意使用一个AI工具,评价标准非常直观:临床价值、产品力。

前者是指,这个AI产品真正创造了不可或缺的临床价值,给病人解决了性命攸关的生存问题。所以“做什么”是非常关键的;

后者是指,好用、易用,比如一个医学影像的AI工具需要同时保证特异性、敏感性、精度等,还要与临床流程打通集成,无需切换工作流。所以“怎么做”也非常关键的。

这一观点也得到了吕乐的认同,他举了一个用“普通X光+AI”来检测骨质疏松的例子。

通常来说,骨质疏松的诊断需要借助“双能X光”进行骨密度检测。理想状况下,中国每百万人得配12个双能X光机,但是现在中国每百万人仅有0.2个。这时候用“普通X光+AI诊断”,反而是一种更具普及性的选项。

“好的X光图像通常具有3000*4000的分辨率和12位色深,但现在电脑屏幕的分辨率通常是1920x1080和8位色深,这为医生带来了细节上的困扰,需要调整参数以获得准确诊断。”

相比之下,AI的优点在于,能够更准确地处理和分析图像中的像素,而且并不需要额外的成本,因为病人的数据已经在医院的数据库中。AI可以快速处理数据,找到那些需要特定接受进一步骨质疏松筛查的病人。

进一步来说,临床无小事,评估一款医疗AI产品的好坏,不能过于追求技术上的所谓先进性,因为很多时候“高级”和“好用”并不等价。

就拿骨质疏松的模型来说,很多内分泌科医生对AI的理解很深,相信AI来检测骨密度会做得很好,所以寄希望于AI在这个子任务(Narrow Task)上取得超人的效果,而不是像LLM那样可以做许多其他任务的“通用模型”。

作为真正的AI用户--医生感知很重要,直接决定了医院愿不愿意为工具付费。因为绝大多数医生不会关心企业采用的究竟是什么模型和算法,他们只关注你最终交付的是什么样的成品。

回到本次胰腺癌的主题上,显然单纯的公开数据集无法训练出一款好用的AI模型,前提还得是真实的患者数据、专业医生数据标注、以及到医院场景里亲自跑上几遍。

张灵介绍了PANDA模型的训练策略,着重指出三点:

1、依托多家合作的三甲医院,我们构建了迄今最大的胰腺肿瘤CT多中心数据集,其中训练集3000例,但这样的规模对深度学习不算大,设计怎样的算法能最大化精度且保证良好的泛化性?我们尝试过目标检测、语义分割、图像分类、影像组学结合机器学习、联合分割分类等技术路线,最终是级联的联合深度分割分类模型最佳。

2、训练AI筛查模型需要医生手工标注大量肿瘤,而平扫CT图像对比度极低,医生几乎无法标注,我们请医生先在增强CT上勾画,创新性地采用适用于腹部CT图像配准的算法,把增强CT上的勾画迁移到平扫CT上,并以病理金标准确认的肿瘤类型为标签监督模型的学习,从而使PANDA能突破人类医生在平扫CT上检测诊断胰腺癌的天花板。

3、为验证PANDA的临床表现,我们将模型部署至合作医院的IT基础设施与工作流中,进行了2轮大规模的在真实世界多场景(体检、门诊、急诊、住院)连续病人群体的回顾性临床试验。最终达成99.9%特异性,即每1000例测试出现1次假阳性。换句话说,这千分之一的“不完美”就交给医生了。

实践证明,在PANDA检测出胰腺癌的病人中,56%-74%的病人是真胰腺癌,其余的是医生比较容易排除掉的病变(脂肪浸润,胃肠内容物等)。

达摩院工程师进入合作医院,实地调试部署PANDA

可以看出,与过往的医疗影像AI工具相比,达摩院在打造这款胰腺癌早筛的专用工具时,“数据价值”被不断放大。

吕乐表达了一个观点:为什么OpenAI很强大,发挥出LLM的智慧,因为模型性能最终取决于数据的质量和数量。如果数据比OpenAI的差得很远,一定很难在性能上超越它,因为所有模型本质是一个统计模型。有时候算法改进带来的性能提升,远比不上高质量数据带来的效果更明显。

随后他开玩笑地提到,这或许可以概括为“data curation AI”。尤其是医学领域,大家应该踏踏实实地与临床工作相结合,认识到这是未来发展的趋势。

一个强大、好用且贴合临床实际需求的AI工具,正逐步成型。

吕乐表示,“这次胰腺癌的成果只是达摩院医疗AI多癌筛查的众多研究之一,下一步是推动实现‘8+5’平扫CT一扫多查,覆盖13种致命癌症、慢性病,最终目标是用一个平扫CT检查,通过AI就能够帮病人解决多种疾病的智能筛查、辅助诊断与定量分析。”

Why Me?Why DAMO?

“为什么这件事一定是达摩院来做?”

达摩院本身的定位不是事业部,也不是传统的AI中台,它既摆脱了这两种类型的俗套,又借鉴了它们,因此成为一种奇特的存在,以解决社会问题为导向。

“21世纪的公司,只有解决社会问题才能活下来,不解决问题活不下来的。”2017年达摩院成立初期,马云称。

达摩院重点投入AI for Science,布局医疗、农业、电力等领域,聚焦中长期的科学技术研究以解决社会问题。2020年新冠疫情初期,达摩院紧急研发出“CT影像新冠肺炎AI辅助诊断系统”,曾让阿里达摩院医疗AI团队一战成名,被科技部评为科技抗疫先进集体。

多年下来,达摩院积累了丰富的计算机视觉、深度学习等AI技术,并与医学界、工业界保持紧密合作,将大量前沿技术转化用于临床实践。

总体来说,达摩院都是用“AI来解决那些尚未得到解决、而病人又真切需要的临床需求。”2021年8月起,吕乐担任阿里达摩院医疗AI团队负责人,便定下这条医疗技术第一性原则。

在加入达摩院之前,吕乐已是业界富有盛名的医学影像科学家;加入达摩院后,基于医学影像的癌症筛查和研究进展频出。

2022年10月,达摩院初步验证AI与平扫CT结合的技术可行,有望在体检中查早期食管癌,敏感性特异性超过专家医生水平,相关论文发表在MICCAI 2022。同月,基于深度学习对头颈癌症42个危及器官进行高效精准自动勾划,可有效减少放射治疗的并发症,相关论文登上国际医学期刊Nature Communications。

2023年6月,聚焦于视觉领域著名的OOD(分布外检测)难题,提出了全新的医学图像语义分割框架,能够让AI更准确地识别肿瘤中的疑难罕见案例,目前已在胰腺肿瘤和肝脏肿瘤上获得验证,被计算机视觉国际顶会CVPR 2023评为Highlight论文。同月,基于增强CT的胰腺肿瘤鉴别诊断,发表在医学图像处理顶会IPMI 2023。

2023年8月,发布多癌影像分析通用模型CancerUniT,借助增强CT,可辅助诊断八种主流癌症,该模型的论文成果已被计算机视觉顶会ICCV 2023收录。同月,发布第一个可以分割全身143个器官的连续深度学习框架,该模型的论文成果已被计算机视觉顶会ICCV2023接受。

不久后,达摩院免费开放100件AI专利许可,其中有3件是专门针对癌症的精准治疗,和解决关键的医疗图像配准问题(后来在10月份MICCAI 2023 Learn2Reg竞赛上,达摩院相关医疗图像配准技术以比较明显的优势,获得所有两个赛道的冠军)。

2023年10月,基于CT图像的肝脏肿瘤筛查与诊断、胃癌筛查、肺结节自动检测及良恶性鉴别、胰腺癌预后等几项工作也在MICCAI 2023发表。

2023年11月,达摩院联合全球10多家顶尖研究机构首次提出以“平扫CT+AI”进行大规模的胰腺癌早期筛查,发布胰腺癌早期检测模型PANDA,相关论文成果登上了国际医学顶刊Nature Medicine。

这些标志性成果将达摩院医疗AI与精准医疗紧密联系在一起,也是AI for Science的生动范例。

在吕乐的设想中,未来AI不仅可以辅助医生进行肺结节、癌症等脏器疾病筛查,同时进行心脏病CVD事件十年定量风险打分,腰椎、盆骨的骨骼疾病筛查,从而实现多个检查的同时进行。

“从脖子到骨盆的躯干位置,都可以通过平扫CT+AI输出多个筛查报告,医生结合专业判断再给出最终的诊断总结。”

吕乐表示,云端部署将是医疗AI最好的服务形态,所见即所得,省去很多繁琐的步骤,模型能够实现快速的迭代、部署和应用,为更多病人提供帮助。

“我们不少模型已在阿里云上开放API调用接口,以便我们的合作伙伴,医生与医疗机构使用,最近每天为大概8万人次的病人提供智能化医疗服务。”

透过医疗AI,达摩院找到了前沿技术跟社会问题完美契合的平衡。至于要回应马云“它要活得比阿里更久”的期许,达摩院显然已经走上了正轨。 

本文作者吴彤长期关注医疗科技领域,欢迎添加微信互通有无:icedaguniang。

雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/47g0E0X1dLSmTkJP.html#comments Wed, 22 Nov 2023 15:26:00 +0800
健康管理场景向医院外延伸,居家健康消费业态如何构建? //m.drvow.com/category/healthai/sc4PvhASBOmxkLiH.html 11月15日,“2023居民健康消费指数与产业投资发展研讨会”在北京举办,2023年第二三季度居民健康消费指数报告在会上正式发布。 

“中国有很大的消费升级空间,就立足长期提升国民素质来说,健康消费升级就是我们希望倡导的一块。如果能将现有的医疗费用在人生的长周期中合理平摊,我们就能用相同、甚至较少的投入获得更好的生活品质。” 国家发展和改革委员会经济研究所副所长吴萨在演讲中说道。

居民健康消费指数是在中国康复技术转化及发展促进会指导下,健闻咨询和复旦大学健康传播研究所在华泰证券支持下合作研发编制,旨在使用消费大数据衡量不同地区居民的健康消费习惯。自2022年3月首次发布以来,指数按季度更新。

该指数在编制过程中,获得了京东消费及产业发展研究院提供的脱敏消费数据支持。本期报告基于京东线上平台2023年二三季度覆盖全国300余个城市的消费大数据,来测算各地居民健康消费指数,从而观测地区间的消费行为差异。 

本指数测算指标体系将居民与健康相关的消费分为健康生活方式、主动健康管理、疾病控制与管理三大维度,目前囊括70种商品品类,共涉及200余种具体产品。其中,胎心监测、失能护理、血氧监测、高血压、糖尿病、冠心病等覆盖全生命周期的健康管理产品及服务的消费趋势,在本期指数报告中备受关注。该类产品/服务最大的共性,是可以居家便捷使用,这也意味着健康管理场景从医疗机构向家庭延伸。

中国康复技术转化及发展促进会常务副秘书长杨涵指出,健康管理是一个系统性工程,场景不只局限于在医院接受疾病治疗。融入日常生活场景的健康消费需求,正在带来大健康产品和服务的新变化,需求侧和供给侧的联动,也将给产业形态和结构带来系统性改变。

华泰证券战略发展部总经理孙颖表示:“华泰证券作为中国证券行业头部机构,持续以金融力量助力大健康产业发展,在生物制药、医疗器械、医疗服务等领域形成了完整的业务布局。公司支持编制居民健康消费指数,也是希望能全面、及时洞察居民健康行为的变化,为全民健康素养的提高、相关产业的良性发展提供参考,助力健康中国建设。”

居家健康消费,各地有何差异? 

在指数最新报告解读环节中,复旦大学健康传播研究所所长助理兼秘书长贾英男介绍,为测算出更客观的居民健康消费指数,相关指标体系不断升级迭代。本期指数评价体系在此前基础上进一步完善,一是在主动健康管理和疾病预防管理维度,关注个体在“家庭场景”中预防疾病、管理健康的关键过程;二是最新遴选出的评价指标,如胎心仪、血糖仪、血氧仪、护理床以及高血压、糖尿病、冠心病等医疗健康服务和产品的消费,充分考虑到当前各年龄段常见的疾病风险因素,覆盖从胎儿到老年的全生命周期,使评价指标更加全面。

从测算结果来看,各类健康管理和疾病干预相关的产品与服务消费呈现出明显的地域差异。

以胎心监测为例,通过家庭自备胎心仪,孕妇可以居家监测宫内胎儿是否有异常,以便及时作出相应处理。本报告周期内,陕西、甘肃、河北、河南、贵州、宁夏、青海、广西等地胎心仪健康消费指数排名前列,与当前出生率排名靠前的地区大体一致。据统计,贵州、青海2022年人口出生率均超过10‰。

 在慢病管理方面,本报告周期内,血糖仪健康消费指数排名靠前的省份,均在北方地区。整体来看,该项指数排名与各省糖尿病患病率分布大致吻合。根据2019年新华社中国经济信息社与美年大健康联合发布的“体检大数据糖尿病地图”, 糖尿病与肥胖高度正相关,全国体检人群糖尿病检出率分布上呈现“北高南低、男高女低、老高少低、冬高夏低”的特征。高纬度地区糖尿病检出率偏高。内蒙古自治区和河北省的检出率位居全国前两位,均超过15%,这两个地区肥胖检出率同样位居全国前两位。 

报告指出,随着便携式、智能化血糖仪产品供应量增加,居民家用血糖仪消费需求也在不断释放,在糖尿病高发地区尤为明显。

此外,在高血压、冠心病等疾病医疗服务与产品方面,健康消费指数排名靠前的也多为北方地区。报告显示,二季度高血压相关服务健康消费指数排名前五的省份是黑龙江、吉林、辽宁、内蒙古、河北;三季度排名前五的地区与二季度完全相同。二季度冠心病健康消费指数排名前五的是贵州、安徽、江苏、上海、北京;三季度排名前五位的是黑龙江、吉林、辽宁、内蒙古、河北。2023年9月第20届中国心脏大会公布的数据显示,我国部分地区冠心病死亡率下降,但心血管疾病发病率仍呈上升趋势。三季度冠心病健康消费指数有所下降,但局部地区仍在上升,东北地区排名靠前。 

在康复护理方面,本报告将护理床作为代表性消费品。本报告周期内,黑龙江、江西、河北、安徽、山西、福建、西藏等地护理床健康消费指数排名靠前。报告指出,目前我国失能、半失能老年人约有4000万,老年痴呆患者约有1500万。康复护理器具可以减轻患者家属及护理人员的劳动强度,满足被护理人员生活自理的需求。由于各地人口老龄化程度不同,局部地区的康复护理消费市场仍有拓展空间。

值得一提的是,居家健康管理的需求还与人口流动状况紧密相关。在人口流出地区,各类健康产品消费指数排名相对靠前。报告分析,这些地区外出工作的年轻人出于孝心,会选择购买各类健康产品来帮助父母长辈进行健康管理,以便及时了解老人的健康状况,有针对性地做出治疗决策。

家庭场景下,如何细分健康管理需求?

居民自身的健康管理,日常的居家生活场景是至关重要的一环。

京东消费及产业发展研究院观察到,家庭场景的健康管理正在从被动到主动,从初期的个人为单位向以全家为单位迭代,其中,老人、小孩、女性等不同人群对健康消费有着不同的细分需求。“比如婴幼儿的营养补充,不少用户在购买相关产品时会选择先咨询营养师以获得专业的建议和指导。从喝什么样的奶粉,到做什么样的日常健康监测,都有很多用户在线上问询。”该院专家表示。

北京大学公共卫生学院副研究员、博士生导师傅虹桥按照健康人群和疾病人群来分解居民日常健康管理的需求:对于健康人群,关键是倡导健康消费理念,引导健康消费行为;对于疾病人群,重点是要做好老龄人群的慢病管理、适老产品研发和护理服务供给。

目前,对我国居民健康最大的威胁,当属心脑血管疾病、癌症、慢性呼吸系统疾病和糖尿病等各类慢性病。随着老龄化进程的加快,慢病负担或将进一步加重。因此,加强慢性病防治,已成为我国当下促进居民健康的一项重要工作。在《中国防治慢性病中长期规划(2017—2025年)》中,也提出了明确家庭、个人在健康管理中的责任。

对各类慢病患者而言,控制病情发展,避免严重并发症,关键在于日常的规范化健康管理。 

以高血压和糖尿病患者为例,除了接受相关治疗,对血压、血糖的日常监测也必不可少。高血压患者通过观察日常血压水平,可以调整治疗用药,以及估计高血压对心脏和脑血管的影响。而在糖尿病管理中,血糖监测可以反映患者糖代谢紊乱的程度,根据监测数据,可以评估降糖治疗效果,并制订合理的饮食、运动、用药等治疗方案。

如果每次检查都要前往医疗机构,对患者和医疗机构,都意味着巨大的消耗。很多慢病患者往往因为检查不及时,对疾病指标缺乏掌握,任由病情发展,从而导致病情加重甚至危及生命。如果能够居家开展日常健康监测,及时发现风险并积极干预,无疑将大大提高病情控制的效果。

把握产业机遇,首先解决“反人性”体验? 

健康状态监测和疾病筛查,是目前业界重点关注的、与家庭场景息息相关的健康管理发展方向。

与会专家普遍认为,目前大部分人群对此类健康干预措施的使用积极性、依从性和支付意愿都不高,最大的痛点在于其“反人性”,使用体验不佳,产业端要解决的关键问题,就是让产品功能更完备、使用更简便,同时还需要一些正向激励来激发消费者进行健康管理的意愿。

华泰联合投资银行业务线大健康行业部副总监洪捷超指出,慢性病的病程发展通常没有自限性,如果前期缺少必要的院外医疗服务往往会导致病情拖延、加重。同时,也往往会长期伴随患者,对血糖、血压等各种生命指标的日常监测,如果过程繁琐,很难提高患者的依从性。以血糖监测为例,传统的血糖检测仪,通过针扎手指或其他部位来采血检测血糖,对于血糖不稳定的糖尿病患者,需每日监测三餐前和睡前血糖,必要时监测凌晨和餐后血糖,既要忍痛,过程也比较繁琐,并且在两次测量之间血糖的数值变化可能被遗漏,存在监控盲区。持续血糖监测产品(CGM)可提高患者依从性和血糖管理水平,并降低糖尿病相关并发症的概率,其临床优势已纳入中华医学会糖尿病学分会和美国糖尿病学会最新指南,有望成为血糖监测领域新趋势。

对于健康人群,如何提升疾病筛查积极性?

燃石医学创始人、CEO汉雨生认为,关键还是在于提高筛查方式的可及性。“我国40岁以上人群大约有7亿,都去做肠镜、胃镜和低剂量螺旋CT,医院根本排不过来。”汉雨生还指出,肠镜、胃镜侵入检查,很多消费者往往觉得痛苦而难于接受;还有一些肿瘤,如胰腺癌、卵巢癌等,尚无有效筛查方法。为此,该公司选择探索如何用“一管血”筛查癌症,“通过采集一管血来实现多个癌肿的早期发现,如果检测出癌肿阳性,还可以指出最可能的病灶位置。”

不难看出,功能全面、利于携带、简便易用的健康管理产品,是产业端已经瞄准的市场方向。其中,可穿戴智能设备是这类产品中已经投放市场且有一定规模的典型代表,如何让可穿戴设备产生的健康监测数据发挥最大价值,是目前业界正在思考的问题。

京东消费及产业发展研究院认为,长期的监测数据才能产生真正的健康管理价值。而要有连续的数据,首先是消费者要有长期监测、积累数据的意识,同时,还要看设备生产端是否能够将所有数据连通、共享,让不同维度的数据叠加,为构建更全面、立体的健康大数据奠定基础。

“最重要的是如何快速实时地知道自己的健康状况,而不是等到每年一次的体检,或者等到身体不舒服再去医院。”鹰瞳科技合伙人、高级副总裁陈景哲认为,在健康产业链中与各个合作伙伴一起构建形成不同病种、不同人群、不同场景下产品服务一体化的闭环,才是打开健康消费升级局面的一个关键点。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/sc4PvhASBOmxkLiH.html#comments Fri, 17 Nov 2023 14:21:00 +0800
中山一院贵州医院走进黔南,探索分级诊疗怎么落到实处? //m.drvow.com/category/healthai/QqZYEzlFPs5TCuPM.html 要想剖析中国基层医疗的发展思路,贵州东南部的龙里县是一个无法绕开的议题。

因为围绕这里而展开的数字医疗试点、分级诊疗试点、智慧医疗试点,对于全国的整体医疗布局有着极其重要的推动意义。

龙里第一次被外界广泛注意到,是在2015年。

当时的大背景是一大批IT科技公司朝着医疗进军,腾讯也不例外,悄悄向市场推出了一款由腾讯梦工厂孵化的医疗硬件产品:糖大夫血糖仪。值得注意,这一款产品的省级合作方,正是贵州省卫计委,此外还有企业合作方丁香园、众安保险、中迈以及跨国药企礼来。

对腾讯和贵州这次的医疗首秀而言,证明一个重要道理:找对伙伴和练兵场很重要。

还是在2015年,距离腾讯的“糖大夫”推出四个月后,借着贵州举办首届数博会的时机,腾讯与贵州省卫健委签订《互联网+医疗合作协议》。“龙里县”有了新的名片--作为腾讯等诸多企业施展数字医疗新技术的“试验场”。

八年过去,龙里县有了专用的医疗服务设备、医疗设备里加入了AI技术、各级医疗机构之间建立了上下转诊的常态机制、还与广东的中山大学附属一院结成对口帮扶,并在贵州本地落地一所“中山一院贵州医院”。

数字化和高质量分级诊疗体系的“龙里经验”,如今已经成为继福建“三明医改”后的另一个医改范本。

今年五月,又是相同的数博会,龙里的经验被进一步复制和推广——腾讯携手中迈医疗,与毕节市、贵阳市、黔南州三地政府签署战略合作协议,“黔南模式”在此次会议上被首次提起。它承载着贵州省医疗数智化转型的一次重要探索,不仅要破解乡村群众“看病难”问题,还要为上述三市的医疗人员找到一条可持续提升医疗水平的路径。

来看毕节市、贵阳市、黔南州三地的选择,分别占据贵州的西北、中部、东南三个方位,形成一条横跨贵州“西北-东南”的对角线。

这三个点位缺一不可。其一是贵州全省的九市/州实现就近就医;其二是西北据点毕节与云南、四川接壤,东南据点黔南与广西、湖南接壤。这意味着,下一步基层数字医疗和智慧医疗走出贵州,云桂川湘四省边际将是首批辐射区。

放在“大病不出市,一般性疾病不出县市,头痛脑热的小病在乡村”的大背景下,黔南模式有了充分着陆的时机。但医改这条路从不可能是一片坦途,总会遇到阶段性问题。如何理顺贵州与周边优势省份如广东省的合作关系,推动黔南模式的系统性落地,又需要很多的工作要做。

近日,中山一院贵州医院与黔南州卫生健康局、中迈数字正式签署《数字化分级诊疗战略合作协议》,成为广东省优势医疗资源带头出击的第一步。

中山一院贵州医院、黔南州卫生健康局、中迈数字,正式签约

作为中山一院贵州医院的重要代表,该院执行院长陈振光在会上表示,“此次合作的征重点是整合我们的专科优质资源,辐射提升黔南州医疗服务能力,一块打造数字化分级诊疗‘黔南模式’。”

实际上,早在2015年确立龙里县为医疗试点时,陈振光曾参与该地的分级诊疗方案的设计,此次他再次表示,“这套方案还在,还在龙里县全面落地开花,得到了真实的应用实践。这不仅是技术的突破,这更是体制与机制的协同创新。”

如何保证帮扶医院的常态化输出,是本次签约的重要关注点。

作为输出医院的中山大学附属第一医院,是全国首批委省共建综合类国家区域医疗中心,也是首批国家区域医疗中心建设输出单位,多年来联合牵头建设国家神经区域医疗中心、医疗大数据中心等多个中心。下一步重要工作是将中山一院贵州医院,对标国家区域医疗中心建设标准,以及贵州省学科发展水平,实现品牌、技术、人才、管理优势平移,统一医疗、教学、科研、管理模式,逐步实现与中山一院同质化发展。

未来在黔南模式的实施下,以中山一院贵州医院为桥梁,也将是一次为健康中国建设提供“贵州样板”和“中山一院样板”的重要机会。

龙里县政府党组成员、副县长胡伟谊讲到:“这次签约,将建立向上一直延伸到中山一院越秀院区和中山一院南沙院区的医疗协作链接,龙里县将以此为契机,在合作中实现柔性人才流动支持,进一步以群众‘看得见、摸得着、能相信’的医疗资源下沉。”

一个最好的例子是:

在签约仪式当天,由黔南州卫生健康局、中山一院贵州医院主办,龙里县卫生健康局、龙里县人民医院(医共体)总院承办的「大型数字化分级医学教学及义诊活动走进黔南」也一同进行。

来自中山一院贵州医院的胸外科、肾内科、心血管内科、神经内外科等多个科室的11位专家,现场坐诊龙里县及洗马镇,并在龙里县人民医院(医共体)总院开展专家讲课、教学查房。通过教学查房及病例教学讨论,对县医院的医务人员在患者的诊断、治疗方案、用药处方等方面进行了指导。

“我两点就来了,是第一个排队看上的人,王主任叫我每年定时在县医院复查就行,不用太担心。我以前都是一到两年跑一趟贵阳去做胃镜,现在不一样了,县医院里能直接视频找专家,我们县医生也都不错。我65岁了,年纪大了往市里也跑不动了,每年社区还有免费的体检,现在觉得县里医疗也足够了。”现场看完诊的罗阿姨说到。

中山一院贵州医院专家在龙里县人民医院进行病例教学讨论

中山一院贵州医院专家在龙里县兴龙广场为群众义诊

要想真正促进优质医疗资源扩容和区域均衡布局,光靠医生“跑腿”还不够,还需要技术能力提上来。

实际上,贵州省卫健委携手腾讯、中迈数字在黔南州龙里县展开试点工作,探索出“专用医疗设备+区块链”的数字化技术路线,将会被进一步放大。这种技术形式在各级医疗机构间建立了可信、可控的端对端、点对点医疗数据连接,把上级专家“面对面”带到基层患者床边。

具体来说,依托中迈数字、腾讯健康携手建立的数字化分级医学教学体系,中山一院贵州医院对黔南州的教学帮扶,将从传统的每年一次的线下教学和义诊,升级为每周一次的线上教学查房、远程病历教学讨论,把医疗帮扶变成常态化。

截止目前,龙里县数字化分级诊疗系统覆盖3家县级医院的18个临床科室、15个乡镇级卫生院、52个行政村、83个村卫生室,受益群众达10万余人次。大大便利了基层群众寻医就诊,降低了就医费用,走出了一条省级推动、上下联动、梯次带动的县域医疗机构发展之路。

未来,以“造血式”数字分级医学教学,扩容当地医疗人才储备,提升基层医生的诊疗水平,从而减少跨省、跨区域就医,对加速黔南州分级诊疗制度落实具有重要意义。

在迎接这场西南部的医改大考中,如今已不只是腾讯、连同中迈、中山一院以及本地的贵州医院等,都在形成一股合力:

⼒争到2025年底,优先在黔南州全⾯形成以数字化为⽀撑的优质医疗资源纵向流动、上下贯通的数字化分级诊疗服务模式,县域内就诊率达到 90%以上,进一步满足黔南州群众对高品质医疗卫生健康服务的需求。

从长期来看,将这条数字化分级诊疗道路推到更广阔的区域,将只是时间问题。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/QqZYEzlFPs5TCuPM.html#comments Wed, 15 Nov 2023 15:07:00 +0800
参会攻略一手掌握!湾区脑科学产业创新与合作大会·2023暨深圳市脑科学学会第二次年会暨中国神经科学学会神经科学研究技术分会年会 //m.drvow.com/category/healthai/lwUdRljAon2agM0B.html 人类文明发展了上千年,对大脑领域的研究一直被当做是人类科学的“终极疆域”,是科研桂冠上最难以企及的明珠。充满着未知也就意味着可以拥有探索的无限,对这一高精尖领域科学家们从未停下过探索的脚步。脑科学与类脑智能历来就是国际科技竞争的焦点,也是我国科技创新的重要战略方向,在国家战略的大力支持之下,脑科学正在进入高速增长阶段,一个全新的基于脑科学的万亿级产业正在快速形成。

为搭建深度研讨脑科学产业创新融合、合作发展的平台,链接脑科学产业政策、学术、临床、产业、投资的各方优质资源。由深圳市脑科学学会、深圳市脑科学与类脑智能产业联盟和动脉网、VB100、蛋壳研究院联合举办的“第四届光明脑科学大会:湾区脑科学产业创新与合作大会·2023暨深圳市脑科学学会第二次年会暨中国神经科学学会神经科学研究技术分会年会”,同时也作为第五届世界科技与发展论坛未来产业发展论坛的脑科学平行论坛于11月16-17日在深圳·光明文化艺术中心举行。

汇聚创新力量,共享创新之舟

本次论坛汇聚诺奖得主、两院院士、临床专家、顶尖资本、产业代表等大咖嘉宾共聚一堂,围绕技术前沿、成果转化、产业创新、临床应用核心内容,激发研学灵感,为脑科学研究寻找新的方向,为研究成果寻找转化路径。

嘉宾名单持续更新中。按嘉宾姓氏笔画升序排列,排名不分先后。

Erwin Neher,中国科学院深圳先进技术研究院内尔神经可塑性诺奖实验室、马克斯·普朗克生物物理化学研究所 研究员

Stefan W. Hell,中国科学院深圳先进技术研究院内尔神经可塑性诺奖实验室、马克斯·普朗克生物物理化学研究所 研究员

王玉田,深圳理工大学(筹) 教授

王立平,中国科学院深圳先进技术研究院脑认知与脑疾病研究所/深港脑科学创新研究院 研究员

王 伟,华中科技大学 教授

王伊龙,首都医科大学附属北京天坛医院 教授

王启章,深圳中西医结合医院 教授

王拥军,首都医科大学附属北京天坛医院 教授

王 菲,南京医科大学 教授

王 璐,暨南大学附属第一医院 教授

毛 颖,复旦大学 教授

文艳玲,蓝海资本首席医学官

尹芝南,暨南大学 教授

乐 飚,阳光诺和集团首席战略官

朱飞奇,罗湖区人民医院 教授

任力杰,深圳市第二人民医院 教授

任传成,龙岗区中心医院 教授

任超然,暨南大学 研究员

刘 妍,南京医科大学 教授

刘 胜,中山大学 教授

刘 强,天津医科大学总医院 教授

闫 森,暨南大学 教授

江 敏,软银中国资本 合伙人

许 琪,中国医学科学院基础医学研究所 研究员

孙爱军,复旦大学附属中山医院 教授

李 明,中国科学院昆明动物研究所 研究员

李 涛,浙江大学附属精神卫生中心/杭州市第七人民医院 教授

李 彪,上海交通大学医学院附属瑞金医院 教授

李湄珍,香港大学 教授

李新建,天使母基金总经理

杨清武,陆军军医大学第二附属医院 教授

邴志桐,中国科学院近代物理研究所 副研究员

时 杰,北京大学 教授

吴仁容,中南大学湘雅二医院 教授

何裕隆,中山大学附属第七医院 教授

邹良玉,深圳市人民医院 教授

汪云沾,福田引导基金总经理

汪 凯,安徽医科大学第一附属医院 教授

张 军,中国人民解放军总医院 教授

张志珺,深圳理工大学(筹)教授

张 岱,北京大学第六医院 教授

张宗久,清华大学医学管理研究院 教授

张 研,北京大学 教授

陈小武,深圳大学总医院 教授

陈晓春,福建医科大学 教授

陈 蕾,四川大学华西医院 教授

陈 巍,通力律师事务所 合伙人

武志芳,山西医科大学第一附属医院 教授

畅君雷,中国科学院深圳先进技术研究院 研究员

罗雄剑,东南大学 教授

周艳霞,深圳市第二人民医院 教授

单保慈,中国科学院高能物理研究所 研究员

赵 宇,深圳市第三人民医院 教授

赵 昂,深圳中科华意科技有限公司CEO

赵继宗,首都医科大学附属北京天坛医院 教授

赵 敏,上海市精神卫生中心 教授

赵清石,龙华区人民医院 教授

胡 俊,北京大学深圳医院 教授

姜 勇,郑州大学第一附属医院 教授

贺雄军,南方医科大学深圳医院 教授

聂彬彬,中国科学院高能物理研究所 研究员

徐 讯,深圳华大生命科学研究院 教授

徐志明,中国科学院大学深圳医院 教授

徐格林,深圳市第二人民医院 教授

徐 涛,中国科学院生物物理研究所 研究员

徐 浩,暨南大学附属第一医院 教授

徐 锋,好心情健康产业集团 总裁

徐富强,中国科学院深圳先进技术研究院 研究员

徐鹏飞,北京师范大学 副教授

郭 飞,华中科技大学深圳协和医院 教授

郭 毅,深圳市人民医院 教授

唐亚梅,中山大学孙逸仙纪念医院 教授

海 鸥,微芯生物董事、副总经理

陶恩祥,中山大学附属第八医院 教授

姬生健,南方科技大学 教授

黄慈波,深圳大学附属华南医院 教授

符鹏程,深圳市第二人民医院 教授

谌小维,陆军军医大学基础医学院 教授

董诚岩,山西医科大学 教授

董海龙,空军军医大学西京医院 教授

鲁友明,华中科技大学 教授

曾进胜,中山大学附属第一医院 教授

曾春雨,第三军医大学大坪医院 教授

蔚鹏飞,中国科学院深圳先进技术研究院 研究员

谭力海,深圳市神经科学研究院 教授

虢周科,深圳市中医院 教授

鞠振宇,暨南大学衰老与再生医学研究院 教授

共享科技前沿 探索协同发展

本次大会的主题内容为“脑疾病:基础与临床转化”,设置1场主论坛开幕式、7场产业细分论坛,围绕脑疾病新药研发、脑疾病早期诊断与非药物治疗等多个话题内容进行探讨,搭建产学研投融合平台。

★ 60+学术产业嘉宾齐聚,呈现中国脑科学领域的顶尖力量

★ 聚焦脑科学前沿话题,输出脑科学领域创新与实践发展范本

(以下内容为拟定安排,具体嘉宾和议题以现场为准)

嘉宾出席信息截止11月10日

湾区脑科学产业创新与合作大会•2023暨深圳市脑科学学会第二次年会暨中国神经科学学会神经科学研究技术分会年会

攻略在手 参会无忧

大会时间:2023年11月16日-17日

论坛地点:深圳·光明文化艺术中心,广东省深圳市光明区创投路与观光路交叉口(光明区政府南侧)

参会签到

签到时间:2023年11月16日-17日  08:00-09:00

签到地点:深圳·光明文化艺术中心

签到方式一:已网上报名注册的观众,到会场签到处,扫码签到二维码或者以姓名+电话信息核对完信息,即可完成报道参会。

签到方式二:未提前报名注册的观众,到会场签到处,现场缴费注册,即可完成报道参会。

(温馨提示:为避免人员拥挤、交通堵塞等情况,建议您提前安排出行,抵达会场)

扫码二维码即可线上报名注册

交通指南

会场地址:深圳·光明文化艺术中心

广东省深圳市光明区创投路与观光路交叉口(光明区政府南侧)

距离深圳宝安国际机场约33km,驾车约50分钟,打车约90元;

距离深圳北站23km,驾车40分钟,打车约70元;

(注:打车价格仅供参考,实际费用以行程为准)

公共交通:

1.【乘坐高铁】深圳北站—深圳·光明文化艺术中心

路线:地铁6号线(光明线)直达【开往松岗方向】

(深圳北站地铁站进 凤凰城地铁站B口出 途径8站 预计29分钟)

2.【乘坐飞机】深圳宝安国际机场—深圳·光明文化艺术中心

路线:地铁11号线【开往碧头方向】(机场地铁站C口进 松岗地铁站转乘 途径8站 预计21分钟)→地铁6号线(光明线)【开往科学馆方向】(松岗地铁站转 凤凰城地铁站B口出 途径11站 预计24分钟)

酒店住宿温馨提醒:

参会代表交通、住宿自行安排,费用自理。

酒店名称:深圳光明中集行政公寓酒店

酒店地址:广东省深圳市光明区侨明路光明开明公园南侧约 60 米

会议联系人

招商联系人:罗老师  15102184770

会务联系人:李老师  16675520256

住宿联系人:卢经理  13826592644

相约深圳,智见未来

大会主题:脑疾病:基础与临床转化

大会时间:2023年11月16日-11月17日

大会地点:中国·深圳·光明文化艺术中心

指导单位:中国科学技术协会、中国科学院、广东省人民政府、深圳市人民政府、中国神经科学学会

支持单位:深圳市科学技术协会、深圳市科技创新委员会、深圳市卫生健康委员会、深圳市光明区人民政府

主办单位:深圳市脑科学学会、深圳市脑科学与类脑智能产业联盟、动脉网、VB100、蛋壳研究院

承办单位:中国神经科学学会神经科学研究技术分会、中国科学院深圳先进技术研究院脑认知与脑疾病研究所、深港脑科学创新研究院、深圳市脑科学技术产业创新中心、深圳市卒中学会、深圳市第二人民医院、深圳理工大学(筹)

大会规模:600+

大会机构

(按成员姓氏笔画升序排序、排名不分‍‍‍先后)

大会名誉主席:(按姓氏笔画排序)

张 旭、赵继宗

大会主席:(按姓氏笔画排序)

王拥军、王立平

学术委员会:(按姓氏笔画排序)

主任委员:

王拥军

副主任委员:

王立平

委员:(按姓氏笔画排序)

王玉田、王立平、王 伟、王伊龙、王拥军、

王 菲、毛 颖、尹芝南、甘文标、叶克强、

毕国强、任力杰、刘 妍、刘 胜、刘 强、

许 琪、孙坚原、孙爱军、李 明、李 涛、

李湄珍、杨清武、时 杰、吴仁容、何裕隆、

汪 凯、张 旭、张志珺、张明杰、张 岱、

张宗久、张 研、陈晓春、陈 烨、陈 蕾、

畅君雷、罗雄剑、周列民、赵继宗、侯圣陶、

姜 勇、徐 涛、徐 浩、徐富强、郭 毅、

唐亚梅、谌小维、董海龙、韩明虎、曾进胜、

谭力海 

组织委员会:(按姓氏笔画排序)

主任委员:

王立平、王玉田

副主任委员:

任力杰、张志珺、陈 宇、黄天文、屠 洁 

委员:(按姓氏笔画排序)

王玉田、王立平、王志强、王婷梅、甘文标、

毕国强、朱英杰、任力杰、刘慧铭、池 枫、

孙坚原、孙喜琢、苏琪茹、邹 静、张志珺、

陈 宇、陈 烨、陈 攀、尚春峰、罗琬岩、

周列民、周 涛、孟志强、赵若棋、徐富强、

徐鹏飞、高雨森、郭 毅、姬生健、黄天文、

屠 洁、程 飞、鲁 艺 

会议秘书组:(按姓氏笔画排序)

韦梅红、贝汶渝、艾婧昱、李少微、李业钊、

李梦汝、杨欣悦、吴 玲、吴晓妮、邱子鉴、

张珂鑫、陈贤学、矣文玲、苗思敏、罗 兰、

胥匀家、涂雯君、黄盈盈、韩茜茜、谭敏谊 

报名注册

第四届光明脑科学大会:湾区脑科学产业创新与合作大会·2023暨深圳市脑科学学会第二次年会暨中国神经科学学会神经科学研究技术分会年会

注册参会中!

扫码二维码即可线上报名注册

关于光明脑科学系列大会

光明脑科学系列大会是我国脑与健康领域规模盛大、覆盖面广、科技、产业与资本界共同融合、参与度极高的盛会。自2021年以来,已经在光明科学城连续举办了三届,共计吸引线下、线上2600万余人参与,受到了社会各界的广泛关注。在前三届大会中,我们邀请到3位诺奖得主,超12位中外院士以及数百位来自国内外相关领域的顶级专家,聚焦脑科学前沿与产业发展趋势展开研讨交流,形成系列大会的国际化特色。

关于脑创中心

脑创中心通过历届大会,在打造光明科学城脑科学与类脑智能产业生态方面取得了令人瞩目的成绩。目前,脑创中心已经吸引超60家企业落地光明科学城,其中30家企业入驻脑创中心,协助对接11家企业通过光明区第一批和第二批脑科学企业认定,初步形成规模化的产业生态集聚。在深圳市和光明区的大力支持下,脑创中心已搭建11个共享技术平台,累计服务企业获得投融资规模超过10亿。展望未来,脑创中心将继续双向赋能资本与企业,致力于打造全国首个“拎脑入驻”型专业孵化赋能平台,力图成为服务于全国、辐射全球的脑科学技术产业创新示范高地。

深圳市脑科学学会

深圳市脑科学学会由中国科学院深圳先进技术研究院作为发起单位,以及来自深圳市人民医院、深圳市第二人民医院、深圳大学、南方科技大学、北京大学深圳研究生院、深圳理工大学(筹)、深圳湾实验室、深圳市神经科学研究院的脑科学专家作为共同发起人,发起成立的地方性、学术性、非营利性社会组织。学会旨在以需求牵引的源头创新为指引,以“共享、创新、服务”为路径,为疏通脑科学基础研究、应用基础研究、临床研究和产业化连接的快车道,搭建好学术与技术交流的平台。作为脑科学产业主要依托的社会组织,学会牵头成立了“深圳市脑科学与类脑智能产业联盟”。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/lwUdRljAon2agM0B.html#comments Sun, 12 Nov 2023 18:28:00 +0800
罗氏诊断携手合作伙伴打造「智慧化数字病理本土生态圈」 //m.drvow.com/category/healthai/9T1vV6QPQ3cgZBfl.html 全球体外诊断领域先行者「罗氏诊断」,于第六届中国国际进口博览会宣布:携手多家合作伙伴共建智慧化数字病理本土生态圈。

各方将通过充分整合优势资源,共同打造整体数字化智慧病理解决方案,以前沿科技驱动中国病理诊断的数字化、智慧化转型,为个体化精准诊疗的持续发展全面赋能。

整合资源

共塑病理诊断新生态

精准医疗,诊断先行。作为肿瘤诊断的“金标准”,病理诊断是指导临床治疗、评估预后最可靠的依据,因而精准、高效的病理诊断对于实现个体化精准诊疗的意义重大。

近年来,以人工智能(AI)为代表的新兴数字化、智能化技术与医疗产业深度融合发展,在病理领域的应用也日益广泛,为病理诊断的持续提质增效开辟崭新路径。

为进一步助推我国病理诊断的智慧化转型与升级,罗氏诊断依托其创新产品与资源优势,携手优秀的本土合作伙伴,形成优势互补、驱动协同发展,创新打造了智慧化数字病理本土生态圈。

作为生态圈中的本土合作伙伴代表,迪英加科技有限公司创始人兼董事长杨林、衡道数字(湖南医润智能科技)总经理左彦飞出席了此次启动仪式。

迪英加科技有限公司创始人兼董事长杨林 

衡道数字(湖南医润智能科技)总经理左彦飞

罗氏诊断中国高级总监-组织诊断部何鹏志(上图)表示:

“去年进博会上,罗氏诊断数字病理AI的开放生态平台正式启航。得益于进博会的溢出效应和积极影响,此次罗氏诊断智慧化数字病理本土生态圈的建成,正是这一创新成果的成功延续。

希望通过与生态圈合作伙伴的紧密合作,推动中国病理诊断向着‘数智融合’的方向持续迈进,为中国的病理医生带来创新医疗价值洞察,为患者精准诊疗带来切实获益。

罗氏诊断也将继续深耕病理诊断领域,携手更多优秀的本土合作伙伴,协力引领病理诊断的数字化变革,为个体化精准医疗的未来发展注入崭新生机。”

集智汇策

驱动精准医疗新飞跃

伴随此次智慧化数字病理本土生态圈的启航,整体数字化智慧病理解决方案也正式亮相。

该解决方案依托罗氏诊断 VENTANA DP 200 和 DP 600 数字病理切片扫描仪®、以及罗氏诊断数字病理开放平台,实现了病理实验室硬件与智慧化算法、远程会诊平台、大容量存储、信息管理系统的充分融合,助力病理医生以更高效、更精确的病理诊断结果为精准用药和个体化精准诊疗提供更有效的临床信息。

据悉,整体数字化智慧病理解决方案中包括了HER2、ER、PR、Ki-67、PD-L1在内的病理人工智能AI辅助判读算法。

该算法基于大数据和深度学习技术,以AI赋能病理医生更为精准、高效地判读病理切片,为乳腺癌和非小细胞肺癌的病理诊断再添“利器”。

此外,该解决方案中还将包括含远程诊断平台专家库的整合方案,实现病理资源共享,满足医院跨院病理会诊需求,带动不同区域层级医院整体病理水平的提升。

罗氏诊断中国副总裁-战略与创新部沈宝璐(上图)表示:

“秉承‘在中国,为中国’的坚定承诺,罗氏诊断近年来持续为中国打造‘揽云’数字化创新解决方案,满足本土客户需求,以创新之力赋能精准医疗。

此次推出的整体数字化智慧病理解决方案符合精准医疗时代下病理科数字化转型的需求,是罗氏诊断加速数字化转型之路、实现智慧化创新发展这一战略目标的又一生动体现。

未来,在‘揽云’的数字化体系下,我们也将持续结合罗氏在制药和诊断方面的经验,为客户提供与众不同的数字化服务,连接更多的生态伙伴以及全球创新产品,构建‘以患者为中心’的医疗生态体系。”

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/9T1vV6QPQ3cgZBfl.html#comments Tue, 07 Nov 2023 18:46:00 +0800
「AlphaFold 3」要来了?DeepMind推出新一代蛋白质结构预测工具,已用于药物设计 //m.drvow.com/category/healthai/n2K6d1oJ70hoWoBv.html 大约五年前,谷歌最多产的以AI为中心的研究实验室之一,DeepMind,推出了 AlphaFold。这是一种可以准确预测人体内许多蛋白质结构的人工智能系统。

从那时起,DeepMind 对系统进行了改进,于 2020 年发布了更新且功能更强大的 AlphaFold 版本--AlphaFold 2。

实验室的工作仍在继续。

10月31日,DeepMind表示,最新版本 AlphaFold 已经出炉,不少人将其取名为“AlphaFold 3”。

据悉,最新的 AlphaFold 系统由DeepMind及其衍生公司 Isomorphic Labs (专注于利用 AI 做药物发现)共同开发,不再局限于蛋白质折叠,还能够在配体、蛋白质、核酸以及翻译后修饰等方面生成高度精确的结构预测。且 Isomorphic Labs 公司已经将该系统用于药物发现工作。

不过最新版本的“ AlphaFold 3 ”还处于预览阶段,后续开发工作还在进行。

AlphaFold新版本有哪些升级?

第一大升级:预测蛋白质数据库(PDB)中大多数分子类型的结构,达原子精度。

根据DeepMind的说法,AlphaFold可以预测蛋白质数据库(一个广泛使用的科学数据库)中几乎所有分子的结构。DeepMind声称,该模型通常以“原子精度”生成这些预测。

AlphaFold 新版本不仅可以估计蛋白质的形状,还可以估计其他生物分子的形状。包括:小分子(配体)、蛋白质、核酸(DNA和RNA)、具有翻译后修饰(PTM)的分子。

第二大升级:预测相关配体的结构。

所谓配体,是指其他不同分子与蛋白质结合,并导致蛋白质功能方式发生变化。配体在细胞信号传导中起着重要作用,细胞信号传导是细胞相互影响行为的关键生物过程。

一种情况是,当配体附着或结合到蛋白质上时,组合结构称为“蛋白质-配体复合物”。研究人员历来使用一种称为“对接”的方法评估这种复合物的形状。但这一方法的局限性是,只有当有大量关于蛋白质-配体复合物的蛋白质成分的数据可用时,才能使用这种方法。

根据 DeepMind 的说法,新版本的 AlphaFold  新版本可以比“对接”方法更准确地预测蛋白质-配体复合物的形状。与这些方法相比,AlphaFold  新版本需要的数据要少得多。

DeepMind最新模型为蛋白质-配体结构预测设定了新的标准,在预测蛋白质-配体相互作用方面,新AlphaFold的性能比传统方法高出约20%,并且还可以预测尚未进行结构表征的全新蛋白质。

因此,AlphaFold  新版本可能会使科学家更容易研究新发现的蛋白质-配体复合物,而这些复合物的信息很少,而且可以帮助科学家识别和设计潜在的药物新分子。

Isomorphic Labs 最新公布了3个案例实验:抗癌分子的结合(PORCN)、关键癌症靶标的共价配体结合(KRAS),脂质激酶变构抑制剂(PI5P4Kγ)的结构预测。结果显示,该模型预测的结构与案例实验中测定的结构非常接近。

这一举动引起相关学者和药企的关注。有人在国内外社交平台表示:“设计新的分子比开发工具更重要,开发类似工具的人可能要改行,毕竟设计新的高价值的分子才可能是更好的生财之道。”

不过,也有人希望新版本能力再做进一步提升:很多时候,最新的 Alphafold 的相对准确率(RMSD误差<2A)也只有50-60%,这对于药物设计来说往往会有很多问题。

更进一步说,蛋白质和小分子复合物的结构预测,应该是结合了AI和CADD两种方法,即分别基于数据库和物理原理,

第三大升级:预测核酸、以及翻译后修饰结构。

核酸是关键遗传信息的携带者,并破译翻译后修饰--即蛋白质诞生后发生的化学变化。

例如,在 CasLambda 与 crRNA 以及 DNA 结合的结构中,CasLambda 共享 CRISPR-Cas9 系统的基因编辑能力,通常被称为“基因剪刀”,研究人员可以利用它来改变动植物和微生物的DNA,而 CasLambda 的较小尺寸可能使其在基因编辑中更加有效。

据一位从事药物设计的公司创始人评价:做核酸药物的人有福了,至少有个结果。不过结果是否准确,还需找个有经验的CADD(计算机辅助药物设计)研究员来评估。

此外,也有人指出,“我更关心 Alphafold 3 是否可以用于预测病毒的蛋白质结构。AFDB(数据库)中有很多预测结构,几乎涵盖了所有物种,但没有病毒。而且新版本对RNA结构预测还不太好。”

总体而言,至于 AlphaFold 3 具体性能表现,DeepMind 和 Isomorphic Labs 研究人员透露:

•考虑到比较系统使用已知的蛋白质结构作为基础,AlphaFold 3 在配体对接的准确性方面,优于开源分子建模模拟软件 AutoDock Vina 等传统系统;

•与AlphaFold 2.3相比,AlphaFold 3 在预测蛋白质-蛋白质结构方面,抗体结合结构显著增强;

•此在蛋白质-核酸相互作用方面,AlphaFold 3 优于其他竞争方法,如RoseTTA2FoldNA等;

•在 RNA 结构预测方面,AlphaFold 3 优于自动化技术,但略低于顶级CASP 15 参赛者,后者涉及专家手动干预。

但饶有意味的是,针对最新版本,DeepMind的博客文章并没有介绍方法,也没有对比薛定谔的方法。这可能是竞争关系的原因。

无论如何,从表面上看,AlphaFold 3 的功能有了大幅度的提升,如果真如DeepMind所说,那么新版模型扩展的功能和性能提升可以加速生物医学突破,为疾病通路、基因组学、生物可再生材料、植物免疫、潜在治疗靶点、药物设计机制提供各种全新的可能性。

“AlphaFold 3 ”能否继续开源?

尽管 AlphaFold 最新版本推出不到两天,但已经有不少人已经开始期盼望继续开源,“因为学术界对蛋白质的研究已经空前高涨。”

一个典型例子是:

尽管 OpenAI 的 ChatGPT 在 2022 年底亮相时就席卷全球,但 2022 年被引用次数最多的论文并非关于生成人工智能(AIGC),甚至不是来自大型科技公司,而是欧洲分子生物学实验室(EMBL-EBI)和 DeepMind 出版的“AlphaFold 蛋白质结构数据库”,被引次数为 1331 次。

更有趣的是,引用量第二同样属于“蛋白质折叠模型”--ColabFold。该系统由马克斯·普朗克多学科科学研究所(MPG)打造,引用次数为 1138 次。

从一定程度上说,尽管企业界将2022年描述为“生成人工智能年”,但学术界则认为:2022年绝对是“蛋白质折叠预测年”。

“目前 Alphafold 拥有3项以上的专利,这不该是理所当然的,也不该是常态。不过AF历代版本确实是目前生物领域最先进的工具,没有之一。”

更有人指出,“闭源不是最好的解决方案,为什么大多数国家都倾向于使用AlphaFold ?我有点怀疑大多数国家是否有人才和预算,来制造像AlphaFold 和蛋白质数据库这样的东西。”

据悉,DeepMind在 AlphaFold 3发布当天披露,已累计超过140万用户(来自190多个国家)访问了AlphaFold蛋白质结构数据库。

不过未来“AlphaFold 3” 能否真正推动药物开发,还有待时间去验证。

具体细节可查阅原始博客:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/a-glimpse-of-the-next-generation-of-alphafold/alphafold_latest_oct2023.pdf

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/n2K6d1oJ70hoWoBv.html#comments Fri, 03 Nov 2023 09:51:00 +0800
十位国内外学术大咖共话「系统生物学」,首期线上讲座将于11月5日开讲 //m.drvow.com/category/healthai/3l1FjXo99zHDjtuA.html 2023年11月5日起,“系统生物学系列讲座”将从开始第一讲,后续每两周进行一期,将涉及系统生物学的基础理论、常用方法、以及在生物医学问题中的具体应用研究。

该系列讲座由中国生物信息学学会(筹)系统生物学专业委员会主办,通过B站进行在线直播。

雷峰网《医健AI掘金志》作为大会首席合作媒体,将全程参与报道。

系统生物专委会,于2023年8月25日正式成立,拥有专委会委员60余名。专业委员会的成立,旨在凝聚国内力量,培养人才团队,推动学科发展,扩大学科影响。

一方面,促进系统生物学理论基础、技术框架的交流构建,揭示疾病演化的驱动力及规律;

另一方面,推动基于系统生物学的新技术新产品研发,解决生命医学研究碎片化、重大产品和系统缺失等重点难点问题,最终更好地服务于满足人民健康需求、推动新型医学发展、服务于国民社会经济的国家战略。

迄今为止,系统生物学专业委员会已采取3种形式的学术交流活动:

1. 从2023年起,定期举办“系统生物学” 线上讲座;

2. 设立“系统生物学”暑期课程;

3. 在现有“肿瘤系统生物学国际研讨会” 【ICSB年度会议】的基础上,举办“系统生物学全国学术大会”。

今年8月26日-27日,由系统生物学专委会联合主办的“第十二届肿瘤系统生物学国际研讨会”已顺利召开,由系统生物学专委会主任、南科大医学院讲席教授徐鹰任大会主席,20位国内外专家进行了精彩报告。该会议共吸引了三百余人在现场参会,一万九千多人在网上参加。

系统生物学系列讲座目前已经确定的特邀报告人依次(按照讲座日期顺序)为:

  1. 南方科技大学徐鹰教授(11月5日)

  2. 苏州大学时玉舫教授(欧洲科学院院士)(11月19日)

  3. Nature Methods资深编辑Arunima Singh博士(12月3日)

  4. 纽约州立大学石溪分校汪劲教授(12月17日)

  5. 中国科学院上海生命科学研究院陈洛南研究员(1月21日)

  6. 北京大学韩敬东教授(2月4日)

  7. 中国科学院数学与系统科学研究院李雷研究员(2月18日)

  8. 西安交通大学于军教授(兼任GPB 主编)(3月3日)

  9. Nature Communications副编辑程谦博士(3月17日)

  10. 北京大学来鲁华教授(3月31日)

除程谦博士讲座于当天北京时间晚8点-9点半进行外,其余均于上午9点-10点半进行。包含50分钟报告时间,40分钟讨论时间。

B站直播二维码如下,欢迎大家扫码并积极极参与。

嘉宾介绍

徐鹰 ,南方科技大学医学院讲习教授

徐鹰 ,南方科技大学医学院讲习教授,获国家级人才头衔,计算系统生物学及生物信息学者。研究方向为肿瘤系统生物学。

2023年1月加入南方科技大学医学院,之前为美国佐治亚大学生物化学系“校董事会教授”及“佐治亚科学协会著名学者讲席教授”(2003-2022),佐治亚大学生物信息研究所首任所长(2003-2011)。

他是AAAS Fellow及IEEE Fellow。1991年获得美国科罗拉多大学计算机科学博士学位(组合数学和算法)。1993年加入美国橡树岭国家实验室,工作十年,历任助理研究员、研究员、资深研究员及课题组长(senior staff scientist and group leader)。2003年,他的研究团队加盟佐治亚大学,成立生物信息研究所,同时入职佐治亚大学生化系。自2008年起,开始通过肿瘤组学数据研究肿瘤发生、发展、转移的推手和机理。

目前徐鹰共发表近400篇学术论文,五部著作,包括世界上第一部“肿瘤信息学”专著,引文 19500余次、H指数为70。自2003年起,每年在国内主持召开“生物信息学国际研讨会(2003-2013),及“肿瘤系统生物学国际研讨会”(2011年起),并每年主讲“生物信息学”或“肿瘤信息学”暑期课程,共吸引3万余人参加。

时玉舫,苏州大学转化医学研究院院长

时玉舫,苏州大学转化医学研究院院长,长期从事免疫与干细胞研究。

1982年本科毕业于山东农学院(现为山东农业大学),1982年至1985年在山东农学院畜牧兽医系担任助教,1988年和1992年在加拿大阿尔伯塔大学获硕士和博士学位,1992年至1995年在加拿大多伦多大学从事博士后研究。1995年至2001年任教于美国乔治•华盛顿大学微生物与免疫学系和美国红十字会赫兰生物医学研究所免疫学系。2001年至2008年,在美国新泽西医科齿科大学罗伯特•强生医学院分子遗传、微生物和免疫学系任终身教授和特聘大学教授。2008年至2014年,任中国科学院上海生命科学院/上海交通大学医学院健康科学研究所所长、研究员。现任苏州大学转化医学研究院院长。

他长期从事免疫与干细胞研究,在探索免疫稳态维持和组织再生修复的细胞与分子机制等方面取得了一系列原创性、突破性和引领性成果。迄今为止,世界上对干细胞与免疫反应相互调控的认知大多源于时玉舫及其团队的科学发现。

Arunima Singh,Nature Methods资深编辑

现任Nature Methods资深编辑。计算结构生物学家,研究领域包括分子建模,蛋白质-碳水化合物和蛋白质-蛋白质相互作用。古吉拉特大学生物化学理学学士、浦那大学生物信息学硕士、佐治亚大学生物信息学博士。

汪劲,纽约州立大学石溪分校教授

汪劲,现任纽约州立大学石溪分校化学和物理及天文系教授,主要从事专业为生物物理、计算生物物理、结构生物学等研究,建立了势和流的景观理论并广泛应用于各类生物及复杂系统。提出了量化特异性的概念和方法并应用于药物设计。

1984年本科毕业于吉林大学物理系,1991年博士毕业于伊利诺斯大学天体物理学,1996年在伊利诺斯大学完成化学和生物物理博士后训练,2000年获得美国纽约大学石溪分校工商管理硕士。

曾任花旗银行全球战略分析部资深分析师及副总裁。欧洲科学院院士,美国科学促进学会会士,美国物理学会会士。

陈洛南,中国科学院上海生命科学研究院研究员

陈洛南,中国科学院上海生命科学研究院研究员,长期采用系统工程、动力学建模等方式研究复杂疾病的发生机制。

1984年本科毕业于华中科技大学电气工程专业,1988年和1991年分别获日本东北大学系统科学硕士、博士学位。1997年起在日本大阪产业大学电气工程和电子学院任教,在日本和美国从事科研教学工作等25年以上,2009年10月加入中科院上海生命科学研究院。

近年来,在系统生物学和复杂网络等研究领域发表了350余篇期刊论文及10余部编著书籍,论文总引用超2万次。并担任中国生物化学与分子生物学会分子系统生物学专业分会主任委员,IEEE-SMC系统生物学委员会主席,中国运筹学会计算系统生物学分会名誉理事长,中国药理学会网络药理学专业委员会副主任委员等。

韩敬东,北京大学教授

韩敬东,北京大学定量生物学中心研究员、北京大学-清华大学生命科学联合中心研究员,现任计算生物学所所长。

1991年获中国药科大学学士,1996年获Albert Einstein College of Medicine 博士、1997-1998年,The Rockefeller University 博士后,1999-2002年进入业界担任IT软件工程师,2002-2004年为Dana Farber Cancer Institute and Harvard Medical School博士后。

研究领域包括发育与衰老的系统生物学、调控网络的计算推理、图像分析,数据集成和网络分析的计算算法开发。

李雷,中国科学院数学与系统科学研究院研究员

李雷,中国科学院数学与系统科学研究院关肇直首席研究员。研究方向包括计算生物学与基因组学、长寿与衰老机制、统计建模与统计计算、时间序列分析、和信息论。

于北京大学获得学士和硕士学位,1998年于美国加州大学伯克利分校统计系获博士学位。2000年9月- 2002年12月加利福尼亚大学洛杉矶分校,纯粹与应用数学研究所,博士后。2002-2010 年在南加利福尼亚大学计算生物及数学系任教并于2005年获得终身职务。

李雷博士与国际著名统计学家、澳大利亚科学院院士 Terence P. Speed教授,计算生物学的先驱、美国科学院院士Michael Waterman教授,老龄研究专家Valter Longo教授等长期合作并取得重要成果。李雷博士与Speed教授发展的DNA测光度校正方法已成为新一代Illumina/Solexa快速测序仪的工业标准。2010年入选中国科学院“百人计划(国外杰出人才)”。

于军,西安交通大学教授

于军,西安交通大学国家生物安全证据基地、北京基因组研究所(国家生物信息中心)荣誉教授,兼任GPB(Genomics, Proteomics & Bioinformatics,基因组蛋白质组与生物信息学报)主编。

研究领域包括基因组学、生物信息学、生物医学仪器。

1983年毕业于吉林大学生化专业,同年考入中科院生物物理所读研,并考取CUSBEA奖学金,于1984年赴美国纽约大学医学院攻读生物医学博士。1990年获得博士学位后在NYU任研究助理教授,1993年加盟华盛顿大学(西雅图)基因组科学系,参与国际人类基因组计划,从事基因组学和生物信息学研究,同时开发相关科学实验设备与仪器。  

于军博士1998年归国后先后参与组建了“华大基因”,中科院北京基因组研究所(包括国家生物信息中心和国家基因组数据中心),参与并主持了国际人类基因组计划(中国部分),以及超级杂交水稻、家蚕、鸡、椰枣、人参、鲤鱼等大型基因组研究计划,两次担任国家973计划的首席科学家。

程谦,Nature Communications副编辑

先后毕业于英国牛津大学、剑桥大学,英国牛津大学Weatherall分子医学研究所计算生物学中心博士后研究员,合作导师为Edward Morrissey博士,研究方向是通过开发和应用数学与统计模型研究组织内的干细胞命运。2022年9月起担任Nature Communications副编辑。

来鲁华,北京大学化学与分子工程学院长江特聘教授

来鲁华,北京大学化学与分子工程学院长江特聘教授、副院长、物理化学研究所所长,北京大学定量生物学中心副主任,北京大学-清华大学生命科学联合中心成员。

研究领域为化学与生物学的交叉研究,主要方向是采用理论计算与实验密切结合的方法定量研究生物分子作用机制并进行蛋白质、药物和生物系统设计。

1984年至1989年,先后在北京大学化学系完成本硕博学习,1998-1999年,美国加州大学伯克莱分校化学系伯克莱学者。1992年至今担任北京大学化学学院教授,2001年被评为北京大学化学学院长江特聘教授。

雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/3l1FjXo99zHDjtuA.html#comments Tue, 24 Oct 2023 17:45:00 +0800
买模型,还是买管线,全球药企拥抱AI大模型进行时 //m.drvow.com/category/healthai/mEKZ9iivTwRd03SX.html 将大型语言模型指向生命科学,将释放出哪些可能?一个最大的利好是:AI制药公司将多出一种新的商业模式。

10月10日,百图生科(BioMap)宣布与全球Top10的医药跨国公司赛诺菲达成战略合作,将这种商业愿景变成现实。

根据协议,双方将基于百图生科所研发的生命科学大模型,共同开发用于生物治疗药物发现的领先模型(用于生物制剂设计和优化的特定任务模型)。

尤为注意的是,此次合作,是生命科学领域首次基于大模型(Foundation Model)的商业合作,并提出以模型开发,而非药物研发进展作为里程碑,为大模型时代中独特的MaaS(Model as a Service)商业模式带来新的案例。

作为本次合作的甲方,赛诺菲最终敲定的预付款为1000万美元,后续将根据模型开发进展,提供分阶段的里程碑付款,预估总交易金额超过10亿美元。

实际上,赛诺菲自从2021年以来,热衷和AI技术路线的新药企合作,短短3年里已和9家专长不一的AI药企深度合作,总潜在价值累计超100亿美元。

也就是说,平均到每家合作企业身上,几乎都是10亿美元的交易金额,同时也意味着,此次赛诺菲与百图生科的10亿合作款项,进一步推动「模型开发」与「AI药物管线研发」两种商业模式并行发展。

换言之,此次直接从模型层合作,将不仅仅是“浅尝”生成式AI,而是彻彻底底的拥抱:赛诺菲自1973年成立以来所积累的专有数据集、数字基础设施、人工智能、数据科学能力,以及药物开发专业知识,将作为合作内容的一部分大规模释放。

与此前跨国药企的“买买买”(license-in),或从0到1自建AI研究部门不同,新的模型合作开发方式,将一定程度上保证基础数据源的有用性、安全性,并调动公司自有生物学家的支持。

合作消息传出次日,百图生科CEO刘维在朋友圈写道,“生命科学基础大模型是大模型的下一个,或者潜在的最大战场,我们坚信。”

该条动态发布后不久,很快便留下不少立足做AI biothch的公司高层点赞,其中就有去年同样拿到赛诺菲订单的英矽智能。

这让人不免期待:在制药这条旷日持久的战事中,能否有望借助大模型技术,重塑市场新格局。

为何赛诺菲偏偏看上了百图生科?

近期雷峰网《医健AI掘金志》与不少业内人聊起,一个共识是:“国外投资圈的热情明显高涨了不少,最近正在AI制药疯狂扫货,英伟达、a16z (Andreessen Horowitz)几乎并着肩在投。”

比如AI制药领域的BigHat Biosciences、insitro、deepcell、Dyno Therapeutics、Genesis Therapeutics等初创公司,以及目前尚未自证的AI制药的biotech。甚至a16z还打造了一个独立的子品牌a16z bio+health,通过筹集专门的生物医药资金,扶持该领域的初创企业。

如此高调的背后,并非一概而论的“炒作”。实际上,如今进展最快的一批AI制药公司,已经迎来了盈利期。

拿AI制药公司英矽智能来看,已经有2~3款药物进入临床II期,前不久将1条管线与肿瘤药企交接,获得了8000万美元的亚太区最大一笔授权交易。

这一事件AI制药领域的里程碑事件,引来不少跨国药企和biotech公司的关注。

“大家都在看,AI+制药这条路能否趟平,或者说用数据及自动化手段能不能做出药来。”一位业内人讲到,“但无论如何,生命科学融资开始升温,也让一众具有底层技术能力的企业涌现,类似国内公司百图生科这样的存在。”

毫无疑问,早在2020年就被李彦宏单拎出来成立的百图生科,在这场赛事获得先发优势。

百图生科CEO刘维曾介绍:“公司创立之初就希望,围绕着难成药靶点全新蛋白等实验筛选手段筛不出来的领域,利用大模型对于弱关联语料的处理能力,从海量的生物数据里面提取对科研人员有意义的规律,为行业提供更好的生物地图(BioMap)。”

成立三年来,百图生科组建了超过300名人工智能和生物科学领域的专家团队,终于在今年3月正式推出生命科学领域的AI大模型体系--xTrimo。

当前,该模型已拥有超过1000亿参数,在抗体结构、抗体亲和力、酶功能、免疫细胞功能等 20 多个下游预测任务中实现了SOTA表现。

据百图生科团队介绍,“赛诺菲选择与我们合作,正是认识到我们在高质量数据挖掘和利用、跨模型数据集成和分析、任务模型开发和工业效率提升等方面的优势和潜力。”

团队着重指出,百图生科的核心技术在于,使用大规模未标记数据集进行模型训练。

在人工智能领域,传统方法需要大量标记数据才能进行准确预测。然而,生命科学行业中的标记数据往往存在着供应不足的问题。

为此,百图生科研发团队正致力于通过训练一个大参数模型。该模型使用普遍的未标记数据来为多个下游任务模型提供信息。这种方法使得包括免疫学、神经学、肿瘤学和罕见疾病在内的多个领域能够基于有限的数据进行更精准的预测。

此次与赛诺菲的战略合作中,赛诺菲的专有数据、蛋白质工程创新、丰富的生物制剂研发经验,也奠定了本次合作的重点是:开发用于生物制剂设计和优化的特定任务模型。除此之外,百图生科平台也将获得进一步突破迭代能力。

那么,此次合作的更深一层意味是,在全球顶级药企和AI制药公司的强强联手下,生物医药行业能否借助大模型的能力,迎来真正的机遇期?

雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/mEKZ9iivTwRd03SX.html#comments Thu, 12 Oct 2023 10:47:00 +0800
2023华东医院信息网络大会,将于11月在沪隆重召开! //m.drvow.com/category/healthai/dFd35EPRlzofoKfJ.html  医院信息化建设发展至今,越来越对“智能化”水平提出全新要求。

《“十四五”全民健康信息化规划》中明确,要以数据资源为关键要素,以新一代信息技术为有力支撑,以数字化、网络化、智能化促进行业转型升级,重塑管理服务模式,将启动数字化智能化升级改造工程,将信息化纳入国家区域医疗中心建设范围,支持省级区域医疗中心加强智慧医院建设。       

医院信息化是支撑医院高质量发展的关键。

为推进 “三位一体”智慧医院建设,推进医院信息化建设标准化、规范化水平,落实国家和行业信息化标准,交流信息化发展规划、信息化人才培养、新技术应用推广等行业经验,切实发挥信息化支撑医院高质量发展的关键作用。            

在数字中国、健康中国的大背景下“2023华东医院信息网络大会”将于11月在沪隆重启幕!

本次大会将解读最新产业政策、分享最前沿的技术成果、全面链接政产学研用多方平台、剖析产业未来发展趋势、提供全产业链精准资源对接,为一直在路上的医信人,找到新启发与新解法。

一、会议名称 :

2023华东医院信息网络大会

二、会议主题  :

智慧世界   拥抱变革

三、时间·地点:

时间:2023年11月17--19日   

地点:上海新国际博览中心

四、组织机构:

主办单位:

中国信息协会医疗卫生和健康产业分会

智慧医疗网

智慧产业网

科雷会展 

支持 /协办单位:

中国电子商会数字医疗与健康专业委员会

中国科技产业化促进会数字健康专业委员会

中国医学装备协会检验医学分会

中国设备管理协会医疗行业分会

中国医疗器械采购公共服务平台

雷峰网

医健AI掘金志

医盟网信息化联盟

数科邦 

承办单位:  科雷会展

五、为何值得参加:

1、时下高峰话题深度热议、行业趋势尽在掌握

2、聆听权威重磅专家的真知灼见,碰撞思维、共谋发展大业

3、深度解析医院信息化建设发展现状,多维探索行业场景改造与变革

4、精准聚焦华东区域 、洞悉未来合作机遇

5、品牌新秀展示弯道超车技术、带来行业前沿洞察

6、主流媒体深度参与、峰会盛况实时追踪

六、大会媒体:

腾讯网  凤凰网  今日头条  抖音  艾瑞网  智慧医疗网  新浪  健康报 雷峰网   医健AI掘金志   财经大健康  健康界  动脉网  HC3i数字医疗网  医学猫  中国基层卫生网  中国医采网  华夏医界网  医学界  健康县域  医盟网  连线CIO  亿欧大健康  贝壳社   器械之家  高看医点     高通资讯     全球医疗器械网  医疗科技网  Q医网  亿邦动力网  科讯医疗网  来宝网  医疗设备信息网  医信通  大健康派   医信邦  医趋势   医疗器械创新网  环球医疗器械网  中国会展网  物联网世界   中国医院管理杂志  镁客网   雪球网   南方科技网   商业观察网  美通社  新康界  康强医疗人才网  医谷  极客网  前瞻网  新物联  智汇工业  互动吧  百格活动  活动网  医路快建  畅享网  中国现代医院管理网  CIO时代  赛迪网  飞象网  RFID世界网  中国物联网

七、大会时间安排:

11月17日(星期五):大会报道、展商布展

11月18日(星期六):主、分论坛、展览参观

11月19日(星期日):分论坛、展览参观

大会出席及拟邀嘉宾(排名不分先后)

国家及省市卫健委领导    

两院院士

宋   新   中国信息协会医疗卫生和健康产业分会会长

陈建平   上海市医院协会会长

闫东方   上海市社会医疗机构协会会长

鲁   翔    江苏省医院协会会长

马伟杭   浙江省医院协会会长

许戈良   安徽省医院协会会长

冯俊杰   中国设备管理协会医疗行业分会秘书长

倪武明   中国设备管理协会医疗行业分会副秘书长兼商务处主任

何   萍   上海申康医院发展中心医联工程与信息化部主任

张治芬    杭州妇产科医院(杭州市妇幼保健院)院长

刘卫东   上海国际医学中心院长

杨晓东   上海儿童医院副院长

赵海鹏   同济大学附属同济医院副院长

许朝晖   上海东方医院副院长

俞   刚   浙江大学医学院附属儿童医院副院长  

李济宇   华东医院副院长

丁克峰    浙江大学医学院附属第二医院副院长

朱晓慧    南京市中医院副院长

陈   明    东南大学附属中大医院副院长

沈旭东    上海永慈康复医院院长

李秋明    上海爱尔眼科医院首席执行官

邹晓平    泰康仙林鼓楼医院院长

李爱川    东方华康医疗集团总裁、总院长

宋冬雷    上海东雷脑科医院院长

蔡剑飞    上海天佑医院院长

黄伟飞     丽水市松阳县中医院党委书记

夏永法    湖州市安吉县中医院党委书记

陆文佐    上海杨思医院院长

陈瀚平    上海赤峰医院院长

高家彦    常州西太湖医院院长

徐孝华    南通瑞慈医院院长

葛江平    南京紫金医院院长

葛   丰    上海嘉会医疗CEO

王   健     温州康宁医院互联网医院院长

张澄宇    和睦家医疗上海地区总院长

程传苗    上海大学附属孟超肿瘤医院院长

孙成彦    上海壹博医院院长

马超荣    上海嘉华医院院长

徐洪涛    苏州九龙医院常务副院长

潘奎静    南京明基医院副院长

赵   艳    上海交通大学医学院附属瑞金医院信息中心主任

黄   虹    复旦大学附属华山医院大数据中心主任

张   琪    复旦大学附属华山医院信息中心主任

钱   琨    复旦大学附属中山医院信息与智能发展部主任

林   辉    浙大邵逸夫医院互联网与人工智能办公室主任

江   静    南京市妇幼保健院信息科主任

王忠民    江苏省人民医院信息处处长

董   亮    上海中医药大学附属龙华医院信息中心主任

张纪阳    复旦大学中山医院大数据中心主任

吴   斌    宁波市第一医院信息科主任

陶   敏    安徽医科大学第一附属医院信息中心主任

胡志坚    福建医科大学附属协和医院信息管理处处长

汪春亮    苏州大学附属第二医院信息处处长

陈   斌    杭州市第一人民医院信息中心主任

葛小玲    复旦大学附属儿科医院统计和数据管理中心主任

周   敏    浙江大学附属第一医院信息中心主任

辛海燕    青岛大学附属医院信息管理部主任

李振叶    厦门大学附属妇女儿童医院信息部主任

沈玉强    浙江大学医学院附属第四医院信息中心主任

汪   涛    安徽中医药大学附属第一医院信息中心主任

柳维生    苏州市立医院信息科主任  

孙   木    上海交通大学医学院附属瑞金医院统计信息科主任

郑   涛    上海交通大学附属仁济医院信息中心主任

高志宏    温州医科大学附属第一医院信息处处长

许   杰    浙大医学院附属第二医院信息处处长

秦舒能    杭州市中医院信息部主任

王   淑    上海市儿童医院信息中心主任

胡伟国    上海交通大学医学院附属瑞金医院副院长

庄思良    上海市第一妇婴保健院信息科科长

林志刚    福建医科大学附属第一医院信息中心主任

夏洪斌   上海市第十人民医院信息管理处处长

曹   坤    台州恩泽医疗中心(集团)恩泽医院信息中心主任

朱   晨    苏州大学附属儿童医院信息处处长

王   奕    复旦大学附属肿瘤医院信息中心主任

金宪珊    树兰(杭州)医院信息中心主任

费科锋    浙江医院信息中心主任

胡梅英    江西省儿童医院信息科科长

王   伟    浙江省中医院信息中心主任

缪   崇    福建省妇幼保健院信息中心主任

曹新志    江苏省中西医结合医院信息中心主任

叶正强    复旦大学附属眼耳鼻喉科医院信息中心主任  

毛俊华    上海市中医医院信息处处长

文中秋    上海市浦东医院信息科主任

覃开舟    复旦大学附属妇产科医院信息科科长

张代华    南京医科大学第二附属医院信息化建设与管理处处长

史亚香    东南大学附属中大医院信息化建设总工

袁骏毅    上海胸科医院信息中心主任

冯   杰     复旦大学附属华东医院信息科主任

邢建宾    和睦家医疗IT部副总裁、医院信息中心主任

应华永    浙江金华广福肿瘤医院CIO

吴先平    复旦大学附属上海市第五人民医院信息科主任

邱   宏    上海市精神卫生中心信息中心主任

张   雄     复旦大学附属徐汇医院信息中心主任

宣   琦     上海市中西医结合医院信息处处长

金文忠    上海交通大学医学院附属第九人民医院信息中心主任  

陈嘉旖    上海市肺科医院信息处处长

俞   磊     上海市第六人民医院信息处处长

夏   新     上海东方医院信息中心主任

庄一渝    浙江大学医学院附属邵逸夫医院护理副院长兼护理部主任

朱唯一    上海交通大学医学院附属瑞金医院护理部主任

王华芬    浙江大学医学院附属第一医院护理部院长助理、护理部主任

陆群峰    上海交通大学医学院附属儿童医院护理部主任

张   琼     浙江省人民医院护理部主任

陈   雁    南京鼓楼医院护理部主任

兰美娟    浙江大学医学院附属第二医院护理部主任

王   荣    江苏省人民医院护理部主任

张玉侠    复旦大学附属中山医院护理部主任

胡三莲    上海交通大学附属第六人民医院护理部主任

陆箴琦    复旦大学附属肿瘤医院护理部主任

丁   焱    复旦大学附属妇产科医院护理部主任

朱晓萍    同济大学附属第十人民医院护理部主任

毛燕君    上海市肺科医院护理部主任

刘晓芯    上海市胸科医院护理部主任

金咏梅    上海市第七人民医院护理部主任

陈   莹    上海市第四人民医院护理部主任

江   会   上海市第一妇婴保健院护理部主任

顾   莺   复旦大学附属儿科医院护理部主任

马宗庆    浙江省台州医院信息科主任

许亮业   上海交通大学医学院附属上海儿童医学中心信息中心主任

曹   波   上海市浦东新区公利医院信息科科长  

傅春瑜   上海市第一人民医院信息处处长

葛茂军    上海中医药大学附属曙光医院大数据中心主任 

徐铖斌    上海中医药大学附属曙光医院信息中心主任

景慎旗    江苏省人民医院数据应用管理中心主任

陈   磊    中国福利会国际和平妇幼保健院信息科科长

严心远    复旦大学附属华山医院互联网办公室主任

鲍   瀛    南京鼓楼医院信息中心主任

陈   杰    浙江省人民医院信息中心主任

王   伟   浙江省中医院信息中心主任

寇建秋   江苏省中医院信息数据中心主任

沈玉强   浙大四院信息中心主任

瞿怀荣   连云港市第一人民医院信息部主任

孙善志   连云港市第二人民医院信息处处长

何剑虎   浙江大学医学院附属妇产科医院信息中心主任

田   昕    杭州师范大学附属医院信息部主任

李   尚   杭州市第三人民医院信息中心主任

章俊航   浙江大学医学院附属精神卫生中心信息中心主任

王金华    江苏省肿瘤医院信息中心主任

陈潇君    江苏大学附属医院信息处处长

孙   勇    南京医科大学第四附属医院信息中心主任

蒋   艳    苏州高新区人民医院信息科科长

鲁   峥    南京市儿童医院信息科主任

马江华    复旦大学附属中山医院青浦分院信息中心主任

嘉宾持续更新中……

九、大会聚焦内容:

1、 “十四五”智慧医院发展政策解读与未来展望

2、  医院高质量发展的信息支撑

3、  5G智慧医院

4、  物联网赋能智慧医院
5、  互联网+医疗健康
6、  县域医共体信息化  
7、  电子病历迭代升级
8、  重新定义智慧病房
9、  区块链与云计算
10、 网络与信息安全
11、 合理用药与智慧药房
12、 人工智能在智慧医院的创新应用
13、 智慧医院数据中心建设
14、 DRG/DIP下,医院信息化建设要点
15、 新形势下智慧医院绩效管理的实施
16、 医院数据治理与应用
17、 设备智能化管理
18、 智慧医院--智慧医疗
19、 智慧医院--智慧服务
20、 智慧医院--智慧管理
21、 智慧医院--智慧中医
22、 智慧医院--智慧妇幼
23、 智慧医院--智慧护理
24、 智慧医院--智慧教学科研
25、 智慧医院--智慧运营 
26、 智慧医院--智慧临床
27、 智慧医院--智慧医技
28、 智慧医院--智慧运维

十、大会活动安排

一、2023华东医院信息网络大会开幕式

二、中国医疗行业信息化年度评选暨颁奖典礼

三、主论坛:2023华东医院信息网络大会主论坛

四、分论坛:

1、院长论坛

2、现代医院多院区信息化建设分论坛

3、妇幼卫生机构信息化建设分论坛

4、智慧医院数据治理与医疗大数据分论坛

5、非公医院信息化建设分论坛

6、智慧医院护理信息化分论坛

7、智慧医院DRG/DIP信息化建设分论坛

8、医院网络信息安全分论坛

9、智慧医院人工智能创新应用分论坛

10、智慧医院物联网创新应用分论坛

11、医疗信息化IT新技术发展及应用分论坛

十一、参会人员:

1、国家及各省市卫健委领导;全国各省市、医院协(学)会、医学会等代表;

2、各级卫生健康行政部门负责人、两院院士、医疗信息化相关管理人员;

3、各类医疗卫生机构负责人、信息化工作主管领导、专业技术人员,以及医院临床、教学、科研、运营、财务等专业技术人员;

4、高等院校、科研机构医疗卫生信息化专业技术人员;

5、医疗信息技术研发、产品生产、经营、服务的企业管理人员和技术人员。

十二、参会注册费:

一、 参会代表1800元/人(注册费包含:会务费、资料费、餐费)二、 注册费优惠如下:

1、 参会代表注册两人以上(包含两人)1500元/人

2、 参会代表注册三人以上(包含三人)1200元/人

十三、参会报名:

李老师:18916841069;邮箱:2314180965@qq.com

张老师:18121005829;邮箱:3383001848@qq.com

李老师:15800928898;邮箱:173676954@qq.com  

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/dFd35EPRlzofoKfJ.html#comments Mon, 25 Sep 2023 20:03:00 +0800
百度发布国内首个“产业级”医疗大模型,正式面向大健康上下游产业开放测试 //m.drvow.com/category/healthai/58fK4WSDIf0odoMt.html 9月19日,百度正式发布国内首个“产业级”医疗大模型——灵医大模型。

发布会上,百度正式宣布面向大健康上下游产业开放灵医大模型测评、试用,推动医疗行业的数字化和智能化进程。

百度集团资深副总裁、大健康事业群总裁何明科表示,灵医大模型目前已经和很多客户达成商业合作,深度共创了很多好的应用,致力于帮助客户提升运营效率,促进商业增长。


首个“产业级”医疗大模型发布,服务行业全产业链

灵医大模型是国内首个“产业级”医疗大模型,也是国内首个实现商业化落地的医疗大模型。

据了解,灵医大模型已与固生堂、零假设等达成合作,并已定向向公立医院、药械企业、互联网医院平台、连锁药房等200多家医疗机构开放体验。目前,灵医大模型推出Lite版、旗舰版、定制版三个版本,分别对应不同需求和应用场景,合作伙伴可通过API方式调用大模型能力,或以插件形式将大模型能力嵌入到已有产品系统中,打造AI原生的应用产品。

“目前行业呈现出百模混战的局面,很多服务效果不达标的大模型产品出现,为行业发展带来负面影响,”百度大健康事业群AI产业部总经理刘军伟表示:“作为产业级大模型,服务场景必须要覆盖整个大健康产业链,包括公立医院、科研机构,也包括药械企业、互联网医院平台等全产业链。”


会上,北大口腔医院、北京人卫智数科技、健康之路等医药行业客户代表,分别对和百度灵医大模型的合作进行了探讨与展望,从专科模型共建、技术能力整合到上层应用服务,灵医大模型为不同产业客户带来了不同场景的期许,未来将全面赋能产业端发展。

“模型即服务,灵医大模型希望打造AI原生的多层次产品体系。”刘军伟表示,“基于数据预训练、微调的灵医大模型具备强大的开放能力,支持生态伙伴进行API调用、插件集成,为终端用户提供完整服务。”

面向大健康上下游开放测试,为医疗服务提质增效

此次,百度宣布向大健康上下游产业开放灵医大模型邀测,在国内医疗大模型行业尚属首次。

灵医大模型聚焦智能健康管家、智能医生助手、智能企业服务三大方向,为患者、医院、企业等提供AI原生应用。

据了解,灵医大模型能够结合自由文本秒级生成结构化病历,根据医患对话精准分析生成主诉、现病史等内容。此外,灵医大模型也是业内唯一支持多篇中英文文献同时解析的大模型,基于文献解析内容实现智能问答。在辅助诊疗方面,灵医大模型可实现通过多轮对话了解病人病情,实时辅助医生确诊疾病,推荐治疗方案,提升就诊全流程的效率和体验,并成为患者的24小时“健康管家”,提供智能客服服务。此外,灵医大模型还能为药企提供多项赋能,包括专业培训、医药信息支持等等。

活动现场,中医医疗服务龙头固生堂分享了和灵医大模型的合作情况。固生堂利用灵医大模型提供的底层技术能力,重构了线上诊疗业务,并推出了面向患者的智能健康助手,24小时在线为患者提供精准的分导诊和智能客服能力,并且支持开放式的医学和病情问答。根据最新调研数据,合作以来患者挂号体验满意度提升了12%,客服人员工作效率提升76%。数字健康医疗服务平台健康之路分享了基于灵医大模型实现智能医患对话并辅助生成结构化病历等场景,提供患者个性化健康服务。


海量数据、文心大模型技术底座加持,各项成绩遥遥领先

作为全球领先的AI科技公司,百度打造医疗大模型具有天然的优势和深厚的积累,在数据量、技术底座等方面均领跑行业。

数据方面,灵医大模型致力于实现“循证AI赋能大健康产业”,确保医疗数据的准确性和可靠性。灵医大模型持续输入百度沉淀的覆盖“医-患-药”全场景的医疗健康数据和权威医学知识,包括线下诊疗场景的脱敏病历、文献指南、医疗知识图谱数据,线上场景的科普知识、健康医典、健康咨询数据,以及贯穿全生命周期的全球药品器械数据等。优质的训练语料,保证了大模型的回答有源可溯。


技术底座方面,根据IDC发布《AI大模型技术能力评估报告,2023》,灵医大模型的技术底座百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一,体现了百度文心大模型的基础技术深度和产业应用覆盖广度。

灵医大模型在发布前也经历了一系列严格的“考试”。上百名三甲医生在安全性、正确性、逻辑性、理解力和完整性等五个维度对市面上的大模型产品进行重点考察,灵医大模型多维度领先同类模型。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/58fK4WSDIf0odoMt.html#comments Wed, 20 Sep 2023 10:24:00 +0800
罗氏诊断携手迪英加科技,借力AI助推病理诊断智慧化转型 //m.drvow.com/category/healthai/A0Kxc11YYDbUxi70.html 随着肿瘤精准医疗时代的到来,作为肿瘤诊断“金标准”的病理诊断亟需在效率和质量上突破瓶颈,以更好地满足临床及患者对于个体化精准诊疗的需求,而方兴未艾的人工智能(AI)技术为病理诊断的提质增效开辟出了崭新路径。

近日,罗氏诊断中国(以下简称“罗氏诊断”)宣布与迪英加科技有限公司(以下简称“迪英加”)正式达成合作,共同推出病理人工智能AI辅助判读算法产品,进一步助推中国病理诊断的数字化、智慧化转型,为个体化精准诊疗的发展提供有力支撑。

AI加持,驱动病理诊断新变革

在病理诊断数字化、智能化的创新发展趋势下,罗氏诊断在原有的病理诊断核心产品优势的基础之上,以AI病理分析模块为创新引擎,着力打造智慧病理整体解决方案,推动病理诊断创新变革。

随着此次双方合作的达成,覆盖从数字化扫描到AI辅助诊断的“诊扫一体”全新解决方案正式落地。依托罗氏诊断VENTANA DP 200和DP 600数字病理切片扫描仪的高清晰、全视野数字化图像与迪英加的病理人工智能AI辅助判读算法,实现了病理实验室硬件与智能化算法的充分融合,全面助力病理医生精准、高效判读病理切片。

据悉,此次合作的算法包括HER2、ER、PR、Ki-67、PD-L1病理人工智能AI辅助判读算法,这些具有高医学价值的免疫组化生物标志物检测实现智慧阅片,为乳腺癌和非小细胞肺癌的病理诊断和精准用药再添“利器”。其中,HER2作为乳腺癌重要的驱动基因,是靶向治疗的主要疗效监测及预后指标。近年来靶向HER2抗体偶联肿瘤药物的推出,为HER2低表达转移性乳腺癌患者带来了靶向治疗新选择。同时,HER2低表达的判读也为病理医生带来新的挑战。此次合作的HER2、ER、PR、Ki-67病理人工智能AI辅助判读算法,能够辅助病理医生更加准确、高效、客观地定量分析乳腺癌患者的分子分型,并为HER2表达尤其是低表达的判读提供精准定量统计的有力支持。

此次合作的AI辅助判读算法产品也将整合于罗氏诊断数字病理开放平台,成为罗氏诊断中国数字化智慧病理整体解决方案中的重要一环。

Michael Rivers先生

罗氏诊断全球数字病理生命周期负责人

“人工智能在病理领域具有巨大的应用潜力与广阔的发展前景。AI辅助判读可以有效提升病理医生判读的一致性和工作效率,尤其是在一些判读难度较大、半定量的免疫组化生物标志物的判读上,应用价值尤为可观。依托此次双方的紧密合作,不仅将为病理医生带来新的医疗价值洞察,也将为患者精准诊疗带来切实获益。”

集智汇策 共塑智慧病理新生态

作为一家对病理诊断发展趋势具有前瞻性洞察力的全球性企业,罗氏诊断始终高度重视深化本土合作,携手优秀的本土企业及人才,共建我国创新、开放的智慧病理新生态。 

杨林先生

迪英加科技有限公司创始人兼董事长

“作为全国领先的数字化智慧病理解决方案提供商,迪英加一直致力于通过将AI算法与病理诊断相结合,打造高效、精准的辅助诊断解决方案,为病理学科的创新发展提供坚实助力。此次与罗氏诊断的合作,让我们将‘中国智慧’和‘全球创新’进行无缝整合,共同推动智慧病理新生态在中国的发展。”

姚国樑先生

罗氏诊断中国总经理

“此次合作标志着罗氏诊断在深化‘在中国,为中国’的理念上又迈出了重要一步。数字化创新是罗氏诊断的业务重点,也是未来病理诊断发展的重要方向。相信通过我们双方协力,将以更高效、精确的病理诊断整体解决方案,赋能个体化精准诊疗,惠及更多中国患者。未来,罗氏诊断将继续以开放共赢之势、携本土创新之力,集智汇策,共建疾病诊疗生态圈,共塑中国智慧病理新未来。雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/A0Kxc11YYDbUxi70.html#comments Fri, 08 Sep 2023 12:09:00 +0800
谁在挑战癌症,人类胜算几何?|ICSB20位学术派大论道 //m.drvow.com/category/healthai/K0qugepxNyz8TR0X.html 近日,第12届肿瘤系统生物学国际研讨会(ICSB 2023)在南方科技大学落下帷幕。

本次会议由南方科技大学医学院、中国生物信息学学会(筹)、吉林大学计算机科学与技术学院、中国生物信息学学会(筹)系统生物学专委会,及广东省生物信息学学会联合主办。

会议由南科大医学院讲席教授徐鹰任大会主席,特邀20位专家进行精彩报告。

其中十位来自国内的肿瘤学者,有苏州大学转化医学院院长时玉舫、浙江大学转化医学研究院院长吕志民、北京大学教授兼云南白药集团首席科学家张宁、北京大学终身讲席教授张泽民等。

十位来自海外的华人肿瘤学者,包括美国圣犹达儿童医院的迟洪波教授、美国范德堡大学医学院系主任及讲席教授石瑜、美国卫理公会医院系统生物学系主任及讲席教授王天赐、美国埃默里大学肿瘤中心教授俞锦丹等。

会议上,专家们从多个角度出发,在系统的层面上探讨了肿瘤形成、发展的推手以及分子机理,涵盖肿瘤治疗、肿瘤免疫、肿瘤耐药、肿瘤转移相关的重要科学问题、以及如何通过对肿瘤组学数据的分析及数学建模来助力传统肿瘤实验科学探索所面临的挑战。

据悉,本次大会共吸引了三百余人现场参会,一万九千多人线上参加。2024年,第13届肿瘤系统生物学国际研讨会及肿瘤信息学课程将继续在南科大举办。

雷峰网《医健AI掘金志》作为大会首席合作媒体,对 ICSB 2023大会进行精编报道。

时玉舫,苏州大学转化医学研究院院长,长期从事免疫与干细胞研究,本次演讲主题为《MSC(间充质干细胞)调节的组织微环境与肿瘤发展》。

时玉舫介绍,自2004年起,团队就开始将过去在免疫学研究上的经验融入到干细胞研究中去,经过多年的积累,团队发现间充质干细胞在疾病治疗中所起到的作用,并非是大家所想的取代衰老、损伤的细胞,而是对身体炎症有着强大的反应能力,通过刺激免疫细胞产生大量的细胞因子来调动组织细胞。

对人体来说,肿瘤是一个无法愈合的创伤。通过实验,时玉舫团队发现小鼠体内的肿瘤会不断地招募周围的间质干细胞。并且,肿瘤内部的间质干细胞有着不同的特性,通过与免疫细胞之间的相互作用对肿瘤有着重要影响,包括调控肿瘤微环境,控制肿瘤的生长以及对药物的抵抗性等。

迟洪波,美国罗切斯特大学教授,研究方向为免疫代谢、T细胞生物学和系统免疫学。本次演讲主题为《T细胞代谢和免疫肿瘤学的功能基因组学》。

肿瘤免疫和肿瘤代谢是近年来在肿瘤生物学中进展非常快的两个领域,迟洪波及其团队将免疫学与代谢结合起来,研究肿瘤微环境下代谢通路在免疫细胞中的调控机制。

迟洪波介绍,不仅细胞的信号通路可直接调控免疫和代谢,同时代谢产生的一些小分子还可以直接反作用于信号通路。

在演讲中,迟洪波介绍了团队近期主要研究的两个问题:T细胞内的代谢过程如何被调控,以及肿瘤代谢如何调控细胞之间的相互作用。

根据迟洪波的研究,T细胞的生长和活动需要各种营养物质,而营养物或代谢物与免疫通路之间的相互作用则影响着T细胞的功能活化。

在肿瘤微环境中存在着多种不同的代谢物,为各种不同的细胞提供营养,当两种细胞所需的营养物相同时,就会出现互相竞争作用。肿瘤分泌的代谢废物也会直接抑制T细胞的功能。

针对肿瘤微环境中复杂的调控关系,迟洪波实验室采取了系统免疫学的方法,利用各种层次的组学大数据来获取生物学信息。

迟洪波指出,基因编辑是进行组学大数据筛选最直接、有力的研究手段,可以直接找出基因与功能之间的联系。利用基因编辑和组学大数据筛选,迟洪波发现了T细胞的负向调控因子——REGNASE-1,当REGNASE-1失活后,T细胞的功能会得到极大的提升。

程飞雄,美国克利夫兰诊所基因组医学研究所、凯斯西储大学医学院分子医学系助理教授,研究方向为心脏肿瘤学(Cardio-Oncology)。本次演讲主题为《利用多组学和网络系统生物学实现精准癌症医学》。

长期以来,程飞雄实验室基于人工智能、大数据、基因组学、多组学等技术寻找可用的药物靶点,并基于这些靶点进行转化医学的研究。

程飞雄指出,过去二三十年中,人们常利用循证医学策略测试肿瘤药物在大规模病人中的平均效果,但这一方式在临床上存在一些缺陷,有很多好的药物在这种测试模式中无法取得成功,因为很多肿瘤药物只能适用于其中一部分的病人。

过去几年间,人们逐渐开始尝试精准医学的临床试验,使肿瘤药物的实验成功率从5%一举提升至26%。

为了更好地预测肿瘤靶点,程飞雄团队利用蛋白相互作用网络技术对多组学数据进行整合,再利用算法快速找到代表疾病的网络模块,并用网络模块来理解疾病。

程飞雄认为,在未来的肿瘤治疗中,人们不仅仅要关注肿瘤本身,更应该去探索如何更好地预防肿瘤,尝试利用大数据的方法预测肿瘤的高发风险。

Jindan Yu,美国埃默里大学医学院泌尿外科代理教授,研究方向为泌尿系统肿瘤、前列腺癌等。本次演讲主题为《基于谱系可塑性的转录组、表观基因组和4D 核组》。

她介绍了团队在前列腺癌研究领域的成果,重点关注了细胞谱系可塑性和去分化过程,并探讨了Polycomb Repressive Complex 2 (PRC2)中的主要成分EZH2在癌症中的作用。

团队发现,EZH2不仅能够调节发育调节因子,还可以激活肿瘤细胞的抗原受体,诱导特定的交叉癌症生长。此外,团队还发现了新的蛋白质PALI 1,并探讨了它在癌症中的作用。这些发现为开发针对前列腺癌的治疗方法提供了新的思路。

吕志民,浙江大学转化医学研究院院长,研究方向为肿瘤学和细胞信号转导,本次演讲主题为《癌症代谢中的阴和阳》。


在演讲中,吕志民介绍了肿瘤中的糖代谢和脂代谢两大代谢类型,指出糖和果糖在正常细胞和肿瘤细胞中存在着代谢差异。

吕志民指出,糖代谢和脂代谢在肿瘤中受到了多种调节机制的影响,与正常细胞相比发生了显著的重调,其中肿瘤细胞特有的Warburg效应是精准医疗的主要目标之一。

在肿瘤代谢过程中,关键的转录因子和调节因子如SREBP、PPARy、AKT等发挥着重要作用。通过深入研究这些调节机制,可以更好地理解肿瘤的生长和转移,并为肿瘤治疗提供新的靶点。

施思,复旦大学肿瘤医院胰腺肿瘤外科副主任医师,专注于胰腺、胆道、脾脏、十二指肠、壶腹部肿瘤的外科微创、开放手术和综合治疗。本次演讲主题为《拥抱精准,走向卓越》。

施思介绍,胰腺肿瘤外科在建立之初是以手术的根治性、安全性为首要目的。然而,近年来随着学科发展,越来越多的关注点逐渐转向手术有效性与精准治疗的方向。

当前,决定能否进行胰腺癌手术仍取决于形态、解剖学的评估,这是胰腺癌诊疗模式普遍面临的困境。未来,应该更多地考虑转变为依据肿瘤生物学行为评估,考虑患者能否从手术中获益。

针对手术不获益患者的的个性化治疗,目前还缺乏客观明确的指标用以选择治疗方案。为解决这一问题,胰腺肿瘤外科团队提出了以间质比例为依据进行化疗前的评估方案。

张宁,北京大学医学部副主任,长期从事生物医学研究,围绕肝癌这一临床难题,从分子线索、细胞生物学、药物筛选、纳米技术等多个方面手展开转化应用研究。本次演讲主题为《肝癌表型和单细胞异质性》。

张宁介绍,对于中晚期的肝癌患者的靶向治疗,仍存在两个尚未明确解决的问题。一是缺乏精准诊疗方案,医生难以确定哪款药物最适合患者;二是由于患者的免疫微环境存在异质性,靶向药物仍对很多病人无效。

为制定精准诊疗方案,张宁团队采集了一百多位患者的样本,并将这些样本制作成了四百余个类器官,从中探索患者之间的基因组异质性、药敏异质性等。

获得了这些重要的基因组信息、药物敏感性数据以及患者的临床信息后,即可借助模型来预测哪些药物最适合特定患者。

胡政,中国科学院深圳先进技术研究院研究员,研究方向为计算生物学,本次演讲主题为《用单细胞谱系追踪解码体细胞进化》。

胡政介绍,研究者们做细胞命运轨迹推断时,常使用RNA速率模型来对基因转录过程进行建模,根据unspliced mRNA随时间变化的速度,来预测细胞未来动态的轨迹。

胡政及其团队创新性地将谱系数据与单细胞转录组的数据进行融合,不仅可检测每个细胞表达的基因,还可直接获得细胞之间的谱系关系,从而能更全面地了解肿瘤内部包含哪些细胞、如何进行分化、命运决定机制等问题,并能更全面地分析肿瘤的演化过程及其背后的驱动机制。

王天赐(Stephen T. Wong),美国康奈尔医学院Methodist医院杰出讲席教授,研究方向为系统生物学。本次演讲主题为《磷脂酰乙醇胺在肥胖症中的过量会加剧阿尔茨海默症和癌症》。

王天赐指出,根据美国疾病控制与预防中心发布的数据,肥胖与包括肺癌、食道癌、子宫癌在内的十三种癌症均有关联。此外,肥胖还会导致认知能力下降,增加出现阿尔兹海默(AD)症的风险。

王天赐团队从代谢的角度进行研究,将磷脂酰乙醇胺(PE)作为肥胖个体的区分标志,发现通过Cdp-乙醇胺途径从头合成PE的这一改变,促进了外周组织癌症和中枢神经系统AD的进展。

当PE过高时,会导致中枢神经系统和外周组织中脂质的累积,促进了AD和肿瘤模型中的LD积累,并刺激LD通过钝化脂解促进上皮-间充质转化。最终,这些代谢变化加重了癌症的病程和AD的发病风险。

同时,王天赐团队还在研究中发现,维持中枢神经系统中PE的稳定状态有助于减轻小鼠的认知功能障碍。

邹贻龙,西湖大学生命科学院研究员,研究方向为功能性脂质组学和代谢调节。本次演讲主题为《多不饱和脂质组在细胞铁死亡和癌症中的多面作用》。

邹贻龙及其实验室团队专致力于研究脂质代谢,并尝试利用系统生物学的方法解析脂质代谢与肿瘤和肿瘤转移之间的相互关系。他们的研究手段包括空间脂质组学、空间代谢组学、载体功能筛选等多种方法。

邹贻龙介绍了脂质的基本结构,并特别强调了多不饱和脂质的重要的作用。多不饱和脂质中存在着密集的碳不饱和键,易于氧化,因此在细胞铁死亡中扮演关键角色。在细胞铁死亡过程中,氧分子直接参与了脂质的氧化,亚铁离子起到了催化作用,而细胞膜上的多不饱和脂质则决定了这一反应的速率。

邹贻龙团队借助卵巢癌的复杂转移路径,成功了构建了远端转移小鼠模型,并发现多不饱和脂质对远端转移具有多重影响。这一发现为未来卵巢癌的靶向治疗提供了新的机会和方向。

石瑜(Yu Shyr),美国范德堡大学生物统计学系主任,研究方向为生物统计学。本次演讲主题为《空间模式和共定位的可扩展性和无模型检测》。

他介绍了空间模式和共定位的可扩展性和无模型检测,并着重讨论了数据科学在精准医学领域的挑战和未来发展的方向。

随着精准医学的发展,生物学家和医学家需要处理大量的数据,包括基因组数据、临床数据、环境数据等。这些数据的处理和分析需要数据科学的技术和方法的支持。然而,这些数据的复杂性和多样性也带来了诸多挑战,需要数据科学家具备统计学、计算机科学、机器学习、人工智能(AI)等多方面的技能。

同时,石瑜教授强调,AI和高质量数据在生物医学研究中的重要性愈发凸显。AI技术可以帮助生物学家和医学家更快速、更准确地分析大量的数据,发现新的规律和知识。而高质量的数据是AI技术的基石,只有高质量的数据才能保障AI技术的准确性和可靠性。

石瑜教授还介绍了美国精准医学计划“All of Us”,以及UK Biobank、BioVU等项目。前者面向全球用户开放,最近All of Us研究项目发布了约25万个全基因组序列数据,供全球研究者使用。这些开放数据平台将推动精准医学的发展和进步。

最后,石瑜教授提到Open AI的最新声明,即他们不会训练ChatGPT-6,而是由GPT-5自行开发其下一个版本。这意味着,未来生物医学研究者可以将ChatGPT提供的代码解释器用于数据分析,帮助他们从原始医疗数据中提取有价值的见解,做出明智的临床决策。他提到,今年9月会开设一门新的课程:高级生物统计学的非编程方法。

姜鹏,美国国立卫生研究院国家癌症研究所终身研究员,研究方向是癌症生物学。本次演讲主题为《用大数据方法研究肿瘤免疫规避过程中的细胞间信号传递》。

会上姜鹏着重分享了AI在癌症临床研究中的一些问题和局限性。他指出,尽管他们的职责是和医院癌症科医生合作来帮助他们的研究,但事实上不可能满足每个课题组的合作需求。因此,更实际的方案是,总结大家共同需要的一些生物信息学问题,汇总其它专门做癌症的临床和实验室感兴趣的问题,并开发一些计算模型和计算平台来帮助大家。

他们发表了一篇综述文章,系统地总结了大数据和AI在癌症临床研究中的作用、方法、可能的资源和问题。

文章指出,现在有很多人声称他们的AI算法在图像应用上比人类病理学家不差,甚至更好,但问题是病理学家会进行更多的检查,比如IHC染色和多个活检,来确保诊断的准确性。

此外,FDA的报告中提出,要求将AI算法与现有的临床决策体系进行比较,特别是在使用RHC Marker的情况下。他举了两个例子来说明AI在预测蛋白质结构上的局限性。

第一个例子是UBA1基因在L198A位点的突变会破坏其疏水的结合位点,而AlphaFold预测的结构与原始蛋白相同,无法识别出这个突变对结构的影响。

第二个例子是BRIGHT突变使蛋白质更容易被蛋白降解酶所破坏,但AlphaFold预测的结构也与原始蛋白相同,无法识别出这个突变对结构的影响。

最后,姜鹏介绍了他们开发的Beta系统,该系统针对肿瘤微环境中的细胞间相互作用进行分析,并提供了一系列交互性功能,以方便用户使用。通过该系统,他们发现了一些肿瘤韧性T细胞的特征和新的药物靶点。

许扬, 南方科技大学医学院长聘副教授,研究方向为癌症免疫治疗。本次演讲主题为《用于治疗癌症和人类疾病的CAR-T技术》。

他指出,CAR-T细胞免疫治疗是一种通过基因编辑和扩增免疫T细胞的能力来治疗癌症的新型手段。这一手段最大的优点在于,它不再依赖于MHC分子去识别抗原,而是通过抗体和抗原直接的接触,使更多的患者受益,而不再需要考虑患者自身MHC的限制。同时,因为CAR是一个非常高度模块化的设计,所以可以加入不同的信号分子,使T细胞实现各种各样的功能。

然而,目前CAR-T疗法仍面临肿瘤复发和CAR-T对诸多实体瘤无效等挑战。为提升治疗效果,需要解决T细胞在体内无法长期存活和肿瘤内CAR-T细胞功能失调或丧失的问题。这也导致开发更具有选择性的细胞因子系统成为了研究热点。

最后,许扬分享了在开发CAR-T细胞免疫治疗中的一个意外发现:T细胞在活化后可以诱导性表达P19这个亚基,但P40亚基完全不表达。这意味着,通过给T细胞提供P40亚基,可以提高T细胞的增殖能力和抗肿瘤效果,并减弱T细胞的耗竭。在安全性方面,P40显著优于现有的细胞因子疗法。因此,通过基因工程让T细胞表达P40亚基,可以实现更有效的免疫治疗。

陈洛南,中国科学院上海生命科学研究院研究员。长期采用系统工程、动力学建模等方式研究复杂疾病的发生机制。本次演讲主题为《控制从肺腺到鳞状转分化的临界点》。

陈洛南团队利用单细胞测序数据,通过计算基因之间的相关性来构建基因网络,以此量化生物表征,揭示细胞之间的相互作用和分子间机制。他们还开发了一个名为STIA的新方法,用于从高维数据预测生物学和疾病的相关信息。

该团队提出了一种使用深层网络从组学数据学习非线性函数并预测未来走向的方法,并将其应用于干细胞分化、疾病预测等领域。此外,他们利用神经网络和混沌理论来预测高维数据的理念,提出用动态网络来预警疾病的思想。

团队还发现,部分腺癌可以起源于淋巴癌,这一转分化的机制可能与免疫微环境有关。此外,团队还尝试将预测和预警方法结合,用于预测地震、流感爆发和复发性疾病的复发,取得了显著的效果。

陈斯迪,美国耶鲁大学医学院遗传学副教授。研究方向为癌症系统生物学。本次演讲主题为《基因编辑和免疫治疗》。

陈斯迪教授介绍了基因编辑和免疫治疗的研究进展。团队通过大规模筛选发现了超过100个可以显著提高T细胞功能的基因。他们还利用基因编辑技术改造了免疫细胞,提高了其功能和治疗效果。最后,陈教授提出了一种新的基因编辑作为免疫治疗的方法,通过一次性过表达大量基因,可显著抑制肿瘤生长并提高生存率。该方法具有通用性,在各种癌症或病人中都有作用,不需要个性化治疗。与Tarti疗法协同作用,可进一步提高治疗效果。

张泽民,北大生命科学学院讲席教授。研究方向是用生物信息学来解决肿瘤发生过程、肿瘤微环境和对药物的响应等重要问题。本次演讲主题为:《肿瘤微环境的异质性》。

他强调了癌症研究中思维的变化,从仅关注癌细胞内部变化到关注肿瘤组织的复杂性,包括免疫细胞的异质性。免疫治疗改变了人们的思维方式,现在需要更全面地考虑肿瘤的整体。

他提出了对免疫细胞进行功能分型的新思路,并定义了四种免疫微环境的亚型:免疫激活型、免疫抑制型、免疫聚集型和免疫调离型。此外,他还讨论了免疫细胞中的NK细胞在癌症中的重要性及其异质性,并发现了一类在肿瘤中特别高的NK细胞亚型,命名为“tank细胞”。针对不同细胞类型的免疫疗法可能是不一样的,需要根据不同的细胞类型和微环境设计不同的治疗方案。

刘庄,苏州大学功能纳米与软物质研究院教授。研究方向为生物材料与肿瘤纳米技术。本次演讲主题为《促进癌症免疫治疗的生物材料》。

他介绍了团队在免疫治疗和眼部给药方面的研究。他们利用生物材料技术,探索了将免疫激动剂与局部治疗相结合的策略,以及基于个性化疫苗的策略。在肿瘤领域,他们开发了一种新型药物,结合放疗和免疫激动剂,以抑制肿瘤的生长和远端肿瘤的压制。在眼科疾病领域,他们面临着血眼屏障的问题,正在开发一种新型的眼部给药系统。他们的研究成果为免疫治疗和眼部给药提供了新的策略和方法,有望为肿瘤和眼科疾病的治疗带来新的突破。

徐鹰,南方科技大学医学院讲习教授。研究方向为肿瘤系统生物学。本次演讲主题为《转移后肿瘤的生物学》。

徐鹰教授强调,我们对肿瘤生物学的理解仍然非常肤浅,而在化学水平上研究肿瘤可能更有成效。他指出,正常细胞和肿瘤细胞之间的物理化学环境存在显著差异,这种差异对于我们理解疾病的重要性不容忽视。

他详细讲述了pH值变化对蛋白质结构和功能的影响,以及如何影响蛋白质在细胞内的定位和酶的反应速度。他还强调了细胞骨架和微管的重要性,以及肿瘤细胞的代谢和生长特性。

徐鹰教授讨论了肿瘤细胞的代谢和生长特性,包括核苷酸从头合成、氨基酸代谢和尿素循环的变化。他指出,生存压力导致系统性的基因突变,导致代谢的重编程以适应这种压力。肿瘤的代谢重编程会产生更多的氢离子,这可能对细胞内外氢离子浓度和细胞功能产生影响。

最后,徐鹰教授介绍了肿瘤转移后需要胆固醇的原因。他指出,胆固醇可以转化为性激素和免疫抑制剂,这些物质对肿瘤的生长和转移具有重要作用。同时,他也提到胆固醇的合成在肿瘤转移后大幅度上升。徐鹰教授提到了一项相关的流行病学研究,发现在长期服用降胆固醇药物的人群中,生存时间最长。

杨达,美国匹兹堡大学药学院副教授。研究方向为癌症药物基因组学、癌症相关的非编码RNA。本次演讲主题为《揭秘隐藏角色: 肿瘤药物愿景中IncRNA的特征研究》。

他分享了他们在癌症研究中的工作和目标,包括基因组数据分析、免疫治疗和长链非编码基因的研究。他们实验室最近在长链非编码基因和免疫治疗方面取得了进展,包括对EPIC1基因的命名和机制验证,探讨了长链非编码RNA在癌症发生发展中的作用,以及预测药物敏感性的策略。EPIC1作为一种在癌细胞中高表达的lncRNA,与所有免疫细胞的浸润均呈负相关,并且敲除该基因并使用真正的抗PD-1药物治疗小鼠,疗效更好。

戴紫薇,南方科技大学生物系助理教授。研究方向是肿瘤代谢、表观遗传学的代谢调节和基因表达。本次演讲主题为《肿瘤细胞代谢的数学建模》。

她介绍了实验室和肿瘤细胞代谢的内容,包括肿瘤细胞的代谢特点和测量方法。她主要介绍了代谢通量组学和代谢组学的区别,并介绍了用单细胞转入组数据研究肿瘤微环境里面不同类型细胞代谢特征的方法和结论。同时,她还提到了如何理解癌细胞和非癌细胞之间的区别,以及在单细胞和组织水平上比较癌细胞和非癌细胞之间的差异等问题。

在进一步分析和发现中,她介绍了她的研究团队在代谢网络设计原理方面的工作,包括发现热力学参数对代谢网络控制模式的影响和通过数学建模发现最大化代谢效率需要满足的条件。此外,她还介绍了研究团队开发的一种基于图神经网络的深度学习方法,可以预测代谢反应的吉布斯自由能,填补了全基因组水平代谢网络上热力学信息覆盖度不足的问题。

在演讲的最后,她还提到了研究团队在免疫微环境对癌细胞影响方面的发现,并讨论了可能的误差和不确定性。她强调了单细胞转录组数据的重要性,并指出未来需要更多的实验和理论探索来深入了解肿瘤细胞的代谢特点和调控机制。

雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/K0qugepxNyz8TR0X.html#comments Fri, 08 Sep 2023 12:03:00 +0800
第十二届「全国生物信息学与系统生物学学术大会」,10月27日-30日将在青岛召开! //m.drvow.com/category/healthai/n9St4GnaKTE7w1nl.html 全国生物信息学与系统生物学学术大会自1998年首届召开以来,已成功举办十一届,是中国生物信息学研究领域学术水平最高、影响最大的品牌会议。

第十二届全国生物信息学与系统生物学学术大会将于2023年10月27日至30日在山东省青岛市召开。

此次会议由中国生物信息学学会(筹)主办,山东省生物信息学会、山东大学承办。大会的主题为“人工智能大模型与生物信息学的新发。

会议将邀请生物信息学、医学等领域重量级专家及杰出学者做精彩报告,包括各个生物信息学前沿方向、智慧生物医学等方面。

会议议程

会议时间地点:2023年10月27日-30日,青岛红树林度假世界

会议主题:人工智能大模型与生物信息学的新发展

会议报告类型:特邀报告(35分钟)、大会报告(20分钟) 、分会场报告(15 分钟)、墙报交流(提问与讨论时间包含在内,时长5分钟)

议程安排:

注:请分会场负责人将分会场参会人员数量等信息,于2023年8月30日前报于大会秘书处。

分会场主题:

(一)表观遗传信息学

分会场主题:表观遗传信息与数字健康

(二)多组学与整合系统生物学

分会场主题:时空多组学和多模态组学数据的整合与应,

(三)非编码RNA

分会场主题: RNA信息学前沿

(四)基因组信息学

分会场主题:基因组学研究的新技术和新方法

(五)计算合成生物学

分会场主题:生物信息学与合成生物

(六)农林信息学

分会场主题;生物信息学与现代农业发展

(七)人工智能与生命科学

分会场主题:人工智能与生命科学大模型

(八)生物分子结构预测与模拟

分会场主题:生物分子结构预测与模拟

(九)生物数据资源

分会场主题:生命组学大数据

(十)生物信息学算法

分会场主题:跨模态生物大数据挖掘算法与应用

(十一)生物信息学与药物发现

分会场主题:生物信息与化学信息交叉

(十二)生物医学数据挖掘与计算

分会场主题:人工智能赋能生物医学数据挖掘

(十三)网络生物学

分会场主题:面向时空信息的网络生物学

(十四)系统生物学

分会场主题:疾病医学中的系统生物学

(十五)重大疾病组学信息学

分会场主题:新时代重大疾病组学信息学

(十六)转化信息学与数据共享安全

分会场主题:生物信息学与智慧健康

特邀报告人:

青年论坛报名通道、征集论文摘要

全国生物信息学与系统生物学学术大会是我国生物信息学术成果最重要的展示平台,为增加生物信息学青年学者在大会上的展示度,本届大会在报到当日举办青年论坛,具体信息如下:

(一)论坛时间: 10月27日13:30-17:30

(二)报告要求: 38岁以下的优秀青年科技工作者(专家、博士后、博士生均可),报告发表一年内或未发表的一项科研工作。

(三)报告数量:15人

(四)报告时长: 12分钟(10分钟报告+2分钟提问)

(五)投稿方式:请先注册大会并大会网站“个人中心”→“在线投稿”页面在线投稿,投稿时可仅选择青年论坛,也可同时选择对应专题的分会场和青年论坛(分会场优先遴选)

摘要征集:

(一)摘要征集范围

大会欢迎广泛来稿,与生物信息前沿相关研究、创新工作均可投稿。本次大会主题为“人工智能大模型与生物信息学的新发展”。

(二)论文摘要要求

1.大会鼓励参会代表递交论文摘要,摘要内容为英文,字数控制在1000字以内;

2.摘要投递系统暂已开放,请在大会网站“个人中心”→“在线投稿”页面进行论文摘要投稿;

3.提交摘要时请注明所属会议的会议主题;

4.大会学术委员会对来稿及大会报告进行评审,择优选择报告。

(三)论文摘要提交截止日期

论文摘要提交截止日期为2023年9月20日。参会代表所提交的摘要将由大会学术委员会和专委会共同评审讨论,择优收录大会摘要集,并遴选分会场报告、墙报交流、闭幕式评奖。

参会方式

会议注册:

(一)注册网址: https://cbsb2023 .casconf.cn

(二)注册标准

1.学生代表参会时请出示有效证件,博士后及专职科研人员请选择专家代表。

2.网上注册截止时间为2023年10月15日,缴费后不能参会者,10月15日前申请退款将扣除300元手续费后退还余款,10月15日后将不再退款。

3.发票领取:参会人员在注册时填写发票信息,会后统一开具电子发票。

(三)注册缴费

本次会议委托“山东省生物信息学会”收取注册费。请参会代表完成会议注册后,尽快缴纳费用,缴费方式如下:

1.银行汇款或转账,参会人员请将注册费汇至以下账号:

户名:山东省生物信息学会

开户银行:中国银行青岛滨海大道支行

账号:218248502339

2.在线扫码支付,参会人员可扫描以下单位收款码支付(支持微信、支付宝、云闪付、手机银行APP支付)。

★注册费缴费请附“姓名+专(或学或企) +单位名称(可缩写) +发票抬头

住宿:

(一)本次会议住宿和交通费自理。需要预定住宿的参会代表可在大会网站“个人中心”→“酒店预定”页面预定住宿,通过大会预订房间可享受价格优惠。

(二)请自行到酒店前台办理入住,酒店开具发票。酒店房间数量有限,请各位参会代表尽量于9月30日前完成住宿预订并缴纳费用,房间预定以缴费为准,未缴纳住宿费不进行预留。未成功预定住宿的代表请自行联系周边酒店住宿。

(三)住宿费缴纳

本次会议委托“山东省生物信息学会”收取住宿费。请参会代表缴纳注册费后再缴纳住宿费。缴费方式如下:

1.银行汇款或转账,参会人员请将注册费汇至以下账号:

户名:山东省生物信息学会

开户银行:中国银行青岛滨海大道支行

账号:218248502339

★住宿费缴费请附言“姓名+单位十房间类型+入住日期+几天”

(如:张三10月27日起入住海景大床房,入住3天,10月30日离开,可附言:张三+山东大学+海大+10.27+3)

大会联系方式:

★大会秘书组

于彬13658656796

李磊13210202062

韩仁敏18600003200

王珍15694406277

★会议微信群

请于会议网站(https://ccbsb2023.casconf.cn)“联系我们”页面扫码进群,群内每周末整理问题进行解答,如有急迫问题请@群主。

大会组织机构

主办单位:中国生物信息学学会(筹)

承办单位:山东大学、山东省生物信息学会

名誉主席:陈润生、李衍达、张春霆

大会主席:孙之荣

大会副主席:来鲁华、李亦学、李霞、沈百荣、肖奕、周天寿、王秀杰、陈铭、杨力、张勇

大会秘书长:李国君、王秀杰、王瑞

执行秘书长;于彬、李磊、杨建益

学术委员会

主席:孙之荣

常务副主席:陈洛南、张泽民

副主席(按姓氏拼音排序) :鲍一明、蔡禄、陈铭、戴俊彪、黄德双、来鲁华、李国君、李霞、刘巧泉、沈百荣、肖奕、徐鹰、杨力、张强锋、赵方庆

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/n9St4GnaKTE7w1nl.html#comments Tue, 22 Aug 2023 12:02:00 +0800
Al大模型浪潮下,生命科学的希望在哪里? //m.drvow.com/category/healthai/tNYSaKbYebjKsh78.html 在牛顿的一生中,成就与抱负之间的细微差别是显而易见的。如果没有哈雷,也许他会沉迷于炼金术和神学。但他现在确实就是物理学之父。

同样的事情有可能出现在GPT身上。

尽管它并非人类,但去年11月底一个化身“社交对话工具”的横空出世,代号“ChatGPT”,似乎在证明它具有同理心、世界观、以及在消费、医疗等方方面面的创造性能力。

历经9个多月的体验,不少人发现,与GPT的互动不仅仅是在使用一个计算机系统,更像是在培养一段关系。这是对GPT的最大认可,让这项最早发布于2018年的技术,最早启动于2016年一家初创公司的“臆想”,被现实接受。

从GPT到ChatGPT,再回到GPT,不少人褒奖,“它精美策划了一个完美的营销事件。”

如果没有ChatGPT,也许拗口的GPT技术永远停留在“玩具”阶段。但现在,AGI这个终极AI图景已经逼近,千行百业接入大模型已经成为共识。

作为微软主管研究与孵化部门的副总裁,Peter Lee,从2022年是秋季开始曾与GPT-4保持6个月多的日常互动。当时该AI系统仍在Open AI的秘密研发之中,“一项任务便是,探寻这一全新系统以及未来的类似系统,将如何对医疗保健领域产生影响,以及改变医学研究。”

如果不是著作了《超越想象的GPT医疗》一书,Peter Lee的上述经历,或许很难被外界窥见全貌,以及难以得知微软在医疗领域的新计划--用GPT创造普惠的医疗。

Peter Lee将其简言为一句话:从疾病诊断、病历撰写,到临床试验,GPT需要运用其通用能力,帮助医疗行业实现脱胎换骨式的数字化转型,从而进化到新的层次--智慧化。

而在国内同样对生命科学和医学领域抱有情怀的王小川,不仅过去多次表态在企业管理、产品设计等领域都受到了“生物学思维”的影响,今年率先谋动创立新公司“百川智能”,“立志往后二十年,为生命科学和医学的发展尽一份力,核心路径是构建生命健康数学模型。”

实际上,如今的医疗领域,已经进入群雄并起阶段。

自今年2月起,腾讯、阿里、百度、华为、讯飞、商汤,以及来自医疗信息化、医疗影像、互联网医疗,以及等领域的多家企业陆续公布了在医疗领域大模型方面的布局。

借用百度李彦宏一个月前的一句话,“可以预见,以大模型为关键驱动的数字经济,与实体经济深度融合,将做强做优做大实体经济,创造可观的增量价值。”这一表态或许代表了中国互联网科技企业的战略布局。

因此,如果从这一点出发,GPT和大模型势必成为一个突破支点,从而撬动整个医疗生态系统。

生命科学将迎来大科学工程的竞争

但落到实际竞争的层面,大模型领域在应用层竞争最为激烈,“AI原生应用” 一词在近期炙手可热。也就是说,诸多企业完全基于AI生成式思维创造的应用,而不再将旧有应用“引入”AI的改造升级。

这条路径值得我们深思,它是否让我们掌握了大模型时代真正的主动权?

《中国人工智能大模型地图研究报告》指出,截至2023年5月底,国产超10亿参数的AI大模型已达79个,从全球分布来看,美中两国大幅领先,超过全球总数的80%。

这也意味着,随着大模型发展成为“持久战”,上至应用、算法、下至数据、算力的全部自研自主技术体系,将在很大程度上决定大国博弈的终章。

一位从事智能计算的研究员对雷峰网表示,“如今中国庞大的人口基数,大模型各行业开花的局面,已经让这种“成本冲突”和“算力焦虑”的爆发,比全世界任何一个地方都更加剧烈。”

还有业内人直截了当指出,在中美大模型的发展过程中,美国更注重技术的研发与创新,并在硬件和深度学习框架等方面取得了重要进展。 例如NVIDIA、Google推出的适用于深度学习的专用芯片GPU、TPU,还有包括TensorFlow、PyTorch在内的开源框架,都处于世界领先地位。

相比之下,中国更聚焦在AI大模型的应用层面。许多国内互联网巨头在推动大模型在各个领域的应用的同时,着力探索如何实现其商业化变现。但底层关键技术的缺失是目前主要劣势之一,包括芯片的紧缺、国产框架的生态圈不足、交叉学科人员的匮乏等,这些是真正正面较量的“技术主权”。

这种洞见下,国内已有不少大模型玩家,依托超大规模国产化算力底座,打造一条“算力—数据—算法—应用”的全链条AI研发体系。

在某种程度上,生命科学是医疗保健之外的另一极,如今也成为这场技术革命的下一站。

素有生物圈“名嘴”的华大集团CEO尹烨在今年年中表态,“生命科学的爆发可能像GPT一样很快到来,未来的竞争一定是大科学工程的竞争。”

同时他难掩激动,“去年我们发现BT(生物技术)的发展对IT(信息技术)提出更高的要求,储存就是一个大问题。这是IT第一次被BT带着走。”

回到开头,三百多年前,牛顿把物理学变成了数学模型。几个月前,Open AI把语言变为数学模型。未来,在重构中国计算产业格局的大模型浪潮下,究竟能给生命科学和医疗行业带来多大的革新?是否也有一群人将生命中未知变成数学模型?

为此,8月14日-15日,在中国企业出海的桥头堡——新加坡举办的「第七届 GAIR 全球人工智能与机器人大会」,将围绕《GPT 新商业:破译生命密码的范式》主题举行专题讨论。

论坛将邀请密苏里大学教授,AAAS / AIMBE Fellow许东、微软云与人工智能事业部首席科学家陈梅、纽约市立大学教授,IEEE / IAPR Fellow田英利三位学术大咖,站在全球化的高度和视野,围绕大模型和生命科学浪潮下的商业新机遇展开头脑风暴。

许东,密苏里大学教授,AAAS / AIMBE Fellow

许东,密苏里大学哥伦比亚分校电子工程和计算机科学系的校董讲座教授,Christopher S. Bond生命科学中心研究员。

北大物理系本硕毕业,博士毕业于伊利诺伊大学厄巴纳-香槟分校,并于美国国家癌症研究所从事博士后研究。1995年入职橡树岭国家实验室生命科学部,2003年起加入密苏里大学哥伦比亚分校,2007-2016年,他担任该校计算机科学系的系主任。

他的研究方向集中在生物信息学方面,特别是机器学习在生物信息学中的应用,发表论文400余篇。他是美国科学促进会(AAAS)会士和美国医学和生物工程研究院(AIMBE)会士,担任IJFIPM杂志的主编。

本次分享主题是《Prompt-based learning for analyses of biomedical images and text》。

陈梅,微软云与人工智能事业部首席科学家

陈梅,清华本硕毕业,随后获得卡内基梅隆大学计算机科学学院机器人学博士学位。2011年至2014年,她在卡内基梅隆大学建立并领导了英特尔嵌入式计算科技中心(ISTC-EC)。2014年至2018年,她是纽约州立大学奥尔巴尼分校副教授。2018年起加入微软,曾任计算机视觉副总裁兼首席科学家。

陈梅一直从事计算机视觉和生物医学图像分析工作,曾获得该领域的三个最佳论文奖。目前她领导ROAR(Responsible & Open AI Research)团队,致力于打造具备上下文感知和文化敏感性的多模态多语言技术。ROAR的模型已经应用于新版Bing(由LLM提供支持)、Bing图像生成器(由DALL-E 2提供支持)、Office设计师(由DALL-E 2提供支持)、Azure OpenAI服务、Github Copilot以及Azure内容审核服务。

她拥有美国专利商标局授予的30多项专利,并担任IJCV和MVA的期刊编辑,CVPR和ICVS的会议主席,CVPR和ICCV的领域主席。

本次分享主题是《AI for microscopy image analysis 3.0》。

田英利,纽约市立大学教授,IEEE / IAPR Fellow

田英利,纽约市立大学电气工程系和研究生中心计算机科学系的特聘教授,IEEE / IAPR Fellow。

本科毕业于天津大学精密仪器与光电工程专业,硕士毕业于天津大学热物理工程专业,1996年获香港中文大学电机工程博士学位。在卡内基梅隆大学机器人研究所工作期间,她的面部表情自动分析和数据库开发研究获得了“FG2019时间测试奖”。随后加入 IBM T. J. Watson研究中心并领导视频分析团队。自2008年加入CCNY以来,她一直专注于计算机视觉和机器学习等技术帮助老年人、视障、听障等特殊人群。

目前研究重点是计算机视觉、机器学习、人工智能、辅助技术、医学成像分析和遥感技术,已发表200多篇同行评议论文,并拥有29项已授权专利,并担任IEEE Trans副主编。

本次分享主题是《AI-driven Automated Medical Image Analysis 》。

这是国内首个出海的AI顶级论坛,也是中国人工智能影响力的一次跨境溢出。

GAIR全球人工智能与机器人大会正在进行中

第七届GAIR全球人工智能与机器人大会,于8月14日-15日在新加坡乌节大酒店举办。论坛由GAIR研究院、雷峰网、世界科技出版社、科特勒咨询集团联合主办。

大会共开设10个主题论坛,聚焦大模型时代下的AIGC、Infra、生命科学、教育,SaaS、web3、跨境电商等领域的变革创新。

GAIR创立于2016年,由鹏城实验室主任高文院士、香港 中文大学(深圳)校长徐扬生院士、GAIR研究院创始人朱晓蕊、雷峰网创始人林军等人联合发起。历届大会邀请了多位图灵奖、诺贝尔奖得主、40位院士、30位人工智能国际顶会主席、 100多位 Fellow,同时也有500多位知名企业领袖,是亚洲最具国际影响力的AI论坛之一。


]]>
医疗AI //m.drvow.com/category/healthai/tNYSaKbYebjKsh78.html#comments Mon, 14 Aug 2023 11:31:00 +0800
之江实验室陈红阳:大模型要落到实处,必须要解决背后的算力缺口|医疗大模型十人谈 //m.drvow.com/category/healthai/2r6TqJz0n6UrRmGC.html 大模型时代,“AI军备竞赛”正从过去算法和数据层面的竞争,转变为底层算力的竞争。

《中国人工智能大模型地图研究报告》指出,截至2023年5月底,国产超10亿参数的AI大模型已达79个,从全球分布来看,美中两国大幅领先,超过全球总数的80%。

随着大模型发展成为“持久战”,底层算力比拼也将在很大程度上决定大国博弈的终章。

因此,在ChatGPT出现后的九个多月里,已有不少大模型依托超大规模国产化算力底座,打造一条“算力—数据—算法—应用”的全链条AI研发体系。

以网络与计算技术见长的陈红阳,目前正带领之江实验室图计算研究中心投身到当前一轮的大模型浪潮中。

“一是研发基于图计算的预训练大模型,二是进行国产硬件适配,打造图智能计算系统。这就是我们现在常说的‘软硬件协同’。”

陈红阳是网络信息背景,曾在西南交通大学、中科院计算所、宁波中科集成电路设计中心、日本东京大学、UCLA大学,日本富士通研究所,参与过物联网理论和算法研究、无线通信系统研发,和信息与通信(ICT)技术国际标准化工作。

2020年7月,陈红阳回国加入之江实验室,他的研究重心也随之变迁,转向“智能计算”(算力)。2022年中,之江实验室和华中科技大学成立了图计算联合研究中心,目标是打造软硬件协同的图计算的系统,由陈红阳担任该中心副主任。

据悉,目前研究中心已推出“朱雀图预训练大模型”,以及高效图计算平台“之江朱雀平台”。该平台能够一站式赋能医药制造和生物育种等领域,并在今年与一家药企签署合作协议。

近日,雷峰网《医健AI掘金志》推出《医疗大模型十人谈》系列,探究国产AI大模型如何迈向生态建设,以及不同机构在转化落地上的布局和探索。以下是和陈红阳的对话内容,我们做了不改变原意的编辑与整理。

《医健AI掘金志》:ChatGTP加速了“计算智能时代”的到来。目前你带领团队所做的“之江朱雀”平台,集齐了GPT、图计算、加速药物发现3种技术能力,是否有过往经历的背书?

陈红阳:目前我的研究线分为两块,来到之江实验室之前,我一直聚焦在网络信息领域,当时我和团队一起构建了大型ICT(信息通信技术)系统,像物联网和5G系统。

2007年到2011年,我博士去往日本东京大学,参与无线传感器网络理论和算法研究。期间我去往美国UCLA大学担任访问学者,在Ali. H. Sayed教授领导的实验室主要从事分布式信号处理研究。

而后进入日本富士通研究所工作过十年(2011-2020)。大概是在2017,2018年,我参与了一些大数据平台的研发工作,特别是为运营商的数据进行挖掘和分析,从那时起,我慢慢从原来做的“连接”偏向了“计算”,更确切是“智能计算”。

同时期,之江实验室在2017年成立,加上我本身是浙江人,有过几次接触,所以我2020年7月回国并正式入职。因为我有网络、计算、数据分析的背景,最初我是在“智能网络”研究中心,后来随着之江实验室主攻“智能计算”这一战略方向,我便做起了这方面的项目。

但我是怎么做起了图计算呢?

大数据时代,图计算已经成为海量数据高效分析和挖掘的基础性使能技术,是近年包括美国在内的各国在智能计算领域力争的制高点。

为提升实验室在图计算领域的研究实力和战略地位,2022年6月,之江实验室联合华中科技大学共同组建“图计算联合研究中心”,预期实现图计算从理论到系统、从原型到芯片、从专用到通用的逐步落地。

去年ChatGPT一跃成为全球创新的焦点,我认为自己需要顺势而为,发挥我在网络和计算领域多年来的积累。

一是研发“基于图计算的预训练大模型”,二是进行“国产硬件适配”,打造 “图智能计算系统”。这也是我们现在常说的“软硬件协同”。

目前大家所看到的之江朱雀平台,已经接入了我们的“朱雀图预训练大模型”、集成了很多传统的图深度学习方法及自研的图学习算法、而且已经适配了华为的昇腾和鲲鹏芯片。因此在平台上面,我们可以做很多科学计算问题,医药研发是其中很重要的一块。

“大规模高效图计算平台”仅仅只是我们团队的一小步。从芯片、编程框架,到软硬件平台一体化设计,最后打造一台全国产自主可控的图计算机,才是我们图计算中心的目标。

《医健AI掘金志》:国内外企业更多是将图计算技术研究消费行为、电信诈骗、金融贸易等,你们为何将这一技术用于生物制药?

陈红阳:确实,近年来图计算技术已经扩展到了非常多的领域。2021年7月,Alphafold2掀起了一股计算制药的浪潮。我也是那时候开始着手将图计算技术应用于生物制药领域。

从技术原理上说,药物分子可以视为由原子和化学键构成的图,比如它的原子可以看成一个“节点”,化学键可以看作是“边”,因此图计算技术能很好地应用于该领域,帮助预测化合物的性质、相互作用、与靶点之间的相互作用等。目前我们团队开发的朱雀图预训练大模型,主要是用图结构数据加速药物发现。

为什么一定要重新开发这样一款垂直大模型,根本原因是ChatGPT直接应用到生物制药领域,还存在很多不足:

一是无法把控可信性、二是在特定领域表现差、三是成本高昂。

如 Bert 和 ChatGPT 等,已在自然语言领域展现出了惊人的效果,但应用到生物制药领域则无法应对生物领域的非欧结构数据、图神经网络中的过平滑问题、数据标签稀缺、如何融入领域知识,以及如何解决大数据大模型的工程问题等。

因此,我们必须要打造一款我们自己的“生物GPT”。而且不能一味地堆数据量,还要将药学的领域知识嵌入大模型中。

从这点讲,我们的朱雀图预训练大模型,是“知识图谱+图计算+大模型”三者互补而来,能够很大程度上规避大模型“胡言乱语”的幻觉问题。

那么,在大量分子数据上完成自监督预训练任务后,未来只需要在将得到的编码器在下游任务上微调。如 DDI(药物间的相互作用)、DTI(药物与蛋白质之间的相互作用)和 MPP(药物性质预测) 等,只需要做出很小的调整。整个流程沿袭了大模型的思路。

最终所有的功能都会集成在之江朱雀平台上,我们会开放模型接口、算法、数据、算力,提供一个一站式的平台。

《医健AI掘金志》:所以医药研发只是朱雀图计算平台的其中一个应用,你们在研发过程中遇到哪些技术和工程挑战?

陈红阳:国内将图计算大模型应用到医药领域的团队并不多,大部分还是集中在金融、电商,以及社交网等领域。我们团队里最初没有药物化学背景的人,全靠自己去摸索,过程中写了一本白皮书--《之江实验室智能计算“数字反应堆”白皮书——计算制药篇》。当然我们的理解没有那么深,目的是从计算的角度理解制药的东西,助力AI4SCI。

朱雀图计算平台的研发过程中,主要有3个关键技术难题:

1) 建立知识融合的高效自适应图学习平台,研发高效图神经网络和知识图谱算法,解决科学图计算和稀疏学习的知识融合问题;

2) 针对多学科科学图学习中的算力与算子适配不足,及国产芯片集群的软硬件不兼容问题,研发适配的智能图算子,提高典型算法算子性能能1倍以上。

3) 针对多学科科学图学习中的表示困难,图架构自动学习能力不足,及图生成缺乏领域知识等问题,利用多学科的预训练模型和领域知识,研制图架构搜索、图生成学习、图表示学习及知识图谱技术和预测算法软件。

此外,数据是一个非技术的难题。

我们自己有大型细胞测序仪,也和良渚实验室的测序团队合作,他们产生的数据会到我们这边来。而且作为国家战略科技力量,最终平台和数据都是开放开源的。

现在面临的较大问题是靶标发现和医院数据,能否通过分布式联邦学习的方式共同使用。这块我们拿到的只是少量的开源数据。

《医健AI掘金志》:国内外大模型发展路径有何不同?

陈红阳:在中美大模型的发展过程中,美国更注重技术的研发与创新,并在硬件和深度学习框架等方面取得了重要进展。 

例如NVIDIA、Google推出的适用于深度学习的专用芯片GPU、TPU,还有包括TensorFlow、PyTorch在内的开源框架,都处于世界领先地位。去年英伟达还推出了生科领域的大语言模型的框架BioNemo。

相比之下,中国更聚焦在人工智能的应用层面,探索如何实现其商业变现。所以未来会有三大生态层:基础模型层、中间层和应用层。

最底层当然机会巨大,天花板会非常高,但风险也是最大的,因为平台公司一定是少数,好比很多操作系统最后只剩下iOS和安卓。但目前芯片紧缺、国产框架的生态圈不足、交叉学科人员的匮乏等,导致智能计算底层关键技术还是缺失的。

如果是做应用层,风险就没有那么大,而且每一个生产力领域都可能成长出垂直领域的领先公司,但规模可能无法与平台公司相比。

但国外开源大模型多于国内,造成一些公司拿着国外的开源代码进行“套壳”和微调,并不利于生态建设。

《医健AI掘金志》:现如今有这么多机构做大模型,会不会陷入同质化内卷?

陈红阳:确实,越来越多的机构开始涉足大模型的研发和应用,截至今年5月底,中国研发的大模型数量排名全球第二,仅次于美国,国内超10亿参数的大模型至少79个。这种情况下可能会导致同质化内卷。

自然语言处理、计算机视觉、推荐系统,都是当下大模型的热门领域,当研究方向都集中在这些领域,再加上相似的训练数据集和算法选择,导致研发的大模型缺乏差异性和创新性。

而且这也消耗了大量社会资源。整体上国内大模型尚处于追赶阶段,面临一些挑战,如核心算法不成熟、训练数据质量低、实际落地效果不理想、生态圈不健全等问题。

当然,也有学者开始关注新的研究方向,比如优化训练算法与架构,探索大模型的可解释性等。尤其是可解释性对于自动驾驶、智能家居、金融风控、生命科学等应用场景来说至关重要。

《医健AI掘金志》:在大模型研究中,以企业为主导的方式,对比以实验室为主导的方式,会更有优势吗?

陈红阳:正如“闭源摧毁 UNIX,开源成就 Linux。”

实验室为主导,使得开发人员可以腾出时间来解决尚未真正意义上的问题与解决,实现技术社区内自然的分工协作。现在市面上符合中国用户习惯的高质量大模型是十分欠缺的,这也是很多大型实验室决定开源的原因。

如果是纯粹企业主导,大模型更多走向闭源。其数据一般是私有的,更注重落地。但他们有几亿的或者几十亿的经费,直接租用一年的算力资源,可以一年从头到尾不间断训练。

因为大模型的训练本质上就是一个超大的训练任务,比如在1000张(或更多)GPU卡上跑两、三个月。测算了一下,购买1000张H800按市场价,就要投入3亿资金。即便是租用算力也容易以亿元为计。通常实验室支撑不了如此大的成本。

《医健AI掘金志》:大模型“智能涌现”令人兴奋,是否导致存在一些发展误区?或者说大模型存在一定泡沫?

陈红阳:如果非说误区的话,过于追求参数规模,是大模型发展中存在的一大误区。

仅仅增加模型的规模并不一定能够带来更好的性能,模型性能和其它许多因素相关,比如网络结构、数据质量等。一味地堆叠参数量可能会带来一些问题:

1,过拟合风险。导致模型泛化能力下降,虽然在训练集上表现良好,但在下游任务上表现不佳。

2,缺乏解释性。大量参数使得模型的决策过程难以解释,也就是我们常说的“黑盒问题”,这使得大模型缺乏可解释性和可信性。

3,资源不足。增加参数量可能会增加存储、传输和计算资源的负担。因此,在选择模型规模时,需要权衡具体任务要求、可用资源和训练数据大小等因素。

总之我认为“智能涌现”虽然令人激动,但只是大模型的表象。

事实上,研究人员对大模型的研究并不止模型规模和模型应用。近年来,大模型的基础理论、模型结构、训练效率、下游任务、可控性、安全性等各种方向都有大量研究成果。这些都是非常有意义的研究方向,并不是对“智能涌现”的一味追求。

大模型目前仍处于发展初期,ChatGPT只是一个起点。对大模型我们有很多不清楚的地方,有非常多的方向可以探索,还远没有到陷入发展误区或存在大量泡沫的阶段。

国产自研大模型还应该继续向前发展,我们在新一轮科技竞争中还是应该勇于探索,不能因为担心出错而畏首畏尾。

《医健AI掘金志》:下半年,生物垂类大模型的技术演变方向是怎样的?

陈红阳:一定程度上,未来的大模型应用趋势一定是“大模型+知识+行业应用”的模式。大模型将成为未来AI产品的操作系统,将会催生全新的“模型即服务”产业。

目前的大模型能够为用户提供基础的知识服务,它就像一个不那么准确的知识库或搜索引擎,只能提供一些很基础的服务,而且无法保证准确、可控和可解释,这将极大限制它在实际场景的应用。

因为用户无法接受胡说八道、不准确、不负责任的服务。

所以,必须加上知识,让大模型可控、可追溯、可解释,并且能够更精准地解决更专业的问题。

最后,大模型结合具体的应用才能让智能算法和平台落地,只有满足用户各种各样的个性化需求才能产生价值。

GAIR全球人工智能与机器人大会正在进行中

第七届GAIR全球人工智能与机器人大会,于8月14日-15日在新加坡乌节大酒店举办。论坛由GAIR研究院、雷峰网、世界科技出版社、科特勒咨询集团联合主办。

大会共开设10个主题论坛,聚焦大模型时代下的AIGC、Infra、生命科学、教育,SaaS、web3、跨境电商等领域的变革创新。

GAIR创立于2016年,由鹏城实验室主任高文院士、香港 中文大学(深圳)校长徐扬生院士、GAIR研究院创始人朱晓蕊、雷峰网创始人林军等人联合发起。历届大会邀请了多位图灵奖、诺贝尔奖得主、40位院士、30位人工智能国际顶会主席、 100多位 Fellow,同时也有500多位知名企业领袖,是亚洲最具国际影响力的AI论坛之一。

]]>
医疗AI //m.drvow.com/category/healthai/2r6TqJz0n6UrRmGC.html#comments Mon, 14 Aug 2023 11:24:00 +0800
深理工院长潘毅:AIGC,能否成为迈向「医疗元宇宙」的重要一环? |AIGC-MED系列研讨会 //m.drvow.com/category/healthai/LbRbG1RTWlUrIxyF.html “随着AIGC技术突飞猛进,带动全球一众科技巨头聚焦AI大语言模型产品开发,推动AI的三大基石--数据、算力、算法加速发展,并为元宇宙产业带来新一轮发展契机和关注。”

“AIGC大模型在医疗健康领域中的应用,将是元宇宙发展中的重要一环。”

AIGC(生成式人工智能)的话题从去年讲到现在,各行各业对此的探索仍乐此不疲。意外的是,当“今日明珠”AIGC遇上元宇宙,正在被科技产业、资本界、消费者理解为一场“双向奔赴”。

技术永远没有过气。在今年的世界人工智能大会现场,多位展商表态,“AIGC的成熟,将会为元宇宙带来突破性机遇;而元宇宙的良性发展,又为AIGC的落地提供了无限场景。”

诸如这场全球AI盛会的展馆内,数字人、XR游戏、AI绘画、3D虚拟场景,过去一众视为元宇宙的科技产品被贴上AIGC概念全新亮相。

但如果说这还只是停留在娱乐层面,那么真正的科技变革,已经在医疗、文旅、工业、金融、城市管理等众多垂直领域酝酿。

“如果把生命带入元宇宙呢?”

长期从事计算机和生物信息交叉学科的潘毅提出一个独特视角。

潘毅现任中国科学院深圳理工大学(筹)计算机科学与控制工程学院院长,讲席教授,入选美国医学与生物工程院院士、乌克兰国家工程院外籍院士、欧洲科学与艺术院院士、中民协元宇宙工委会长,并担任成都市生物医学信息学会名誉会长。

早在2021年他和团队启动了“儿童自闭症的早期筛查”,并在推进中逐渐加入影像学、遗传学、行为学等方法, 成为业内较早转化为元宇宙的项目之一。

他认为,“随着AIGC技术突飞猛进,带动全球一众科技巨头聚焦AI大语言模型产品开发,推动AI的三大基石--数据、算力、算法加速发展,并为元宇宙产业带来新一轮发展契机和关注。”

为了探讨AI在医疗健康领域的最新进展和前沿问题,成都市生物医学信息学会拟于2023年9月下旬举办关于《AIGC在医疗健康领域的应用系列研讨会》。

雷峰网作为大会战略合作媒体,将进行全程报道。

本次研讨会将采用线上+线下结合的方式,邀请相关领域的国内外知名院士专家学者、产业界代表、政府相关部门,围绕AI在医疗健康领域的最新动态、发展理念、实际运用,进行深入交流和探讨,并构建有国际影响力的品牌会议和交流合作平台。

大会在即,雷峰网对话首位演讲嘉宾潘毅院长,探究了AIGC大模型在医疗健康领域中的应用前景,以及对医疗元宇宙的观察。

潘毅院士在清华大学计算机科学与工程系获得本硕学位,1987年留美,1991年获匹兹堡大学计算机科学博士学位。此后主要任职为美国佐治亚州立大学,过去十几年间,潘毅教授该校陆续担任计算机系和生物系系主任、文理学院副院长等职位。主要研究领域是以云计算、大数据分析、人工智能、深度学习等为工具,进行生物信息和医疗信息的研究。

以下为雷峰网《医健AI掘金志》与潘毅的对话内容,《医健AI掘金志》做了不改变原意的编辑与整理。

《医健AI掘金志》:元宇宙是一种什么技术,如何应用于医疗领域?

潘毅:可以理解为,元宇宙是技术的集成,将信息技术、生物技术、物理技术三位一体,构建了一幅全景图。

它能利用信息技术,将自然宇宙扩展为虚拟宇宙,进而将人与宇宙间的关系“由单向转为双向”,从而更好地利用宇宙中物质信息的同时,摆脱自然界各种复杂的规律。

针对医疗领域,元宇宙能够为传统医疗产业带来很多活力。

首先,传统的治疗多是采用化学药物或者外科手术,但现在很多治疗都已用上数字化解决方案。

目前美国已经有利用虚拟现实技术治疗PTSD的先例。而在更早前,2017年,美国FDA首次以数字疗法的定义批准PearTherapeutics的ReSET,使其成为第一款处方数字疗法,用来缓解慢性疼痛、辅助治疗老年痴呆。

其次,随着元宇宙技术的发展,AR全息影像、XR技术都可能成为医疗培训的主角。

XR技术可以通过显示、触感、力反馈等设备,使接受培训的医生得以在沉浸式的虚拟场景中进行手术操作和练习,体验真实的临床手术过程。这在有效提高医生诊断病情和制订治疗方案的能力的同时,又能够大幅降低传统培训中的器材、标本等成本。

《医健AI掘金志》:怎么理解元宇宙和AIGC技术的关系?“医疗元宇宙”的终极形态如何实现?

潘毅:生物医学领域,目前已产生了海量的临床、遗传和行为学数据,具有数据规模大、价值巨大、结构多样和增长快速的特点。

由如此丰富且高质量的数据训练出的医疗领域专用的AIGC,将为医疗元宇宙注入巨大活力。

我们已经看到,世界第一个黑腹果蝇精准“数字孪生体”的诞生了,这个数字果蝇有反应和感知力。我相信我们将一步步造出更多数字生物体,从数字老鼠,到数字猿猴,乃至数字人类。在实现多种数字生物体的基础上,我们可以用来设计、筛选和测试新药物,大大降低试错成本。

最终,相关的任何实验都不需要在病人身上做,比如药物的功能、分子反应如何作用于心脏,都可以用数字表达。这将极大节约人工和成本,降低了人体试验的风险。

所以说,如今AIGC大模型在医疗健康领域中的应用,是元宇宙发展中的重要一环。

我非常看好现在非常热门的AIGC和ChatGPT。作为一个通用型的AI平台,即便在专业领域表现不如AlphaGo,AlphaFold这样的专业平台,其影响力会远比它们更广泛,更深刻。

随着AI技术的改进,生命科学领域的学者将为其注入专业性更强的生物知识。届时未来的科学家就能更专注于策划性的工作。而许多“实现层面”的事情,如写代码,筛选实验,都可以交给ChatGPT来做。

《医健AI掘金志》:利用AIGC走向元宇宙过程中,存在哪些挑战?这一过程能否划分成几个小阶段来完成?

潘毅:类比来讲,ChatGPT的进步也有许多的阻碍。

比如说数据污染,巨大的算力和电力消耗、用户沉湎、数据隐私、版权伦理相关的问题。这要求我们的互联网公司迎头赶上,不仅仅是基于GPT算法做上层应用,也要深入钻研GPT的算法模型,实现算法的更新迭代。

这样我们才能保证自己在AIGC领域的独立自主性,才有底气去“弯道超车”。

我认为元宇宙可以分为三个阶段:

第一个阶段是数字化的阶段,几年前已经完成了。数字人有形了,声音也可以模仿,但是没有逻辑思维,没有思考的能力。

第二阶段是数字人,在第一阶段基础上有了思考的能力,这一阶段现在正在进行中。比如我们在问数字人邓丽君,“你们家有几口人?”因为她有了数据积累和AI推理能力,她是可以回答这个问题的。

当然,目前ChatGPT也在这一阶段起到了很大的作用。

因为ChatGPT的出现为所有人提供了以自然语言对话方式进行文本生成的新方式和新工具,就像以文本提示词(prompt)生成图片一样,大大降低了构建元宇宙的门槛。而且ChatGPT不仅是生成语言,还会自动生成图片、代码、未来生成音乐、视频、以及3D内容的技术正在涌现。

但是第二阶段没有神经感知能力。也就是说,如果问她一些没有提前准备的问题,她是回答不了的。

第三阶段我们称为“神形具备”,数字人不仅有逻辑思维能力,还要具备神经感知能力,这一阶段很可能还需要30-50年时间。那时候,我给数字化的邓丽君讲一个笑话,她会脸红,甚至会害羞,拍她的头,她会疼痛了。

要达到第三阶段,除了算法本身的进步,其他各个领域都需要跟上。

比如说,到了第三阶段,也许5G的延迟就太长了,可能就需要6G甚至7G技术;物理,化学,生物也需要理解人体器官精准变动的机理,通过公式进行表达。

那么针对于医疗健康,元宇宙的应用场景非常多元,AIGC的潜力巨大。

今后我更看好的是专业GPT,比如说BioGPT,CancerGPT等,这样不仅可以减少训练数据量,减少计算资源的需求,从而可以节省成本和能耗。当不同专业的GPT出现时,就能够综合为一个全能的GPT。希望在国家,政府,企业的推动下,我国的AIGC模型能迎头赶上,医疗领域的元宇宙大厦能早日搭建!

首批确认出席嘉宾名单(以议程先后顺序)

潘毅

中国科学院深圳理工大学计算机科学与控制工程学院院长,讲席教授、美国医学与生物工程院院士、乌克兰国家工程院外籍院士、欧洲科学与艺术院院士、中民协元宇宙工委会长,成都市生物医学信息学会名誉会长。

潘毅院士主要研究领域是以云计算、大数据分析、人工智能、深度学习等为工具,进行生物信息和医疗信息的研究。

魏冬青

皇家化学学会会士、上海交通大学生物信息与生物统计系暨微生物代谢国家重点实验室长聘教授、中科院JCR一区杂志主编Interdisciplinary Sciences: Computational Life Sciences。

邓亚峰

现任碳硅智慧CEO、原360集团副总裁、人工智能研究院院长兼搜索事业部总经理、曾任科创版第一家人工智能上市公司格灵深瞳CTO。

王俊峰

四川大学智能系统研究院常务副院长,现任国防科工局视觉合成图形图像技术重点学科实验室主任。

鹿晓亮

科大讯飞医疗执行总裁,负责人工智能在医疗健康领域的应用。

杨瑞荣

远毅资本合伙人。此前曾任职于北极光创投和兰馨亚洲,杨瑞荣先生主导的代表性项目包括: 数坤科技、华大基因、燃石医学、安诺优达等。在进入风险投资行业之前,曾任职中国驻休斯敦总领事馆任经济商务副领事。

纵刚

全国知识产权领军人才,现任上海盛知华知识产权服务有限公司董事长兼CEO、中科盛知华科技成果转化有限公司董事长。2007-2013年任中国科学院上海生命科学研究院知识产权与技术转移中心主任,他在国内率先开展的与国际接轨的专业化技术转移工作曾多次被上报国务院并得到了李克强、刘延东等中央领导的肯定和批示、被媒体多次报道、以及被哈佛大学商学院写成教学案例。

黄纪伟

四川大学华西医院肝脏外科党支部书记兼副主任。黄纪伟教授也是日本东京大学肝胆胰外科、人工脏器移植中心的客座讲师,国际肝胆胰外科协会(IHPBA)会员以及美国外科学院Fellow(FACS)。

魏霞蔚

四川大学华西医院国际合作与交流办公室/港澳台事务办公室主任,四川大学生物治疗国家重点实验室研究员,博士生导师,国家老年医学临床研究中心副主任。担任美国基因细胞治疗学会中的 Cancer Gene & Cell Therapy Committee 和 Nanoagents & synthetic formulations Committee 分会委员、亚太地区基因/细胞治疗协会青年主席。任职 5 种SCI 杂志的编委(Editorial Board Member),共发表SCI论文40余篇,承担国家自然基金区域重点项目等。

林军

雷峰网创始人,林军先生在互联网行业有着丰富的经验和深刻的见解。雷峰网成立于2011年,秉承“关注智能与未来”的宗旨,持续对全球前沿技术趋势与产品动态进行深入调研与解读,是国内具有代表性的实力型科技新媒体与信息服务平台。林军先生指定雷峰网副总编,医疗科技方向负责人李雨晨参加本次系列活动。同时雷峰网将战略支持本次活动,进行全面报道。

李卡

四川大学华西医院临床医学院(华西医院)护理学院院长,双一流学科负责人。国务院学位委员会全国医学专业学位研究生教育指导委员会委员、中华护理学会外科专委会副主任委员、中国医药教育协会加速康复外科护理专业委员会主任委员。负责国自然面上基金、科技部重大专项课题、省科技厅重点专项等纵向课题10余项,负责经费1000余万。主编/副主编国家级教材4部,指南与共识5部、专著10余部。2019年牵头完成的《加速康复外科围术期护理关键技术的研究与临床应用》获"四川省科技进步一等奖。

岳义丰

中国卫生信息学会副秘书长、数字健康医疗信创分会副会长、华西公用副董事长、双华数字健康产业园总经理。

陈峥

电子科技大学信息与软件工程学院教授、自然语言处理实验室负责人。《与AI对话,ChatGPT提示工程揭秘》一书的作者。

郑杰

树兰医疗集团总裁、浙江数字医疗卫生技术研究院常务副院长、中国非公立医疗机构协会医院管理分会副会长、浙江省医学会数字医学分会副主任委员、OMAHA(开放医疗与健康联盟)发起人;《未来医疗》、《数字医疗》、《深度医疗》等译者。

王爽

杭州锘崴信息科技有限公司,创始人,董事长。2018年中组部国家“青年千人”入选人。曾任,加利福尼亚大学圣地亚哥分校助理教授。其主要研究方向包含生物医疗信息,数据隐私与安全,大数据分析,机器学习, 高性能计算,数据压缩。

张发宝

梅斯健康董事会主席,生物谷和梅斯医学创始人,中国生物化学与分子生物学学会生物技术委员会常务理事,世中联医学统计学专业委员会常务理事,临床研究外包服务联盟(CROU)理事,从事生物科学与产业转化,药品商业化工作。每年针对关键的热点医学和生命科学领域,举办十数场大型学术会议和产业对接会。

章毅

IEEE Fellow、中国人工智能学会首批会士、中国人工智能学会副秘书长与常务理事、四川省人工智能学会理事长、原四川大学计算机学院院长、享受国务院特殊津贴专家;担任四川省2011大数据协同创新中心主任、四川省网络大数据认知分析工程实验室主任。四川大学智能医学中心/机器智能实验室是章毅教授创立的集人工智能基础研究和智能医学于一体的团队。

雷万云

华为云医疗首席专家,教授级高级工程师。前中国医药集团有限公司CIO、工信部CIO联盟专家组专家、国资委信息化专家组专家。有30余年信息化、数字化方面的研究与开发、实施和管理经验,是管理与信息化、数字化方面的专家、国家认证的高级企业信息管理师、并著有8部云计算、数字化和信息安全等数字科技畅销书。在医药大健康行业数字化转型、工业互联网及智能制造、企业上云用数赋智以及大型企业数字化转型方面有着深入的理论和项目实践经验。现为国家两化融合标准化技术委员、中国药品监管信息化专业委员会专家、中国疫苗行业协会数字化首席专家、中国企业数字化联盟理事长、福建省数字技术企业商会名誉会长。

程伟

四川大学华西医院生物治疗国家重点实验室呼吸感染和干预研究室主任,华西医院科研实验室管理部副部长。国家杰青获得者,国家中组部第十一批2015年国家高级青年优秀人才入选者、四川省卫生计生委员会首批“领军人才”专家、四川大学“双百A类”入选者;担任中国医促会医疗环保工作委员会副主任委员、《中国卫生检验杂志》副总编、丝绸之路国际经济论坛组织委员会科技专家委员会副主任、中华医学会呼吸分会感染组委员、成都市生物医学信息学会会长。

孙宇

清华大学出版社副总编辑,医学博士、管理学博士、编审、硕士研究生导师。iLIVER, Infectious Medicine,Cancer Innovation,Health Care Science,Medicine Advances,iLABMED,iRADIOLOGY 编辑部主任。中国器官移植发展基金会副理事长,山东大学生态健康研究院副院长,中国科学院大数据挖掘与知识管理重点实验室兼职研究员,《医学科学报》编辑指导委员会委员,中国期刊协会医药卫生期刊分会第三届委员会常务委员,中国医药教育协会数字医疗专委会副主任委员,首届解放军出版奖先进出版人物奖全军优秀医学编辑工作者,全国新闻出版行业第三批领军人才,北京市新闻出版行业领军人才。

范晓东

医疗器械产业研究院院长、上海理工大学特聘教授、清华海峡研究院首席战略官。原国家药监局器审中心常务副主任、中国医疗器械行业协会原常务副会长、中国医疗器械信息杂志社原社长兼总编。清华大学生物医学工程学博士、北京大学医学部生理学博士后、医药企业投资和战略发展顾问。曾任:原国家人口计生委科技项目和成果管理中心(筹) 副主任,原国家药监局医疗器械司注册处副处长,原国家医药局国际合作司经济处负责医药进出口协调和中美中欧商贸联委会医疗器械组以及亚太经合组织等双边和多边合作相关事务的助理调研员,北京博士后联谊会副理事长,北医博士后联谊会理事长。

李园

教授,博士研究生导师。华西医院科研实验室管理部部长。曾任四川大学华西医院小儿外科副主任,国家重点肿瘤生物治疗——消化外科研究室科研负责人。中华医学会外科学分会实验外科学组委员,中华医学会小儿外科学分会肿瘤外科学组委员。

刘冰

中华医学会杂志社副社长,编审,负责154 种中华医学会系列杂志出版、经营、数字化等有关管理工作。兼任《Bio-X Research》编辑部主任。《编辑学报》编委,中国科技期刊编辑学会副秘书长兼医学期刊工作委员会主任。中国期刊协会医药卫生期刊分会副秘书长。中国音像与数字出版协会知识服务与数字版权保护技术工作委员会第一届理事会副主任委员。北京师范大学出版科学研究院特聘专家。曾长期在《中华心血管病杂志》工作并担任编辑部主任。参与多项国家及省市级课题研究-《中国科技期刊发展战略研究》《中国科协出版相关费用调查研究》《我国科技期刊的数字化出版平台建设》《北京市科委临床研究顶层设计在项目管理中的应用》。关注并研究符合临床研究规律的临床研究项目评审体系的优化和规范化问题。在医学伦理学、科研评价、数字出版等方面有较为深入的研究,发表相关学术论文数十篇。

毛新生

数坤科技董事长。在毛总带领下,数坤科技致力于打造世界领先的智慧医疗健康科技平台,坚持用中国原创、全球引领的技术为医疗健康行业提供智慧产品及创新解决方案,构建全球领先医疗健康大脑“数字人体”,针对心脑血管疾病和肿瘤等重大常见病和慢病,自主研发了覆盖疾病筛查、辅助诊断、治疗决策全流程的“数字医生”产品组合,并成功应用于智慧影像、智慧手术、智慧健康三大领域。

李欣

京东集团副总裁兼京东健康技术产品部总经理。在2023年京东全球科技探索者大会暨京东云峰会上,他发布了京东健康医疗大模型和基于大模型的医疗解决方案:京医千询。他致力于通过互联网和AI技术推动远程医疗的发展,让医疗服务更可及、更可负担、更有效。

何明科

百度集团资深副总裁、大健康事业群总裁。2001年毕业于清华大学汽车工程系获工学学士学位,就读于斯坦福大学商学院获MBA学位。曾在波士顿咨询、软银赛富等公司工作。2015年至2021年在58集团工作,曾担任58集团联席总裁。2021年11月,何明科担任百度集团资深副总裁,负责智慧医疗和健康等相关业务,向CEO李彦宏汇报。

蓝振忠

西湖大学工学院特聘研究员,深度学习实验室负责人。蓝博士牵头创立西湖心辰,西湖心辰的第一个产品—AI心理疗愈机器人。蓝振忠博士,本科毕业于中山大学,博士毕业于卡耐基·梅隆大学计算机学院。在谷歌AI部门工作期间,负责过多个自然语言处理和计算机视觉的项目研发。蓝振忠博士在谷歌AI部门工作期间,负责过多个自然语言处理和计算机视觉的项目研发。研发成果被应用于谷歌新闻和谷歌助手等多个拥有亿级以上用户的产品。

嘉宾名单持续更新中。

参会详情

会议时间:2023年9月-2024年10月(启动仪式:9月下旬),每周一次,每次不超过3位讲者,报告时间40分钟左右(暂定每周五下午),线上+线下结合方式。

会议地点:成都市科学技术协会、成都市生物医学信息学会、四川大学华西医院等。

会议组织机构(拟定):

(一)指导单位:中华医学会杂志社、成都市科学技术协会

(二)主办单位:成都市生物医学信息学会

成都市生物医学信息学会(简称医信会)是在成都市民政局登记的社会团体,主管单位为成都市科学技术协会。

学会旨在实施创新驱动发展战略,重塑医学科技信息高端交流平台,布局生物医学科技重点领域和关键技术,推进我市生物医学信息领域创新创业实践及具有自主知识产权的创新型科技成果转化,促进科技创新、人才培养以及相关产业孵化,为促进生物医学信息学产学研事业的发展做出应有的贡献。

(三)联合主办:清华大学出版社、四川大学华西医院、双华数字健康与医疗信创产业研究院

(四)媒体支持:雷峰网(战略合作媒体)、动脉网、医学界、封面新闻、钛媒体

(五)大会组织

大会主席:潘毅,中科院深圳理工大学计算机科学与控制工程学院院长、美国医学与生物工程院院士

大会执行主席:

程伟,四川大学华西医院教授、博导,国家杰青获得者,成都市生物医学信息学会会长

孙宇,清华大学出版社副总编辑,中国器官移植发展基金会副理事长

大会秘书长:陈斌,成都市生物医学信息学会执行会长兼秘书长

联系人:陈斌,18980148200

主办方介绍

成都市生物医学信息学会(简称医信会),批准单位为成都市民政局,主管单位为成都市科学技术协会。

学会旨在实施创新驱动发展战略,重塑医学科技信息高端交流平台,布局生物医学科技重点领域和关键技术,推进生物医学信息领域创新创业实践及具有自主知识产权的创新型科技成果转化,促进科技创新、人才培养以及相关产业解化,为促进生物医学信息学产学研事业的发展做出应有的贡献。

名誉会长:潘毅院士,美国医学与生物工程院院士、中国科学院深圳理工大学计算机科学与控制工程学院院长。

]]>
医疗AI //m.drvow.com/category/healthai/LbRbG1RTWlUrIxyF.html#comments Wed, 26 Jul 2023 17:58:00 +0800
2023年7月26日至29日, “生物数字经济产业发展高端论坛”将在张家口召开! //m.drvow.com/category/healthai/I4mOoGLYGqX4iwQ7.html 2023年7月26日--29日, “生物数字经济产业发展高端论坛”,将在河北张家口举行。

本次论坛由中国生物信息学学会(筹)与张家口市政府联合主办,四川省生物信息学学会、张家口市投资促进局、张家口经济技术开发区管理委员会、张家口建发智研咨询有限公司协办,拟邀请张家口市领导、国内外行业专家、产业代表参加。

会议将聚焦生物医学大数据挖掘、精准医疗、多组学分析、分子模拟、蛋白质工程、合成生物学、新药创制等多个与人民群众生产生活息息相关的领域。

张家口市是“东数西算”的京津冀主节点,具有数据存储和算力等战略资源优势,拥有“冬奥之城”的独特国际影响力。

会议鼓励国内外研究机构、企业分享自身或者国际一流成果转化实例、产业化实践经验和具体困难,探讨借助学会力量以及当地资源进一步支持成果转化、产业发展的具体措施,切实推进生物信息学算法(软件)的可用性、可推广性、可商业化性,服务于深化发展数字经济、加快数据要素流通的国家战略和人民需求。

会议议程

本次会议相关事项

本次会议注册费1500元/人(学生: 800元/人),与会专家食宿和交通差旅费用自理,回所在单位报销。会议注册截止时间7月24日23:00, 请各位参会人员在截止日期前通过线上方式进行会议注册,以便统筹安排。

会议注册网址: htps://hy.cmnt.cn/2970

会议地点:张家口华邑酒店(张家口市桥东区胜利北路56号)

交通方式建议:无直达航班的情况,可选择先飞抵北京,而后选择北京-张家口高铁。

会议主席:孙之荣教授(清华大学)

综合协调小组:王瑞、尚晓兵、冯伟哲、王茜

联系方式:

冯伟哲:电话18582566158;邮件917801955@qq.com

王茜:电话13699437656;邮件/bissc@foxmail.com

会议注册二维码:

目前大会已全面启动展览招商工作,有意向企业请联系冯伟哲、王茜。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/I4mOoGLYGqX4iwQ7.html#comments Fri, 14 Jul 2023 11:55:00 +0800
医疗领域「百模大战」:BATH和医疗IT玩家,谁更适合做垂类大模型? //m.drvow.com/category/healthai/k4RMy262vfpfHIXW.html ChatGPT的发布在全球掀起了大模型产业化的浪潮,短短半年间,许多行业因大模型的出现而脱胎换骨。“大模型在改变人工智能的同时,也在改变着全世界”逐渐成为人们的共识。

在通用大模型领域,拥有着深厚技术储备的腾讯、阿里、百度、华为等国内科技与互联网巨头企业接连发力,打造出混元、通义千问、文心一言、盘古等AI大模型,在大模型产业化的竞争浪潮中占据第一梯队。

大模型之火越烧越烈,从通用大模型一路蔓延至专业性更强的医疗垂类大模型。

然而,受限于医疗行业的专业性与严肃性,基于专业语料、高质量数据的医疗垂直领域大模型研发门槛显然更高。

自今年2月起,腾讯、阿里、百度、华为、讯飞、商汤,以及来自医疗信息化、医疗影像、互联网医疗等领域的多家企业陆续公布了在医疗领域大模型方面的布局,近两个月来,更是有多款医疗大模型先后发布。

在这条赛道之上,深耕医疗领域的专业玩家是否更具优势?

雷峰网《医健AI掘金志》基于公开资料,对布局医疗大模型的企业、研究机构及其相关产品进行了盘点。

(雷峰网《医健AI掘金志》后续将推出更多医疗大模型相关话题文章,如《医疗信息化厂商的「GPT焦虑症」》等,欢迎添加作者微信qiaoyw186抢先交流。)

华为(药物设计)

2021年4月,华为发布盘古NLP(中文语言)大模型、盘古视觉大模型、盘古科学计算大模型,同年9月,华为推出用于药物研发细分场景的大模型,盘古药物分子大模型。

据介绍,该模型是由华为云联合中国科学院上海药物研究所共同训练而成。依托华为云一站式医疗研发平台 EIHealth,盘古药物分子大模型学习了 17 亿个药物分子的化学结构。

国际欧亚科学院院士、华为云人工智能领域首席科学家田奇曾介绍,盘古大模型解决了传统AI开发的作坊式开发、样本标注代价大、模型维护困难、模型泛化不足、行业人短缺等难题。

在《医健AI掘金志》此前与华为云医疗产品总监,医疗首席科学家乔楠博士的对话中,乔楠博士介绍,华为云基于盘古药物分子大模型打造的AI辅助药物设计平台,能够覆盖药物设计的全流程,为靶点发现、药物筛选、分子优化三个环节提供支撑。

在靶点发现环节,2019年以来,华为云针对基因数据、基因多组学数据、基因调控网络数据陆续发布了三个算法:AutoGenome、AutoOmics、AutoGGN,通过从细胞系、动物模型、病人身体组织中测到的多组学数据进行AI建模,为生物标记物发现和靶点发现等相关问题提供依据。

在药物筛选环节,华为云打造了一个独有的小分子库生成功能,基于盘古药物分子大模型,从模型学习到的类药化学空间中均衡采样,生成新颖且类药性质更优的化合物分子库,帮助加速药物筛选过程。

在分子优化环节,分子搜索功能基于华为云盘古药物分子大模型的小分子化合物表征,以使用者输入的参考化合物结构为起点,从海量的小分子库中搜索到相似结构和排序,可以实现百亿级小分子的秒级搜索。

在实际应用中,华为云联合西安交通大学第一附属医院刘冰教授团队,基于华为云盘古药物分子大模型研发出了近四十年来首个新靶点、新类别的抗生素,将药物设计周期从数年缩短至数月,成本降低70%。

2022年7月25日,云南白药公告其与华为达成全面合作,双方将在人工智能药物研发领域开展交流与合作,探索联合科研创新机制。

今年6月6日,润达医疗与华为云计算技术有限公司在上海正式签署全面战略合作协议,双方将基于华为云平台打造面向医疗领域的AI大模型,实现智慧医疗服务。

百度(药物设计、辅助诊疗等)

2022年5月,百度对外发布了文心生物计算大模型,并将生物领域研究对象的特性融入模型,构建面向化合物分子、蛋白分子、基因组学信息的生物计算领域预训练大模型。

目前正式对外发布的文心生物计算大模型,包括化合物通用表征模型、蛋白结构分析模型以及单序列蛋白表征模型。

在实际应用中,文心生物计算大模型已帮助百克生物等医药公司缩短了化合物分子选型的周期。

今年3月16日,百度正式发布新一代大语言模型,生成式AI产品“文心一言”。在3月21日召开的的2023年百度&GBI生态峰会上,百度文心大模型首个落地医药行业的应用GBIBot正式发布。

这款医药垂类对话机器人,使用了百度灵医智惠在医疗健康行业的技术积累,实现了文心大模型与GBI专业数据库的有机结合。

据峰会当日介绍,百度已具备医疗健康大模型,对应的应用层即为智慧医疗。这一模型来自百度的三大中台技术,即数据中台、知识中台和AI中台。

百度曾基于国家级项目和数百家医院实践,制定医疗健康标准大数据,构建医疗健康大数据治理平台,据峰会介绍,百度拥有超过1亿的数据治理单据、2100万日审核医嘱、13万日推荐检查、180万日服务患者、20万日服务医生数量。

同时,百度还具有知识图谱构建能力,可将优质病历、诊断指南、专家共识、科研成果等知识信息由阅读级转换到计算、决策级。再基于AI中台技术,百度由此形成了千亿级参数的医疗健康大模型。

据此,GBI数据库的接入可以使其数据资源经过前述技术处理,为药企用户提供更加智能的服务。

而对于药企客户而言,文心一言作为一种CPT(生成型预训练变换模型),还将在前述技术的基础上,提供多轮交互式对话。从用户体验的角度上说,这相较于此前的关键词检索、语义查询更加精准便捷。

在今年5月举办的《中国AI药物研发大会》上,百度生命科学解决方案架构师马罗亚介绍了百度生命科学行业布局及解决方案。

其中,百度基于文心大模型,深入生命科学行业,推出螺旋桨系列产品,为药物研发、基因检测等提供算法工具,在蛋白质结构预测、mRNA序列优化、虚拟筛选、ADMET预测等方面具有较强优势,可作为药物研发阶段重要工具,加速药物研发进程。

腾讯(辅助诊疗等)

2023年6月19日,腾讯云在国家科技传播中心召开行业大模型及智能应用技术峰会,首次公布腾讯云行业大模型研发进展,启动行业大模型共建合作。

据腾讯云介绍,此次公布的行业大模型解决方案立足不同企业的需求场景,依托腾讯云 TI 平台打造行业大模型精选商店,为企业客户提供 MaaS(Model-as-a-Service)一站式服务。

依托腾讯云 TI 平台打造行业大模型精选商店,为企业客户提供涵盖模型预训练、模型精调、智能应用开发等一站式行业大模型解决方案。

腾讯云MaaS的技术底座是一系列的行业大模型,包括金融、政府、文旅、传媒、教育等。

基于这些基础模型,腾讯云的客户只要加入自己的场景数据,就可以生成契合自身业务需要的专属模型;同时也可根据自身业务场景需求,定制不同参数、不同规格的模型服务。

在医疗健康领域,腾讯云可以帮助医疗机构构建和部署自己的疾病预测模型,提高诊断准确率和治疗效果;在金融领域,腾讯云可以帮助银行和保险公司构建和部署自己的风险评估模型,提高风险控制能力。

仁济医院作为腾讯此次行业大模型发布中医疗行业智能应用的全国示范医疗机构,运用腾讯行业大模型,以互联网医院适老化服务为着力点,再次升级互联网医院数智人智能客服,为患者提供便捷就医的智慧化体验。

阿里(辅助诊断)

4月11日,在阿里云峰会上,阿里云智能首席技术官周靖人正式宣布推出大语言模型“通义千问”,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。

该模型基于阿里巴巴自主研发的StructBERT和PLUG等技术构建,拥有270亿个参数,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能,可以理解和生成中文、英文、日文等多种语言,并且可以根据不同的任务和领域进行灵活调整。

据在医疗领域,利用“通义千问”模型可实现医疗问答、医疗知识图谱、医疗报告生成等功能,提供专业的医疗咨询和辅助诊断。

商汤(AI导辅诊、辅助诊断等)

4月10日,在商汤技术交流日活动上,商汤科技董事长兼首席执行官徐立宣布推出大模型体系“日日新”大模型,体系包含自然语言生成、照片生成服务、感知模型预标注、模型研发。

商汤“日日新 SenseNova”大模型体系的基础算力底座是商汤 AI 大装置 SenseCore,其背靠商汤人工智能计算中心(AIDC),目前有 27000 块的 GPU 在运行,能够输出 5000p 的总算力,500p 的国产化算力,可以同步支持 20 个千亿参数超大模型训练,为商汤日日新大模型体系提供了充足的算力支持。

基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI 内容生成、多模态、决策智能等多个领域的大模型,在医疗领域,推出了中文医疗语言大模型“商量·大医”。

“商量·大医”基于海量医学知识和真实医患互动对话数据打造,能够通过多轮对话辅助支持导诊、问诊、健康咨询、辅助决策等多场景,从而持续赋能医疗领域,提升医院诊疗效率,为患者打造更好的服务体验。

据商汤科技展示的案例,“商量·大医”已落地新华医院,能够担任健康咨询助手,为用户解答熬夜会带来身体变化的原因, 并通过引导给用户提供就医挂号建议。

创业慧康(辅助诊断)

据创业慧康官微消息,4月12日,创业慧康与浙江大学计算机创新技术研究院、浙江省智慧医疗创新中心正式达成战略协议,共同推动AI技术在医疗领域的应用及发展。

据介绍,此次合作的重点是推动AI大模型(如GPT、ChatGLM、LLaMA、T5、Segment Anything)在临床医疗、公共卫生、个人健康等场景中的研究与开发,以重构医疗业务场景,结合权威的医学临床知识库、健康管理知识库,为AIGC模型提供高质量的训练数据和确定性的Prompt上下文,使得人工智能模型生成结果安全可信。

6月14日与19日,创业慧康在互动平台的回复中对公司打造的AI大模型聚合产品——BsoftGPT进行了介绍,产品将以API调用结合本地部署的方式聚合利用通用GPT模型,同时通过本地部署embedding向量数据库以及公司自有的领域知识库,通过医疗垂直领域的语言模型训练和微调逐步实现产品力,并向公司内外部的应用场景,比如在医疗服务和个人健康等场景中输出AI智能服务。

在临床医疗服务方面,BSoftGPT可以根据医生提供的病历信息和临床数据,自动化生成临床决策建议和治疗方案,从而辅助医生进行临床决策,提升现有的临床决策支持系统CDSS的智能化水平;

在面向患者服务方面,BSoftGPT可以通过与患者进行自然语言交互,实现贯穿患者诊前诊中诊后全流程的智能导诊、管理。

BSoftGPT平台将成为创业慧康AI能力的中台,是公司关键技术基础设施之一,能够为公司的业务应用和研究开发提供支持和帮助。

卫宁健康(辅助诊断)

5月12日,卫宁健康发文公布了公司在医疗垂直领域的大语言模型上的研究进展。

据介绍,卫宁健康自2017年起在医疗AI领域进行布局,并于2023年1月开展了卫宁健康医疗语言大模型WiNGPT的研发和训练工作。

今年3月,实验室已完成了WiNGPT可行性验证并开始内测,WiNGPT采用通用GPT架构、60亿参数,实现了从预训练到微调的医疗大语言模型全过程自有研发;

5月,WiNGPT训练的数据量已达到9720项药品知识、 7200余项疾病知识、 2800余项检查检验知识、1100余份指南文档,总训练Token数达37亿。共包含7大类基础任务(问答、多轮对话、信息抽取、归一化、文本相似计算、摘要、分类、生成)与20多项子任务。

卫宁健康将大模型WiNGPT以Copilot辅助诊断模式融合到WiNEX产品中,WiNGPT Copilot产品面向专业医疗工作者,通过专业人士的审核和决策更好地服务最终患者,同时会使用知识库、模板和规则来确保数据准确性。

WiNEX Copilot产品预计将于10月Winning World2023大会上正式发布。

东软集团(影像分割、辅助诊疗等)

2月17日,东软集团宣布成为文心一言首批生态合作伙伴,优先内测试用文心一言,集成其技术能力,在产品研发、标准制定等多个领域展开深化合作。

4月28日,据东软集团官微,东软智能医疗科技研究院(以下简称研究院)已正式发布基于医学影像分割大模型的飞标医学影像标注平台4.0版。

为解决模型碎片化的问题,研究院通过深入研究在医学影像领域预训练大模型技术,通过“预训练大模型+下游任务微调”的方式,从大量标记和未标记的数据中捕获知识,扩展模型的泛化能力。

同时,研究院结合东软自身积累的带有标注数据的大量数据集,对预训练大模型进行二次训练,并针对医学影像的三维特点进行优化,推出了医学影像分割大模型MISM。

借助医学影像分割大模型MISM,飞标平台4.0版可实现通过一个点、一个边界框,一键分割出病灶或解剖结构的功能,能够更精准的连续逐层标注。

6月20日,东与软集团官微再次发文,介绍了近日推出的添翼医疗领域大模型。

添翼医疗领域大模型是同时面向医生与患者双方的产品。医生可通过自然语言与添翼医疗领域大模型交互,快速、精准地完成医疗报告与病历、医嘱开立;

同时,添翼医疗领域大模型还能够为患者提供全面的诊后健康饮食、营养与运动建议等服务。

其多模态数据融合能力,也将为医院管理者提供对话式交互与数据洞察,简化数据利用,助力医院精细化管理。

医联(AI导辅诊、辅助诊断)

5月25日,互联网医疗公司医联正式发布了其自主研发的医疗大语言模型——MedGPT。该系统基于Transformer模型架构研发,致⼒于在真实医疗场景中发挥实际诊疗价值,实现从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。

据介绍,MedGPT能够通过多轮问诊,引导患者收集足够的诊断决策因⼦之后再进⼊到诊断环节,通过收集足够信息并做出符合医学的决策,以“治愈”为目的而进行人机交互。

通过独有的将⾃然语⾔⼤模型AI技术与⼀系列⼯程调优技术以及医学⼀致性校验技术相结合,并在模型微调训练阶段采⽤⼤量真实医⽣参与的RLHF(Reinforcement Learning from Human Feedback) 监督微调,有效提升模型的疾病特征判断与模式识别能⼒,确保医疗准确性。

此外,医联还建立了基于专家评议的AI诊疗准确性与真实世界医⽣对标测试机制,不断将AI与真实诊疗场景对齐,最终实现准确诊断。

基于Transformer架构,MedGPT可以整合多种医学检验检测模态能力,首次实现线上问诊到医学检查的⽆缝衔接。在问诊环节结束之后,MedGPT会给患者开具必要的医学检查项目以进一步明确病情,患者则可以通过医联云检验等多模态能力进行检查。

基于有效问诊以及医学检查数据,MedGPT得以进行准确的疾病诊断,并为患者设计疾病治疗方案。患者可以通过医联互联网医院实现送药到家,MedGPT会在患者收到药品后主动为患者进行用药指导与管理、智能随访复诊、康复指导等智能化疾病诊疗动作。

通过多模态应用的打通,MedGPT实现了预防、诊断、治疗、康复的全流程诊疗。

MedGPT目前的参数规模为100B规模,预训练阶段使⽤了超过20亿的医学文本数据,微调训练阶段使⽤了800万条的高质量结构化临床诊疗数据,并投⼊超过100名医⽣参与⼈⼯反馈监督微调训练。

目前,MedGPT 已经可以覆盖 ICD10 的60%疾病病种,并在近期将研发重心倾斜在多发疾病,以提升数字医院的普惠率。预计在 2023 年底,可以覆盖80%病种的就诊需求。

云知声(辅助诊疗、保险)

5月24日,云知声发布山海大模型。云知声创始人、CEO黄伟在发布会上介绍,将以山海大模型为基础,打造MaaS 模式的AI 2.0解决方案,在通用能力基础上,增强物联、医疗等行业能力。

在医疗场景中,云知声基于过往数据与经验积累,依托山海大模型全面升级医疗业务线各产品智能化水平,发布手术病历撰写助手、门诊病历生成系统、商保智能理赔系统三大医疗产品应用,实现从助手到专家的跃迁。

智慧眼(辅助诊疗、健康管理等)

5月20日,智慧眼发布了多模态医疗大模型“砭石”。“砭石”医疗大模型采用知识图谱与大模型相结合的技术路线,实现对问诊的文本数据、医疗影像数据、用户的面部体征视频数据和用户睡眠音频数据的多模态处理,实现医疗辅助诊断、智能认知、健康管理等多样化的任务。

基于砭石的场景应用能力,智慧眼发布云慢病患者服务管理系统,包含医院患者服务管理系统和药店患者服务管理系统,将加速医疗行业数智化,为患者提供全生命周期健康管理服务。

智慧眼研究院负责人表示,“砭石”医疗大模型将以大模型为基础,深入决策支持、医保控费、医药服务、健康管理、保险支付等诸多场景:

通过砭石大模型辅助诊疗技术,为基层医务人员提供病历质控、辅助诊断、合理用药、医学知识检索等技术支持;

搭建风险控制模型,以更为常态化、高效精准的方式挖掘数据之下的欺诈骗保行为,对购药、门诊、健康理疗等行为进行自动化的分析、监管和预警;

开发云慢病患者服务管理系统,通过赋能B端服务C端,AI将联通诊前、诊中、诊后实现慢病管理的闭环,通过数字疗法促进慢性病积极管理;

以砭石大模型为技术底座,打通了医疗服务的需求方、服务方、支付方和药品提供方,提供智能导诊、问诊购药、复诊续方、医生在线接诊、开方审方、处方流转、医保结算、药物配送和用药跟踪等一站式服务等。

上海市算力网络数字医疗创新实验室(辅助诊断)

5月17日,上海市算力网络数字医疗创新实验室全部自主研发的医疗算网大模型Uni-talk发布。

上海市算力网络数字医疗创新实验室由上海联通、华山医院、上海超算中心和华为联合组建,“Uni-talk”算力网络医疗大模型是实验室成立以来交的“第一份答卷”。

“Uni-talk”是一款自主可控、行业定制的国产化大模型产品,在严格遵守国家数据安全管理要求下,实验室将数据信息进行私有化部署与训练,基于联通算网智能管控与算力统一调度编排能力,在通用模型基础能力之上,融入垂直领域专业知识,大幅提升场景感知和理解能力,逐步实现通用人工智能到医疗人工智能领域的融会贯通。

Uni-talk是首个基于算力网络的医疗算法模型,依托上海联通算网大脑,通过多元算力实时感知、云网协同、智能决策等算网融合关键技术,实现对跨区域异构算力的智能管控与统一编排,助力模型高效训练迭代。

同时,“Uni-talk”在通用大规模多语言语料知识库基础上,基于医疗知识图谱重点融合学习了医学领域专业知识,知识库收集整理接近亿条医疗专业知识资料进行深度训练学习,保障模型的推理质量、准确性与可靠性。华山医院将Uni-talk应用于专业医学文献检索、辅助诊断等多个场景。

上海人工智能实验室(辅助诊疗等)

6月29日,由上海人工智能实验室牵头,并联合国内外顶级科研机构、高校及医院共同发布全球首个医疗多模态基础模型群“OpenMEDLab浦医”。

“OpenMEDLab浦医”融合了全球顶尖的AI研发能力、海量医学数据以及医学专家知识,首批发布的基础模型群中,包含基于医学图像、医学文本、生物信息、蛋白质工程等10余种数据模态训练而成的基础模型。

据介绍,基于计算机视觉、自然语言处理大模型对医疗图像和文本通用特征的学习,上海人工智能实验室首先针对不同医疗数据模态开发了一系列基模型,例如CT、MRI、超声、内镜、病理、医学文本等,以充分学习和利用不同数据模态独有的特征和模式。

基于上述多层级、多场景的基础模型群,“OpenMEDLab浦医”可以将先前医学数据训练中学习到的特征,高效应用于海量医疗下游问题中,从而实现针对不同任务的小数据、弱标注、高效率的训练。同时,模型群兼顾性能与落地的平衡,在医疗场景中的部署应用更具便捷性,从而让基础模型在更多医疗长尾问题中得以落地应用。

“OpenMEDLab浦医”研发团队已与全国多家头部三甲医院及医药企业开展合作,全方位赋能医院诊疗及药物研发工作。

“OpenMEDLab浦医”将于近期逐步开源,覆盖医学图像、医学文本、生物信息、蛋白质工程等10余种医疗数据模态,促进基于医疗基础模型的跨领域、跨疾病、跨模态科研突破,推动医疗大模型的产业落地。

香港中文大学(深圳)&深圳市大数据研究院(辅助诊疗)

近日,香港中文大学(深圳)和深圳市大数据研究院的王本友教授团队训练并开源了一个新的医疗大模型 ——HuatuoGPT(华佗GPT),基于医生回复和 ChatGPT 回复,让语言模型成为医生提供丰富且准确的问诊。

研究团队利用指令微调和强化学习在 ChatGPT 和医生的回复中找到结合点,训练并开源了一个新的医疗大模型 ——HuatuoGPT。

HuatuoGPT 致力于通过融合 ChatGPT 生成的 “蒸馏数据” 和真实世界医生回复的数据,以使语言模型具备像医生一样的诊断能力和提供有用信息的能力,同时保持对用户流畅的交互和内容的丰富性。

为了进一步提升模型生成的质量,HuatuoGPT 还应用了基于 AI 反馈的强化学习技术(RLAIF)。

使用 ChatGPT 对模型生成的内容进行评分,考虑内容的用户友好程度,并结合医生的回答作为参考,将医生回复的质量纳入考量。

利用 PPO 算法将模型的生成偏好调整到医生和用户之间的一致性,从而增强模型生成丰富、详尽且正确的诊断。

联影智能(医学影像)

5月30日,联影智能CTO吴迪嘉在《第二届长三角科技产业创新论坛暨AI大模型产业应用高峰论坛》上介绍,联影智能通过AI应用赋能精准医疗,目前能够做到多场景、多疾病(心脏、癌症、大脑)、全病程疗效评估与智能随访、一站式分析的应用,针对卒中提供筛查与诊断一体化影像平台,落地全国首个数智化基层协同救治体系。

吴迪嘉介绍,基于多病种影像数据训练的医疗影像模型,以及医疗文本/知识模型的创新基础模型,联影智能正在构建医用通才大模型 ,进一步赋能中国未来医疗开发者,为医疗场景提供诊疗服务。

(雷峰网《医健AI掘金志》后续将推出更多医疗大模型相关话题文章,如《医疗信息化厂商的「GPT焦虑症」》等,欢迎添加作者微信qiaoyw186抢先交流。)

]]>
医疗AI //m.drvow.com/category/healthai/k4RMy262vfpfHIXW.html#comments Thu, 06 Jul 2023 10:38:00 +0800
英矽智能冲刺「亚太AI制药第一股」:四年估值翻16倍,AI制药能否看到「钱景」? //m.drvow.com/category/healthai/XujbYh9oSnWQ83A9.html 6月27日,AI制药公司英矽智能递交招股书,准备在港交所上市。联席保荐人为摩根士丹利、中金公司。预计集资额约为2亿美元。

招股书透露,上市融资资金将用于5个方向:核心产品的进一步临床研发提供资金;其他管线候选药物的临床研发提供资金;进一步开发并扩展机器人实验室;开发新的生成式AI模型及相关的验证工作;以及用作营运资金及其他一般公司用途。

在收入方面,该公司2021、2022年营收分别为471万美元、3014.7万美元,增幅达539.6%;年内亏损分别为1.3亿美元、2.22亿美元。

作为一家AI制药公司,英矽智能(Insilico Medicine)曾在2021年底就传出申请赴美国上市的声音,而此次冲击IPO,也使其获得了冲刺“亚太AI制药第一股”的称号。

7轮融资超4亿美元,3款在研药物进入临床验证期

英矽智能成立于2014年,是利用生成式AI进行药物研发的先驱者之一。

招股书显示,公司现有研发团队共255人,由资深生物学家、化学家、药物开发人员及AI专家组成,其中绝大多数持有相关领域的硕士或博士学位。

成立至今,英矽智能共经历7轮融资,累计融资达4.075亿美元。

背后资本有启明创投、礼来亚洲基金、Bold Capital Partners、Pavilion Capital、药明康德、创新工场、百度风投、斯道资本、华平投资、红杉中国、B Capital、Prosperity 7、Deerfield Partners、Mirae Asset、清池资本、CPE源峰、高瓴、OrbiMed、Maison Capital、锐智资本、复星医药、中国生物医药等一众知名机构投资。

据招股书显示,2018 年-2022 年,英矽智能投后估值从5440万美元升至8.95亿美元,估值四年增长近 16 倍。

如今递表IPO,实际上也是众望所归的关键一步。同样,英矽智能的AI布局,也成为行业发展的重要参照。

公司于2016年首次同行评议的期刊上描述了使用生成式AI设计新分子的概念。此后,英矽智能开发了多种以生成对抗网络(GAN)驱动药物发现的方法和功能,并将这些算法整合到一体化、高度集成、端到端药物研发平台Pharma.AI。

该平台覆盖生物学、生成化学和临床研究等多个领域。包括可商业化的靶点发现引擎Biology42、分子生成和设计引擎Chemistry42、临床试验结果预测引擎Medicine 42。

此外,Pharma.AI亦可与Alphafold、ChatGPT等外部工具集成,以利用最新的技术突破,为不同的客户需求创建定制的解决方案。

截至最后实际可行日期,英矽智能已高效搭建多元化的自研疗法组合,包括靶向29个靶点的31条研发管线,覆盖纤维化、肿瘤、免疫学及其他需求缺口巨大的治疗领域。所有管线皆为自主研发,并无授权引进项目。

自2021年以来,英矽智能提名了12款临床前候选化合物,并将其中的3款在研药物推进到临床验证阶段。

值得注意的是,目前进展最快的管线为小分子候选药物ISM001-055(亦称为 INS018_055),已进入IIa期临床试验,主要用于治疗纤维化相关适应症,并有望成为全球首创(first-in-class)的候选药物。

据悉,今年4月,英矽智能已启动了一项全球多中心、随机、双盲、安慰剂对照的IIa期临床试验,以评估ISM001-055的安全性、耐受性、PK和疗效。此外,ISM001-055于今年2月获得FDA的孤儿药认定,使得英矽智能有资格获得激励,包括在批准后7年的潜在市场独占权。

招股书显示,公司已经获得可观收入,主要来自药物发现与研发合作服务,从2021年的470万美金增长到2022年的3010万美金,同期增长540%。

AI Biotech公司,盈利成为关键

英矽智能九年进化,为全球TOP 20制药企业中的10家提供AI药研服务,与复星、赛诺菲等全球头部药企建立战略合作。

2022年1月,英矽智能与上海复星医药达成战略合作。这是当时在国内是AI和药企间首付(1300万美元)最高的一笔合作。

根据协议,双方将在全球范围内共同推进4个靶点的AI药物研发,并针对QPCTL靶点在研项目上市后利润分成,两个项目最多可收取2400万美元、5800万美元。

随后,2022年11月,英矽智能与法国药企赛诺菲达成战略研究合作。

根据协议,该合作将利用英矽智能的Pharma.AI药物发现平台,推进基于不超过6个创新靶点的候选药物研发,总潜在价值最高达12亿美元。

尽管这些项目合作足以证明英矽智能的平台研发实力,但更像是一种“折中”方式。

AI制药行业发展至今,衍生出了AI SaaS、AI CRO及AI Biotech三种商业模式,即售卖AI药研平台与软件的使用服务、提供药物发现服务、利用AI自建新药研发管线成为药企,“药味”逐渐变浓。

据医健AI掘金志观察,2021年之前,英矽智能的药研管线尚未成熟,无法授权转让,只能将自有平台与药企进行战略上的合作,走了一条类似CRO的商业模式。但这种模式下收入确认周期较长,合作要求较为严苛,因此英矽智能未来很大概率走向AI Biotech。

实际上,这种商业模式的转化也是AI制药行业的共性。因为长远来看,公司的实力由技术和管线决定,AI Biotech的估值方式也会拥有更大的想象空间。

与此同时,英矽智能也在招股书中,对全球医药市场的市场规模进行了分析。

总体来看,2021年全球医药市场规模已达14012亿美元,预计于2025年将增加至17188亿美元,于2030年将增加至21148亿美元,复合年增长率分别为5.2%、4.2%。

截至2021年,按收入计算,美国、中国医药市场位列前二。

美国2021年的市场规模为5,586亿美元,预计于2025年将增加至6783亿美元,2030年将增加至8158亿美元,复合年增长率分别为5.0%、3.8%。

中国是全球第二大医药市场,于2021年市场规模为2466亿美元,预计于2025年将增加至3200亿美元,于2030年将增加至4245亿美元,复合年增长率分别为6.7%、5.8%,均超美国。

此外,在创新药和仿制药方面,前者在全球医药市场的份额将持续扩大,至2025年将达到万亿美元级别;后者则至千亿美元级别,预计将在2025年相差约2.5倍。

于2021年,创新药占全球医药市场的最大份额,达到9670亿美元。预计于2025年该等药物市场将达到12227亿美元,于2030年将达到15455亿美元,复合年增长率分别为6.0%、4.8%。

相比之下,仿制药及生物类似药在全球市场中所占的比例较小。预计于2025年将达到4961亿美元,于2030年将达到5693亿美元,复合年增长率分别为3.4%、2.8%。

长远来看,英矽智能亮相港交所,是对整个AI制药行业的提神振气。但面临即将进入的新阶段,英矽智能也将面临两个挑战:

一是药物要尽快在临床得到验证。目前公司已有3条管线进入临床验证期,需要尽快在病人身上得到关键验证,验证药效;

二是如何实现盈利。无论是否处于资本寒冬,只有快速实现盈利,才能很好地活下去。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/XujbYh9oSnWQ83A9.html#comments Fri, 30 Jun 2023 09:39:00 +0800
生命科学迎来大模型时代:智源研究院院长黄铁军、AWS李健都讲了啥? //m.drvow.com/category/healthai/MAdtvfipNsnomc8z.html 近日,由播禾创新中心承办的第五届“全球人工智能产品应用博览会”(Al Expo 2023)--IT&BT融合创新应用论坛,在苏州召开。

本次大会聚焦生物计算大模型话题,围绕数据获取、数据分析、数据应用等多个维度探讨生物计算大模型的构建及价值,以及大模型在药物发现、工艺、临床等多个领域的的潜在应用价值。

会上,来自全国的医药专家、领军AI医药企业、以及新兴大模型企业,围绕生命科学大模型之路、AI制药的商业化之路等话题进行了充分的讨论和分享。

大会伊始,薄荷天使基金创始合伙人,播禾创始人刘毓文、苏州工业园区党工委委员,管委会副主任倪乾,分别作了开幕式致辞。

刘毓文

刘毓文表示,IT&BT融合应用创新论坛希望为大家带来行业最新的交叉进展,并从数据模型算力探索以大模型驱动的AI在生命科学领域的前沿动态,通过丰富的应用实例展示AI赋能生物医药开发的全流程。

作为中国首家IT&BT交叉融合创新中心,播禾创新中心始终致力于联合业界一起努力成就AI  for Life  Science。

倪乾

倪乾表示,作为赋能手段,AI与生命科学相融合,在药物研发、基因治疗等方面正在发挥越来越重要的作用,为实现“健康中国”拓展了新的空间。

在推动IT+BT融合创新方面,苏州工业园区具备独特的优势。

一方面,园区坚持“一张蓝图绘到底”的原则,拥有良好的产业基础。目前已集聚1500多家AI企业,涵盖基础层、应用层全产业链。

另一方面,园区拥有一流的创新体。诸如国家生物药技术创新中心、国家新一代AI创新发展试验区核心区、苏州超算中心、IT+BT融合创新中心、全国重点实验室及高校科研院所、龙头企业创新中心等,在学科专业、人才资源、成果转化等多个方面形成系统支撑。希望借本次大会东风,催生更多原创性成果和新业态新模式。

赵兴明

大会开始之后,复旦大学特聘教授、中山医院双聘教授、计算神经科学与类脑智能教育部重点实验室主任赵兴明,以《AI赋能的人体微生物组学数据挖掘》为题,首先做了开场报告。

赵兴明表示,2010年的《Nature》上,将肠道微生物称为人的第二基因组,与很多人类疾病密切相关。但如何以AI的方式,量化的角度研究微生物,科研投入力度还不够充分。

目前他所在的实验室已开发了宏基因组组装错误识别与矫正算法metaMIC,以及基于物种识别的Binning算法(Semibin),大大提高了组装准确率。

此外,他还揭示了健康人群中的肠道真菌结构以及四种真菌肠型,并进一步基于肠道细菌发现了两种自闭症亚型,开发了多个微生物组学数据库。

下一步,团队还将基于所开发的基因目录,进一步与国内外科研院所和临床医疗开展合作,探究微生物包括人体肠道微生物与人类生命大健康、大脑认知和行为等方面的影响。

黄铁军

随后,北京智源人工智能研究院院长黄铁军,以《高精度生命模拟》为题做了演讲。

黄铁军表示,今年是在智源研究院的第5年,一直在持续推进生命模拟研究中心的工作。2022年智源大会上发布了最高精度的仿真线虫,今年进一步投入到心脏模拟仿真工作中,同时启用“天河3号”超算计算机作为算力支持。

他进一步表示,今年3月,国外研究团队利用AI完整重建果蝇幼虫大脑已经取得里程碑进展,意味着未来绘制更多其他生物的大脑连接组,尤其是人类大脑终将成为可能。

陈红阳

第三位演讲嘉宾是之江实验室图计算研究中心副主任陈红阳,他的演讲题目是《大模型图预训练与GraphGPT的应用及展望》。

陈红阳表示,GPT直接用于生物制药领域存在一些不足,一是无法保证可信性、二是在特定领域表现差、三是成本高昂。

如Bert 和 ChatGPT 等,已在自然语言领域展现出了惊人的效果,但应用到生物制药领域则无法应对生物领域的非欧结构数据、生成结果准确性难判定,数据标签稀缺、如何融入领域知识,以及如何解决模型训练中的工程问题等。

目前团队正在构建融合领域知识的大规模分子生成预训练模型--朱雀图预训练大模型,应用于药物分子生成、靶点发现,性质预测等生物制药领域,并将其作为生物制药GPT 的核心基础,来加速药物发现和降低药物研发成本。

此外,陈红阳表示团队很早之前就开始在图机器学习和图科学计算领域布局,已成功研发了基于分布式内存计算的大规模高效图学习平台“之江朱雀”,该平台一站式赋能生物制药和生物育种等科学计算领域,通过软硬件协同加速来助力科学发现。

李健

上午主旨发言的最后一位嘉宾是亚马逊云科技大中华区首席医疗行业总监李健,他重点分享了《大模型时代生命科学领域的云端变革契机》。

李健分享了“云上大模型”的思路与解决方案。他表示,我们不认为一种模型或一种方法能够解决千行百业的所有问题。

作为云计算企业,我们一直在思考如何帮助客户从生成式AI获取研究与商业价值,不同研究机构和行业领域的公司如何低成本地接入大模型,高效率开发相应的应用。

一方面,亚马逊云已上线大模型开发功能,除了自研大模型外,还接入了业界公认的大模型,并提供定制服务;

另一方面,云上大模型还有一个优势,可以对客户数据进行安全、合规的数据调用和分析服务,这也是我们认为大模型应用和开发过程中,可能大家容易忽视的问题。尤其是在医疗和生命科学行业,患者数据和临床数据采集后,如何确保这些数据不被黑客攻击,不会出现不适当的使用,将是大模型时代的关键所在。

随后,在本次的“IT&BT融合创新应用论坛”中,在播禾创新中心总经理乐晓桐的主持下,复旦大学赵兴明教授、之江实验室图计算研究中心陈红阳副主任、亚马逊云科技李健、以及碳硅智慧创始人,CEO邓亚峰,围绕“生命科学大模型之路”进行了圆桌讨论。

后续,雷峰网《医健AI掘金志》将将邀请业内专家推出《医疗+GPT》新系列,敬请关注更多详细报道和专家访谈。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/MAdtvfipNsnomc8z.html#comments Thu, 29 Jun 2023 10:19:00 +0800
第十二届「肿瘤系统生物学国际研讨会」暨2023年度「龙星计划」开幕在即:一场世界级的「理工医跨学科交流盛宴」 //m.drvow.com/category/healthai/jY0krAaXeHUyvyAx.html 2023年8月26日-27日,第十二届肿瘤系统生物学国际研讨会(ICSB 2023),将在深圳南方科技大学召开。

本次会议由中国生物信息学学会(筹)、南方科技大学医学院、吉林大学计算机科学与技术学院、中国生物信息学学会(筹)系统生物学专委会、及广东省生物信息学学会联合主办,测序中国协办。

雷峰网《医健AI掘金志》作为大会首席合作媒体,将全程参与 ICSB 2023 的报道。

ICSB(The International Workshop on Cancer Systems Biology)自2011年由徐鹰教授和梁艳春教授发起, 旨在提供一个平台,以加强实验生物学与计算肿瘤学者的交流、肿瘤基础学者与临床医生的交流、国内与国外华人肿瘤学者的交流,并在此基础上培养新一代肿瘤系统生物学者。

ICSB与肿瘤领域其他会议最大的区别是,不同背景的学者会从不同的研究角度,在不同层面(生物系统、生存环境、细胞内外的化学及物理环境)向参会人员展示最新的研究进展。

截至目前,大会已连续成功举办11届,累计邀请数百位肿瘤系统生物学领域专家进行报告。

本届会议邀请到了20位国内外重量级肿瘤实验及计算生物学者做大会报告,融合关于肿瘤的不同观点,积极开拓未来肿瘤研究的新思路。

除特邀讲座外,本届会议还欢迎广大参会者以海报形式分享对肿瘤研究和治疗的见解和经验。

具体会议注册等信息可查询 ICSB 官网:http://www.mrsbl.com/ICSB2023/index.html

专家介绍

|国外专家

王天赐(Stephen TC. Wong)美国康奈尔医学院Methodist医院杰出讲席教授

王天赐(Stephen TC. Wong),美国康奈尔医学院Methodist医院杰出讲席教授,研究方向为系统生物学。

他是休斯敦卫理公会医院研究院系统医学及生物工程系的创系主席,及终身杰出特聘讲座教授,同时也是康奈尔大学医学院放射学、病理学、实验室医学、神经学及神经科学的教授。

作为一位具有较高国际知名度的计算机、成像及系统生物学专家,王博士曾经领导研发了第一台喷墨打印机自动化生产,第一个超大规模集成电路1MB计算机内存芯片,当时最大的在线证券交易系统,及所有美国医学学术中心中第一个全医院范围内的数字放射影像管理系统。这个系统使全世界的医院和医生远程读取病人的医学图像记录得以实现。

他在工业界及医学界有超过20年的研发经历,加入康奈尔大学之前,曾就职于惠普(HP)、贝尔实验室(AT&T Bell Lab.)、飞利浦电子(Phillips)、哈佛大学医学院等世界著名公司及研究机构。

目前,Stephen Wong研究主要集中于药物重定位、图像引导介入和数字健康领域,并通过系统医学的方法来综合理解人类健康和疾病问题。系统医学的策略是通过整合来自生物、化学、医学、行为及环境的多尺度数据,综合运用先进的计算、电子、信息、成像和数学方法来深入探索疾病的发病机理,从而设计出更有效的诊疗策略。

本次演讲主题为《过量的磷脂酰乙醇胺在肥胖症中会加剧阿尔茨海默症和癌症》。

个人页面:

https://www.houstonmethodist.org/faculty/stephen_wong/

姜鹏,美国国立卫生研究院终身研究员

姜鹏,美国国立卫生研究院(NIH)国家癌症研究所终身研究员,研究方向是癌症生物学。

本科毕业于清华计算机科学系,硕博就读于普林斯顿大学计算机科学系。2013年至2019年在哈佛大学丹娜法伯癌症研究院(Dana-Farber Cancer Institute,世界三大癌症治疗机构)进行博士后培训,师从刘小乐。2019年7月起,他在国家癌症研究所(NCI)开始独立研究,目前实验室专注于开发大数据和AI框架,从而确定实体肿瘤的生物标志物和癌症免疫治疗的新治疗方法。曾获NCI K99独立之路奖。

本次演讲主题为《用大数据方法研究肿瘤免疫规避过程中的细胞间信号传递》

个人页面:

https://irp.nih.gov/pi/peng-jiang

陈斯迪,美国耶鲁大学医学院遗传学副教授

陈斯迪,耶鲁大学医学院遗传学系、系统生物学研究所副教授。研究方向为癌症系统生物学。

本科毕业于北大生命科学院,博士毕业于芝加哥大学遗传演化生物学系,曾师从1993年诺贝尔生理学/医学奖得主 Phillip A. Sharp教授。2015年陈斯迪加入耶鲁大学并建立独立课题组,任职于遗传学系、系统生物学研究所和耶鲁大学癌症中心。

他的主要愿景是开发下一代技术并将其转化为有效和安全的治疗方法。通过结合两个新兴领域,陈博士创新了 "基因编辑用于免疫治疗,并作为免疫治疗 "的概念。他首次进行了体内CRISPR筛选,并开发了MAEGI作为一种新型的免疫基因治疗概念。

本次演讲主题为《基因编辑和免疫治疗》。

个人页面:

https://medicine.yale.edu/genetics/profile/sidi-chen/

迟洪波,美国罗切斯特大学教授

迟洪波,美国罗切斯特大学教授,研究方向为免疫代谢、T细胞生物学和系统免疫学。

他在美国罗切斯特大学获得博士学位,随后进入耶鲁大学医学院跟随Richard Flavell进行博士后训练,研究MAPK信号在免疫调控中作用。2007年,他加入圣犹达儿童研究医院从事独立科研,目前他是该医院免疫学系教授和Robert G. Webster免疫学教授。

他的研究重点是免疫信号和代谢的机制,特别是mTOR和其他信号通路,如何与T细胞命运的关键决定因素和树突状细胞生物学中的代谢程序相互作用。曾获AID R37优秀奖以及NCI杰出研究员奖。

本次演讲主题为《T细胞代谢和免疫肿瘤学的功能基因组》。

个人页面:

https://www.stjude.org/directory/c/hongbo-chi.html

程飞雄,美国克利夫兰医学中心助理教授

程飞雄,美国克利夫兰诊所基因组医学研究所、凯斯西储大学医学院分子医学系助理教授,研究方向为心脏肿瘤学(Cardio-Oncology)。

他曾在全球殿堂级心脏专科医院--克利夫兰诊所进行博士后研究,目前实验室研究方向是结合基因组学、网络医学、生物信息学、计算生物学、化学生物学、实验药理学和系统生物学分析(如单细胞测序和ips衍生的心肌细胞)的工具,解决人类复杂疾病,如心脏肿瘤、肺血管疾病和癌症等。

本次演讲主题为《利用多组学和网络系统生物学进行精密癌症医学》。

个人页面:

https://case.edu/cancer/members/member-directory/feixiong-cheng

石瑜(Yu Shyr),范德堡大学生物统计学系主任

石瑜(Yu Shyr),范德堡大学生物统计学系主任。研究方向为生物统计学。

本科毕业于淡江大学统计系,硕士毕业于美国密西根州立大学统计研究所,博士毕业于美国密西根大学安娜堡校区生物统计研究所。现任美国范德堡大学生物统计系系主任、定量科学中心主任、癌症中心副主任。

本次演讲主题为《空间模式和共定位的可扩展和无模型检测》

个人页面:

https://www.vumc.org/biostatistics/person/yu-shyr

杨达,匹兹堡大学药学院副教授

杨达,匹兹堡大学药学院副教授。研究方向为癌症药物基因组学、癌症相关的非编码RNA。

2009年博士毕业于哈尔滨医科大学生物信息与技术学院,之后在德州大学安德森癌症中心深造。

杨达教授作为通讯作者在Cancer Cell等高水平期刊发表文章55篇,近五年引用9000多次。担任包括JAMA, JAMA Oncology, Briefings in Bioinformatics和NAR 等30多 家美国和欧洲学术刊物的特约审稿人以及NIH癌症遗传学(CG)基金委员会特约评审专家。

杨达教授多次获得各种研究奖项,包括NIH卵巢癌优秀专项研究项目(SPORE)青年学者生涯奖(Career Development Award)、Harold C. & Mary L. Daily 癌症基金研究奖、Diane Denson Tobola卵巢癌研究奖、Bristol-Myers Squibb临床/转化研究奖等。

本次演讲主题为《揭秘隐藏角色: 肿瘤药物愿景中IncRNA的特征研究》

个人页面:

https://pages.pharmacy.pitt.edu/yang/

Xin Lu,美国圣母大学生物科学系副教授

Xin Lu,美国圣母大学生物科学系副教授。研究方向为肿瘤免疫学和免疫治疗。

2004年本科毕业于清华生命科学系,2010年获普林斯顿大学博士学位,师从分子生物学系康毅滨教授,随后在哈佛医学院、德克萨斯大学安德森癌症中心进行了两段博士后训练,2017年起入职圣母大学生物科学系。目前实验室研究重点是肿瘤微环境串扰的分子和细胞机制,特别是癌细胞和髓系间室之间的相互作用,包括原发性肿瘤和转移到骨骼和其他器官的肿瘤。

本次演讲主题为《肿瘤免疫抑制的内在和外在机制》。

个人页面:

https://biology.nd.edu/people/xin-lu/

Jindan Yu,美国埃默里大学医学院泌尿外科代理教授

Jindan Yu,美国埃默里大学医学院泌尿外科代理教授,研究方向为泌尿系统肿瘤、前列腺癌等。

本科毕业于北大健康科学中心(相当于美国医学博士),随后获得密歇根大学安娜堡分校硕士和博士学位(生物医学工程方向)。2023年加入埃默里大学,她在伊利诺伊州西北大学的血液学/肿瘤学以及生物化学和分子遗传学系担任教授。目前在《自然遗传学》、《分子细胞》和《临床调查杂志》等著名期刊上发表了近90篇文章。

本次演讲主题为《基于谱系可塑性的转录组、表观基因组和4D 核组》。

个人页面:

https://med.emory.edu/directory/profile/?u=JYU389


|国内专家

陈洛南,中国科学院上海生命科学研究院研究员

陈洛南,中国科学院上海生命科学研究院研究员,长期采用系统工程、动力学建模等方式研究复杂疾病的发生机制。

1984年本科毕业于华中科技大学电气工程专业,1988年和1991年分别获日本东北大学系统科学硕士、博士学位。1997年起在日本大阪产业大学电气工程和电子学院任教,在日本和美国从事科研教学工作等25年以上,2009年10月加入中科院上海生命科学研究院。

近年来,在系统生物学和复杂网络等研究领域发表了350余篇期刊论文及10余部编著书籍,论文总引用超2万次。并担任中国生物化学与分子生物学会分子系统生物学专业分会主任委员,IEEE-SMC系统生物学委员会主席,中国运筹学会计算系统生物学分会名誉理事长,中国药理学会网络药理学专业委员会副主任委员等。

本次演讲主题为《控制从肺腺到鳞状转分化的临界点》

个人页面:

https://people.ucas.ac.cn/~LuonanCHEN

时玉舫,苏州大学转化医学研究院院长

时玉舫,苏州大学转化医学研究院院长,长期从事免疫与干细胞研究。

1982年本科毕业于山东农学院(现为山东农业大学),1982年至1985年在山东农学院畜牧兽医系担任助教,1988年和1992年在加拿大阿尔伯塔大学获硕士和博士学位,1992年至1995年在加拿大多伦多大学从事博士后研究。1995年至2001年任教于美国乔治•华盛顿大学微生物与免疫学系和美国红十字会赫兰生物医学研究所免疫学系。2001年至2008年,在美国新泽西医科齿科大学罗伯特•强生医学院分子遗传、微生物和免疫学系任终身教授和特聘大学教授。2008年至2014年,任中国科学院上海生命科学院/上海交通大学医学院健康科学研究所所长、研究员。现任苏州大学转化医学研究院院长。

他长期从事免疫与干细胞研究,在探索免疫稳态维持和组织再生修复的细胞与分子机制等方面取得了一系列原创性、突破性和引领性成果。迄今为止,世界上对干细胞与免疫反应相互调控的认知大多源于时玉舫及其团队的科学发现。

本次演讲主题为《MSC调节的组织微环境与肿瘤发展》。

个人页面:

http://itm.suda.edu.cn/59/db/c27543a481755/page.htm?eqid=cffc78e300058ed4000000046457a1d9

刘庄,苏州大学功能纳米与软物质研究院教授

刘庄,苏州大学功能纳米与软物质研究院教授。研究方向为生物材料与肿瘤纳米技术。

2004年本科毕业于北京化学与分子工程学院,2008年获得斯坦福大学化学博士学位,2008年至2009年在斯坦福大学化学系及医学院从事博士后研究。2009年6月加入苏州大学功能纳米与软物质研究院。

近年来在生物材料与肿瘤纳米技术领域从事研究,围绕肿瘤诊疗中的若干挑战性问题,发展了一系列新型纳米探针用于体外生物检测与活体分子影像,并探索了多种基于纳米技术和生物材料的肿瘤光学治疗、放射治疗、与免疫治疗新策略。共发表学术论文400余篇,论文总引用超过85000次。

本次演讲主题为《促进癌症免疫治疗的生物材料》。

个人页面:

http://nano.suda.edu.cn/lz/lzls/list.htm

谢丹,中山大学肿瘤防治中心“华南肿瘤学国家重点实验室”项目组长

谢丹,中山大学肿瘤防治中心“华南肿瘤学国家重点实验室”项目组长。研究方向为恶性肿瘤侵袭转移分子机制,肿瘤标志物和早期诊断和基因治疗等。

本科毕业于中南大学湘雅医学院临床医学系,硕士毕业于中山大学中山医学院病理学系,博士毕业于香港大学医学院临床肿瘤学系。随后任职中山大学,现任肿瘤防治中心“华南肿瘤学国家重点实验室”课题组长(PI),主要运用分子肿瘤学和实验病理学等相关技术,进行多种人类实体肿瘤恶性分子表型的调控与蛋白修饰及肿瘤侵袭转移和分子诊断标记物的研究。

本次演讲主题为《生命最普遍的调控环节-RNA变异/修饰与膀胱癌侵袭转移》。

个人页面:

http://skl.sysucc.org.cn/Info/ArticleShow.aspx?AID=96

虞先濬,复旦大学附属肿瘤医院院长

虞先濬,复旦大学附属肿瘤医院院长,擅长各种胰腺肿瘤、神经内分泌肿瘤、肝胆肿瘤的外科治疗和综合治疗。。

从事外科工作20余年,先后在美国Baylor医学院以及MD. Anderson肿瘤中心进行胰腺癌的的博士后研究与临床

培训。2010年创建复旦大学附属肿瘤医院胰腺外科并担任科主任,每年带领团队完成胰腺恶性肿瘤切除手术约2500例,综合治疗50000余人次。团队胰腺恶性肿瘤手术量约占上海总胰腺手术的1/3,连续8年居上海市首位,已建设成为国际一流、 国内领先的胰腺肿瘤医教研中心。

同时,开展基础临床转化研究,多项研究成果纳入国际国内指南共识,全面提高胰腺肿瘤手术的安全性、根治性

和有效性,显著延长胰腺癌患者生存期。先后受邀在IAP (国际胰腺病学会)、JSCO ( 日本临床肿瘤学会)等国际学术组织年会做专题报告。

本次演讲主题为《胰腺癌淋巴转移特性,发现胰腺癌“手术不获益”亚群》

个人页面:

https://www.shca.org.cn/Home/doctor/intro/id/316/name/6Jme5YWI5r+s

张宁,北大第一医院肿瘤转化研究中心常务副主任

张宁,北大基础医学院教授,北大第一医院肿瘤转化研究中心常务副主任。长期从事生物医学研究,围绕肝癌这一关键临床难题,从分子遗传学、细胞生物学、药物筛选、纳米技术等多个侧面入手展开转化应用研究。

美国约翰·霍普金斯大学医学院生化、细胞及分子生物学博士,历任北京大学医学部副主任、北京大学科研部部长、天津医科大学副校长、天津医科大学附属肿瘤医院及天津肿瘤研究所副所长、北京大学化学学院化学生物学系副主任等职务。

近五年在Cancer Cell、Nature Biotechnology、Gastroenterology、Nature Communications、Nucleic Acids Research、Genome Research、Cancer Research等国际期刊中发表SCI文章48篇,其中28篇为通讯作者或共同通讯作者;获得授权专利7项(美国专利1项,中国专利6项)。

本次演讲主题为《肝癌表型和单细胞异质性》。

个人页面:

https://sbms.bjmu.edu.cn/jsdw/bssds/9bf1897a20f048358ae8b02f4abf2ddd.htm

张泽民,北大生命科学学院讲席教授

张泽民,北大生命科学学院讲席教授,研究方向为用生物信息学来解决肿瘤发生过程、肿瘤微环境和对药物的响应等重要问题。

本科毕业于南开大学生物系, 1989年由CUSBEA项目赴美留学,博士毕业于宾州州立大学生物化学和分子生物学专业,随后在美国旧金山加州大学进行博士后训练。1998年起任职于美国基因泰克公司,担任癌症基因组学和生物信息学组的首席,致力于应用机器学习和高通量测序等高新技术进行抗癌药靶和生物标记物的发现。

2014年加入北大生命科学学院,现任北京大学生物医学前沿创新中心(BIOPIC)与北京未来基因诊断高精尖创新中心(ICG)研究员,北京大学生命科学学院讲席教授,北大-清华生命科学联合中心(CLS)高级研究员。他的实验室目前正利用前沿的实验技术和生物信息学方法进行肿瘤及其微环境的异质性、耐药性、以及免疫细胞和肿瘤细胞的相互作用等方面的研究。

本次演讲主题为:《肿瘤微环境的异质性》。

个人页面:

http://www.bio.lb.pku.edu.cn/teacher_dis_oa.php?cid=208&&teaid=99

邹贻龙,西湖大学生命科学院研究员

邹贻龙,西湖大学生命科学院研究员,研究方向为功能性脂质组学和代谢调节。

本科毕业于清华生命科学与技术系,2016年获得美国纽约纪念斯隆凯特琳癌症中心癌症生物学博士学位,师从导师Dr. Joan Massagué。博士期间,他曾开创利用Translating Ribosome Affinity Purification and Sequencing (TRAP-Seq) 技术研究已广泛转移的癌细胞的在体基因表达谱的先例。

2016年至今在波士顿博德研究所 (Broad Institute of MIT and Harvard) 以及哈佛大学化学生物学系从事博士后研究,师从导师Dr. Stuart L. Schreiber。其博士后研究阐释了透明细胞癌中的脂代谢异常和对于铁死亡的独特敏感性,发现了细胞铁死亡执行中的关键蛋白,并揭示了决定细胞铁死亡敏感性的重要分子机制。

本次演讲主题为《多不饱和脂质组在铁死亡和癌症中的多面作用》。

个人页面:

https://www.westlake.edu.cn/faculty/yilong-zou.html

戴紫薇,南方科技大学生物系助理教授

戴紫薇,南方科技大学生物系助理教授,研究方向是肿瘤代谢、表观遗传学的代谢调节和基因表达。

2010年本科毕业于北大数学科学学院,2016年博士毕业于北大定量生物学中心,同年赴美国杜克大学从事博士后研究,2021年2月全职回国加入南方科技大学生物系,担任助理教授。

她的研究方向是基于计算和系统生物学的交叉学科研究,通过多组学数据分析和代谢网络定量建模方法的整合,研究肿瘤中的营养代谢,特别是葡萄糖和氨基酸代谢的异常,以及代谢对表观遗传修饰和基因表达的调控机制。

研究成果发表在Nature, Cell Metabolism, Nature Reviews Genetics, Nature Genetics, Nature Communications,Science Advances, Metabolic Engineering, JBC等国际顶尖杂志,多次被选为封面文章,并担任Quantitative Biology杂志编辑。总引用次数超1200次。

本次演讲主题为《肿瘤细胞代谢的数学建模》。

个人页面:

https://faculty.sustech.edu.cn/?tagid=daizw&iscss=1&snapid=1&orderby=date&go=1

徐鹰 ,南方科技大学医学院讲习教授

徐鹰 ,南方科技大学医学院讲习教授,获国家级人才头衔,计算系统生物学及生物信息学者。研究方向为肿瘤系统生物学。

2023年1月加入南方科技大学医学院,之前为美国佐治亚大学生物化学系“校董事会教授”及“佐治亚科学协会著名学者讲席教授”(2003-2022),佐治亚大学生物信息研究所首任所长(2003-2011)。

他是AAAS Fellow及IEEE Fellow。1991年获得美国科罗拉多大学计算机科学博士学位(组合数学和算法)。1993年加入美国橡树岭国家实验室,工作十年,历任助理研究员、研究员、资深研究员及课题组长(senior staff scientist and group leader)。2003年,他的研究团队加盟佐治亚大学,成立生物信息研究所,同时入职佐治亚大学生化系。自2008年起,开始通过肿瘤组学数据研究肿瘤发生、发展、转移的推手和机理。

目前徐鹰共发表近400篇学术论文,五部著作,包括世界上第一部“肿瘤信息学”专著,引文18000余次、H指数为69。自2003年起,每年在国内主持召开“生物信息学国际研讨会(2003-2013),及“肿瘤系统生物学国际研讨会”(2011-),并每年主讲“生物信息学”或“肿瘤信息学”暑期课程,共吸引2万余人参加。

本次演讲主题为《转移后肿瘤的生物学》。

个人页面:

https://med.sustech.edu.cn/faculty/detail/id/2323.html?lang=zh-cn

《肿瘤信息学》课程同步开启

CCF龙星计划(Dragon Star),是针对近年来我国经济得到持续发展,不仅在产业,而且在科学技术等方面也面临全球一体化严峻挑战的现状,组织一批在国际学术界已有成就、有一定地位的原中国留学生,尤其是在信息科学前沿领域做出重大贡献的海外学有所成者,不定期回国,就某一领域在中国各地大学,系统讲授一门研究生课程(每门课程3-5天)。同时就所讲课程的学术领域、有关课题与国内科学家及研究生共同讨论研究。

CCF龙星计划自2002年启动,至今已有近百名华人学者参与授课,在近百所大学和科研机构开课近200门,听课总人数超过了14000人。

该课程由南方科技大学徐鹰教授讲授。疫情前每年听课人数300人左右,2021年线上课程吸引超5000人听课,2022年线上课程吸引了超过2万人参与,今年课程将线上线下同步进行。

今年的课程将在线上线下同步授课,授课时间为2023年8月21日--8月25日8:30--12:00。

课程主要内容围绕《肿瘤信息学》一书展开,其中生物信息学技术将贯穿始终,具体的课程时间安排如下:

关于 ICSB 2023 会议和龙星计划报名事宜:

1,扫描下方二维码,或添加报名联系人李轩即可免费报名,微信 13844099750,Email:xuanli_gadbee@163.com

2,报名时务必选择“深圳线下”或“线上”参与方式。

若选择线下,食宿自理,场地路线图将于开课前一周通过邮件告知;

若选择线上,直播地址将于开课前一周通过邮件告知。

]]>
医疗AI //m.drvow.com/category/healthai/jY0krAaXeHUyvyAx.html#comments Wed, 21 Jun 2023 14:41:00 +0800
GAIR Live|AI药物发现平台,如何与传统医药企业打出「组合拳」?(上篇) //m.drvow.com/category/healthai/ukXtv9fVuEqxG32W.html 作为药物发现阶段的研究核心,先导结构的发现和优化往往需要花费数年时间,投入数亿美元,长期被视为药物研发的关键技术瓶颈。

从20世纪70年代以来,计算机辅助药物设计(CADD)作为一个日趋完善的药物发现手段,主要包括虚拟筛选和药物从头设计两种策略,曾极大提升新药设计和开发的效率。

“我们即将迎来生物医学大爆发的时刻,但这一成果的取得,不仅取决于生物学家与医学家的努力,甚至更大程度上取决于数学、物理学、化学、计算机技术等的发展以及与生物医学的结合。”

“随着AI技术的成熟,蛋白质、基因组学数据的积累,AI制药平台化势必成为医药行业的一股革命性力量,从根本上改变传统药物设计试错流程,未来AI大模型技术又将引发新的期待。”

近日,由雷峰网GAIR Live&《医健AI掘金志》举办的《「人机协同」模式下的新药研发》线上圆桌论坛落幕,五位具有投资、企业、药物实验、AI制药背景的专家表达出这样的愿景。

本次论坛,由浙江大学药学院教授谢昌谕主持,北京大学药学院研究员刘振明、腾讯医疗健康AIDD技术负责人刘伟、浙江工业大学智能制药研究院院长段宏亮、清华大学智能产业研究院战略发展与合作部主任张煜参与讨论。

在上篇中,他们共同辨析了人机协同模式下的药物研发历程、近几年AI制药领域的算法和模型突破、以及与传统药物研发手段相比AIDD的优劣性。

在下篇中,则探讨了我国创新药研发的痛点、AI制药的数据之困,以及新一轮AI浪潮下药物研发的可能性。近期AI大模型爆火,欢迎添加作者微信(微信号:icedaguniang),互通有无。

“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网与中国计算机学会(CCF)合作创立的CCF-GAIR大会,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。

经过几年发展,GAIR大会已成为行业标杆,是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。

GAIR Live作为雷峰网旗下视频直播品牌,旨在输出新鲜、深度、原创的大咖访谈与对话内容,打造辐射产、学、研、投的特色线上平台。

以下是主题论坛的现场内容,雷峰网《医健AI掘金志》做了不改变原意的编辑和整理。

AI大模型技术出现之前,人机协同模式下的新药研发经过了几个发展阶段?

谢昌谕:人机协同模式下的新药研发大概经历了2-3个阶段。

第一阶段属于计算机辅助药物设计,也叫做Computer aided drug design(CADD),可以追溯到20世纪70年代。它是通过模拟和计算受体与配体的相互作用,进行先导化合物的优化与设计,应用场景有分子对接、虚拟筛选、自由能对接等。

所以这个阶段基本上还是使用基于一些规则或统计方法,筛选已知的化合物库,其中并没有太多人机交互,更多是人来决定整个计算流程并执行,一步一步筛选药物直到找到潜先导化合物。

值得一提的是,90年代前,中国药物分子设计领域主要借鉴欧美的方法与软件,后来经过863计划、973计划等推动,进入本世纪后涌现出不少自研的CADD软件,诸如AlloDriver、Corrsite、SCORE、PharmMapper、DL-AOT等。

第二阶段是用机器学习(ML)来做QSAR(Quantitative structure-activity relationship,定量构效关系 ),指使用数学模型来描述分子结构和分子的某种生物活性之间的关系,1980年代以来,3D-QSAR逐渐取代了2D-QSAR的地位,但机器学习用于新药研发是90年代后期以来。

机器学习的扩展是深度学习(DL),后者巅峰时期可以追溯至2014年,最近十年来随着可用化合物的活性和生物医学数据量显著增加,应用于药物发现的DL研究层出不穷。

无论是ML还是DL,它们更多基于数据驱动,如果将筛选出来的分子配合湿实验的验证反馈,模型迭代速度更快,准确度也会更高。

实际上,这时候就产生了一定的人机互动。

第三阶段或许可以视为如今AI大模型/GPT下的新药研发。

现在我们看到AI大模型带来的核心能力是In Context Learning,它的翻译有好几种--上下文学习、情景学习、提示学习,本质就是在实时训练中学习。

这一阶段的人机互动也更加明显,也这可能是大家期待的一种药物研发模式。尽管现在还处于萌芽阶段,但我们在很多arXiv预印版论文上看到,已经有人积极探索如何把GPT等大型语言模型技术用到药物研发以及相关的化学研究的环节当中,比如 Andrew White 教授提出的 ChemCrow 工具 (arXiv:2304.05376)和arXiv:2305.18090 )等等。

刘振明:因为我本身在药学院,我觉得“新药研发”这个概念有点大,希望更多是围绕自己比较熟悉的“药物发现”做阐述。

大模型出现之前,前前后后经历了三个阶段,刚才谢老师已经讲得很全面了,我做下补充。

第一阶段,CADD。

当时计算机技术刚刚开始在化学和生物学领域中得到应用。随着计算机性能和软件算法不断提高,CADD在药物研究和开发中的应用越来越广泛,比如动力学模拟模拟、计算和预测药物与受体生物大分子之间的结合,设计和优化先导化合物的方法等等。

后来CADD可以根据药物分子的结构,利用计算机辅助技术进行结构优化和模拟,预测药物的生物活性、代谢途径、毒副作用等。

第二阶段,AIDD。

到了2015-2017年,随着神经网络深度模型的发展,有了另一个名字“AIDD”(AI辅助药物设计)。很多人针对有限的数据、有限的目标去做训练,发了不少文章。但圈内人认为广义的CADD是包含AIDD的,AI也需要基于计算机去执行。当然狭义上讲,CADD本质上是计算化学,AI的本质是通过数据去提取和学习,所以只要能产生标准化数据的地方就可以用AIDD。

第三,大模型时代。

这一阶段正在发展中,人机交互的特性更明显。可能除了药学家,除了专门做计算化学的人,很多人都感觉做药物的门槛变低了。即便不懂那么多的药学知识,但可以通过不断的交互也能“做药”。这种交互模式带来的巨大的应用场景最让大家兴奋,而且这种“社交性”的人机协作,让它比CADD和AIDD看起来更亲切。

刘伟:我从工作实践中也提一些我的看法。人机协同这个提法我觉得非常好,强调了“协同”二字。

因为我们在过去几年中有个发现,或者是业内一致看法:新药研发不能只靠人来做实验,同时也不能完全依赖于计算机来算,或者AI算法去找规律,需要人和AI相互协作。

至于发展阶段,大的发展阶段刚才两位老师都提到了,就是从传统的计算机辅助药物设计(CADD),到基于统计学的QSAR模型,再到后来的深度学习。

深度学习阶段也分好几个小阶段。最初是图深度学习(Graph Deep Learning) ,顾名思义就是把各种药物分子看作一个个graph,从图结构的角度来对数据建模,研究其属性和功能关系。

但这一方法也存在一些严重缺陷:高度的数据依赖性、over smoothing等问题。

随后Transformer模型流行开来,很多药物AI算法研究也从图迁移到Transformer。当下的GPT系列模型,正是基于Transformer架构的大规模预训练语言模型,通过在海量的文本数据上进行无监督学习,学习到文本的通用表示和生成能力,然后在不同的下游任务上进行微调。现在有研究证明不太需要微调,也可以用提示学习的方法提高垂类能力。

基于统计学的传统QSAR方法的优势也很明显,有相对好的可解释性,结构也比较简单,相对于深度学习类的方法鲁棒性更好,不容易过拟合。但通常它的上限比深度学习模型低,比如很多领域的SOTA还是深度学习做出来的。

所以在腾讯药物研发工作中,既保留了传统的QSAR类方法,又重点投入了Transformer模型,希望保证比较好的效果的前提下,也能够获得非常好的可解释性。因为两者是相辅相成的,不是简单的对立关系,两者配合才能发挥最大功效。

举个例子,我们基于腾讯在算法、算力上的能力,将AI与物理、化学做了结合,这是团队近年来新生长出来的能力。

我们认为,AI只靠数据驱动是不够的、缺乏可解释性,做出来的模型有时也会因为数据稀疏、分布漂移产生一些问题。如果能够将物理、化学知识有效地输入到AI算法模型中,模型能够非常好地反映在化学、物理等底层的特征和规律,比如可以学习量子化学中的波函数、原子受力分析等。而且这种AI模型不仅过拟合风险更低,实际应用中也有非常好的可解释性,这也是我们最近几年重点发展的能力。

这套技术栈一直在药物分子、有机化学小分子体系上做训练,直到2022年底,我们用这套技术栈参加了Open Catalyst Challenge竞赛(由Meta AI研究院和CMU联合发起),获得第一名,证明这个思路是可行的。

AI对新药研发的哪些流程带来帮助?相对传统药物研发模式的优势是什么?

段宏亮:我是药物化学出身,十几年来都是从事新药开发工作,和实验打交道更多。后来到了AI时代,我开始做一些AI和制药的融合工作。刚才几位老师已经把新药研发的发展阶段说的很清晰了,都提到CADD到QSAR的转变,我就从实验视角做一些补充。

实际上,QSAR已经有点像现在的AI制药了,都是数据驱动模型做活性预测,但QSAR的数据量相对较小,只需要几十个、几百个分子,但如今的AI大模型动辄千亿参数,两者对数据的需求明显不在同一层级。

从我自身的经历来看,AI是否真的帮到新药研发,不是说仅仅跑一些标准数据集、提升几个点的准确率、是否使用最新模型做一些深度学习的任务。我们更关心的是,这些方法是否真的有助于药物化学家和药学家的药物研发项目进展。

所以圈内提出干湿实验结合的观点,希望实验室里产出更多的实时数据,进一步迭代训练模型;以及采用一些强化学习、小样本学习,尽量弥补数据量不足的缺点。

如今非常多的科研人员倡导借力AI研发药物,把数据看得极为重要,很大一部分原因是2020年底,AI程序AlphaFold2(DeepMind研发的深度神经网络方法)在蛋白质结构预测大赛CASP14中,取得了几乎媲美人工实验的解析结果。这一现象级成就,迅速让AI制药进入到一个全新的发展阶段。

应该说,在DeepMind把蛋白质结构预测任务做出来之前,整个新药研发领域还停留在比较常规乏味的道路上。

但蛋白质结构预测这个问题被大部分解决了之后,很多人突然发现了新大陆,原来蛋白质结构这种非常玄妙的东西,几乎可以通过计算的方式解决掉,与冷冻电镜解析结果相媲美。

所以这短短两年时间,几乎是产生了一个全新的研究领域--AIDD(AI Drug Discovery & Design),大量的药物学家,计算机AI人才进入这一领域。

大家自然认为,AI和大数据驱动下,跑出first in class新药似乎是毋庸置疑的。这两年时间里,我们看到了大量的非常可喜的成就,尤其在大分子药物、多肽药物、合成生物学等等跟蛋白结构相关的一些领域,无一例外呈现出全新发展态势。

最关键的是,AlphaFold2的出现一定程度上解决了以前AI制药中比较困惑的问题:数据问题。

正是由于结构生物学家们几十年来采用冷冻电镜等湿实验方式获得了十几万的蛋白质结构数据,使得训练我们的深度学习AI模型成为了可能,并由AI从业人员在计算机上面验证了这种可以同实验学科相媲美的可能性。

AI技术对新药研发的的帮助,理论上是全流程的帮助。从靶点发现到新药上市,每个阶段都能看得到AI制药学者,或者是一些企业的介入,其中不乏在一些环节做得非常好。

比如晶型预测是药物研发长流程中非常小的一个环节,有的公司就采用计算的方式将这个问题解决得非常好,它的计算结果跟实验结果是相匹配的,得到了国外大型制药公司的认可。

可见AI技术在某些药物研发环节上的用处非常大。但这并不代表目前AI技术就能带来药物研发全流程、全系统的赋能,它可能在某些环节方面会率先突破,进而以点带面扩展开来。

跟传统的药物研发相比,AI制药的优势更多是效率、成本的提升,以及触及一些人类药物研发工作者难以企及的新领域。

比如我们通过一些计算机模拟技术看到药物分子内部的微观世界。如果没有人机协同,我们永远不可能知道微观世界中一个药物分子是一种怎样的构象,它跟蛋白靶点如何作用。通过计算机,我们可以相对准确地捕捉到原子和原子之间的相互作用力,从而更好地改造药物开发的技术。

另外,对于数据量非常庞大的一些药物开发场景,比如蛋白质组学、基因组学等,数据量动不动是几十个T,这种级别的数据量对于人类来说基本上是无能为力的,无法用肉眼来分析和总结规律。计算机就可以把所有的数据中最核心的规律总结出来展现给药学家,大大提高效率。

张煜:我们主要关注大分子药物研发。尤其是这两年我们也能够感受到,AlphaFold2确实让整个蛋白质结构解析领域发生了颠覆性的变化。由于蛋白质是几乎所有药物的主要靶点,了解蛋白质结构,是解决如何通过特定方式干预疾病表征的关键。

随着AlphaFold2开源,一些生物技术公司现在正在使用它来协助开发药物,尤其是一些原本致力于大分子药物的研究更是加速进行。

这也说明了AI技术的一大好处--降低了从业门槛。比如说冷冻电镜设备,不是每个大学或机构都有这样的财力或物力,但AlphaFold2提供了强大的蛋白质预测和分析工具,让很多从业者几乎无条件地投入到这波创新浪潮中。

相对来讲,大分子方面规律性更强,蛋白质有“序列决定结构,结构决定功能”的链路,反过来以后发现我们需要这样一个功能,能不能把这个结构拿到,同时我们知道它是什么样的序列生成出来的,也就是蛋白质设计。

所以,AI展现出极强的理解和生成能力, 使得它在在大分子方面的效果非常明显。尤其是如今ChatGPT验证了参数增长、训练数据量增大,对AI模型的重要意义,AI大模型的确能让大分子制药领域取得突破性效果。

但小分子有自己的化学性质,以及数据是制约小分子药物设计最大的瓶颈,不仅可靠数据非常少,还存在指标不统一、敏感数据难获取等问题。或许这一点,让AI大模型在小分子制药领域的效果没那么显著。

刘伟:AI对新药的诸多流程都有帮助。

这几年,我们把小分子和大分子都做了一遍。在腾讯的药物AI平台上,小分子这块,从常见的ADMET评估,到苗头化合物发现(hit),再到lead优化都有相应的AI算法工具支持。

在大分子这块,最近两年我们陆续开发了抗体结构预测、活性预测、人源化等技术模块。几乎覆盖了大分子和小分子的整个临床前研究环节。

相对传统的药物研发模式优势有哪些?

刚才两位老师也提到了,优势是更快的速度,用更少的钱做更少的实验。在这一块我们体会也特别深,迭代速度快非常关键。

比如我们与某个药企合作分析某系列化合物的心脏毒性(herg指标优化项目)。刚开始我们的数据比较少,经历了几次湿实验后产生的数据,虽然不是很多,但是放进模型进行训练后大幅度地提升了这一模型。在项目中后期阶段,计算结果基本上与实验结果相关性达95%以上,后来就不太需要去做实验了,而是直接使用模型预测结果去做分析了。

实际上,药企合作的初衷是希望通过AI的方法更快地做出药物,更快上市,更快产生对患者的临床价值。但按照以往的临床前研究可能需要好几年时间,现在最快几个月就可以完成,效率上的优化非常明显。

过去几年AI制药的算法能力有何升级?模型泛化能力有哪些突破?

段宏亮:过去这些年,AI制药领域很多算法基本跟随AI技术而进步。

一、最开始的QSAR时代,我们更多是用机器学习,因为那时候数据量不是太大,机器学习足够用,所以支持向量机(SVM)、神经网络(NN)、随机森林(RF)等已建立的方法,很长一段时间都被用于开发QSAR模型。

二、随后,十年前以图像识别领域的卷积神经网络(CNN)为代表,开始了深度学习时代。相对而言,CNN在药物研发上用得不多,因为CNN是二维的,药物分子以三维为主,但无论如何,至少将深度学习概念引入药物研发领域。

但深度学习真正和药物研发密切结合,是将自然语言处理领域的深度学习技术引入药物研发之后。因为药物分子可以表示成一串SMILES代码,跟自然语言非常相像,所以后来在药物研发领域得到广泛应用的的RNN和transformer等深度学习模型,都是承接了自然语言处理的技术流派。

现如今,药物研发领域中遍布transformer-base的模型,比如BERT和GPT都是在transformer技术上发展起来的大模型。

此外,因为药物原子等价于图中节点,化合物的键等价于图的边,所以Graph-base的GCN(图卷积)流行开来。这种方法的基本思想是学习节点(如药物与药物的相互作用)、边(如药物-药物或药物-疾病之间的关系或相互作用)、图(如分子图)的有效特征表示。

三、直到最近两年,比较火的模型是对比学习、扩散模型等各种新的深度学习技术,在药物研发里的应用非常多。

最近几个月,大家一致认为在ChatGPT的推动下步入了大模型时代。但在学术界,比GPT更火的可能是BERT--谷歌推出的NLP大模型。

相对而言,因为蛋白药物、多肽药物具备更加庞大的数据量,比如PDB数据库可以提供20万左右的蛋白质三维结构数据量,可以训练出不错的大模型。目前蛋白结构预测模型还是以transformer-base模型为主。

比较可喜的地方在于,CADD等底层物理能量算法,正在将一些深度学习模型融合在一起。

比如David Baker课题组,他们一直在做RoseTTA系列,在做底层的物理能量计算,受AF2启发正在将深度学习与物理能量算法融合在一起,开发出RosettaFold,也有RoseTTAFold Diffusion用于蛋白质生成设计。

这也证明,底层物理能量计算和完全基于数据驱动的两个技术流可以相互结合。药物研发领域的算法在不停融合,不停升级中。

当然模型的泛化能力一直是一个比较严重的问题。在一些论文中,针对某些靶点预测的小分子药物数据集可以达到95%甚至99%的准确率。然而,一旦我们脱离这个特定的测试数据集,应用到新的药物分子上面时,泛化能力会明显削弱。

长此以往,导致我们在一个标准数据集上可以用很多很炫的算法,准确率刷到非常高,但过拟合问题却难以解决。

这可能有待于我们药学家、计算化学家以及AI专家进行深度融合,怎么把某个药物研发问题彻底定义好,而不是说药学的人在化学生物实验室里做实验,计算机的从业人员在在计算机实验室里面训练模型,各行其是。

刘伟:AI制药领域的算法能力同样来源于AI本身的一些算法,最近十年AI有三个重要的里程碑节点,分别为以AlphaGo为代表的强化学习技术的广泛应用、以AlphaFold为代表的蛋白质结构预测技术、以及最近的预训练AI大模型技术。

在强化学习方面,2020年左右,我们利用强化学习和VAE做了分子生成,无论是用什么方法,重点是要生成满足特定属性和条件的分子。后来这个技术我们在跟一家药企的技术合作中,选择将生成和SBDD统一起来判断活性,通过属性反馈来强化控制分子生成的化学结构。

后来药企也反馈这一方法的结果很不错,在不少药化合作项目上都能够明显看到DMTA循环周期缩短。我们将这一成果发表于ACS Omega,也是业内最早发表的经过湿实验验证的分子生成技术方案。我们还将生成式预训练AI模型结合药物构象生成,这方面的工作还在进展中。

此外,我们在模型泛化能力问题也有一些工作进展。

模型泛化能力这个问题确实非常困难,也是非常核心的问题,当前很多预测效果不尽人意,落地难的问题都是跟模型泛化能力有关。泛化也是机器学习研究的核心问题,在已知的数据集上做风险最小化的训练,从而希望能将模型推广到未知数据上,使其具有一定的预测能力。

一方面是前面提到的,如果能够将物理、化学知识有效地输入到AI算法模型中,就能够非常好地反映在化学、物理等底层的特征和规律,模型过拟合风险就会较低,有比较好的可解释性。还有就是利用几何深度学习方法约束化合物空间结构的学习过程,就可以使用比较少的参数,从而减小过拟合的风险,也增强了泛化能力。

另一方面,利用AI大模型技术,使用非监督的方法来减少数据过少带来的过拟合问题。

因为大模型可能已经比较好地反映出各种化合物的空间结构信息、属性信息,这样就对有标签的数据需求相对少,那么训练过程中泛化能力就能有比较好的提升,并且只需要较少的训练迭代,做微小的调整。

针对泛化问题的第二个例子,就是我们最新的一个工作。

我们在做AI辅助药物发现时,发现了这样一个问题,在A靶点(A场景)中训练的AI模型,会非常难以应用到B靶点(B场景)上。这也是一个明显的泛化问题,现在也没能100%完全解决,甚至有时候这种明显的降效得到了“模型不可用”的结论。

为了验证我们模型的有效性,我们做了一个名叫DrugOOD的框架,在github上有开源,并且根据不同的domain把它做了一个划分,比如按照骨架、实验assay、或者靶点区分,这样训练出来的模型就会非常不一样。

在这个过程中,我们实际上希望模型在不同场景具备一定的迁移能力,不然模型只能适合单一训练数据场景,这其实不是我们所希望的,因为这样的模型适应能力非常弱,没办法应用到新的问题上。

第三个例子是量子实验室的工作,和浙大也有合作,是针对某一类型的靶点去训练。

我们认为,如果不同场景下的数据混合在一起训练,不容易达到比较好的泛化效果,这样把它单独拎出来做一个AI模型,一定程度上也可以解决模型难以泛化的问题。

例如把含有金属离子的蛋白质靶点的数据拿出来单独训练一个模型。你可以认为是一种场景的细分,还有给GPCR做一个专门的AI模型也是这种情况。

谢昌谕:我个人在模型泛化能力问题上面也有比较深刻的感触,毕竟这是如今AI制药面临的最大的现实挑战之一。

我试过很多基于纯数据驱动的机器学习方案来提升模型在不同场景下的泛化能力,比如预训练一个大模型然后在下游任务上进行微调、小样本算法、元学习、 多任务学习和 domain adaptation等等,一些特定的问题如活性/亲和力预测或者分子的 pKa 预测,我们还甚至可以融入基于物理与化学的专业知识来提升模型的泛化能力。这些方法虽然针对某一些数据集/场景可以看到不错的提升,但整体而言,我们还是得根据不同的场景/任务去做定制化的策略。

最后,除了研究如何在训练数据被固定的前提下来提升模型的泛化能力,另一个值得关注的方向,是通过开发更新的主动学习方法去添加少量的合适数据来提升模型的准确度。

与传统药企内部AI团队相比,AI制药公司或科技企业的AIDD平台提供哪些差异价值?

刘振明:CADD和AIDD确实是一种协同。

药企对于新生事物非常欢迎,他们知道做新的药物品种很难。

打个比方,如果他们自己培养一支AI团队,一年要花20个亿,还不如合作上花20亿和AI制药公司合作,既能收到“果实”,还有可能埋了几个“种子”。而且只要能成一个,依靠他们这种大公司的强大商业能力,一定能获得回报。

所以,现在只要AIDD企业能够交付药物品种,药企就愿意合作。

有个数字,过去五年,国外一些药企已经开始关注前端研发,超过40家药企建立了跟AI研发相关的部门。

为什么他们不抵触?因为药物研发行业跟别的行业很不一样,别的行业可能会竞争,但是药企缺少药物品种,有人能给我更多的选择,我为什么不去鼓励呢?

另外,药企更关注的是自身的商业版图。这种情况下,它和AIDD公司是一种互惠互利的关系,没有理由去反对,甚至是欢迎、扶持。但是你会发现,药企跟AIDD公司的合作,更多的是药物品种交付。药企不管你的软件有多好,能做品种就合作,签一个里程碑付费的合同。

但是这种合作更像是药企“系统外的合作”,药企并没有分享数据,甚至药企会用自己的数据,自己花精力做一遍验证,也绝不会把数据直接开放给AIDD公司。

其次,即便药企采用了现在常说的联邦学习,做了数据接口,也不能解决数据稀缺的问题。因为联邦学习使用的数据,大部分都是拷贝数据,甚至有些数据清洗完丢失了很多信息;而且由于联邦学习的数据光有接口,没有打通数据内部,所以“模型拿走数据留下”的理念具体实施起来非常难。

但在新药研发中,数据就是知识产权,命根子,所以传统CADD公司和AIDD公司的协同更多在哪?技术协同。

因此AIDD演化成三种商业模式:SaaS、CRO、biotech,即售卖AI药研平台与软件的使用服务、提供药物发现服务、利用AI自建新药研发管线成为药企,“药味”逐渐变浓。

在这种商业导向下,AIDD公司才会动不动说“颠覆”药物发现,实际上他们还是在“打辅助”:一定程度上避免了化合物设计过程中的试错路径,同时带来更多的全新结构,为药物发现打破常规的结构壁垒。

张煜:我从药物研发的角度说一下。

全球Top10药企都在做各种各样的药物研发,多数研发投入占当年总收入的20%以上。在疫情管控放开后,他们的研发力度在疫情之下非减反升,而且将更多精力投入在“抗疫”“抗癌”等核心领域,研发重点也从饱和的新冠疫苗转向新冠药物的研发上。

当然,也有一部分小药厂凭借一两个药物就上市,但因为药研部门缺少药物积累,实践和理论积累不强,长期盘踞在一类药或一款药上做深度研发,最终研发无以为继,上市亏损严重。

这是药物管线不足带来的困境,更进一步说是缺失平台化发展模式所面临的必然困境。

长期来看,AI制药平台化是企业打“组合牌”的关键,随着中国仿制药行业面临外部环境的快速变化,创新药领域政策出台密集、监管力度趋严,在同样的外部挑战下,企业对资源进行整合重配变得更加明显。

尤其是基于AI的药物研发势必成为医药行业的革命性力量,有望从根本上改变传统的试错药物设计流程。最近MIT传出消息,称他们已经研发出大语言模型,一天内可筛选超一亿种化合物,比任何现有模型都要多得多。

所以,从制药的流程看,AI技术已经渗透到多个环节,AI制药平台虽然现在还没有显示出优势,但一定会带来药物研发的革命。

此外,如今的AIDD公司在平台化策略中,既有AI计算平台(干实验),还有湿实验平台。从理论上讲,AI在任何情况下都起作用,特别是深度学习框架出来后,能在有限的范围内比较好地解决一个问题,在触及到人类认知边界的问题上效果最为明显。

总体来说,AI制药平台化至少会带来几个好处:

一、药研工作更稳定,减少了药物的人为干扰。

众所周知,药物研发的时间很长,业界的“双十定律”可以简明扼要地回答这个问题,即需要超过10年时间、10亿美元的成本,才有可能成功研发出一款新药。即便如此,也大约只有10%的新药最终能成功挺进临床试验。

这个过程中,有些企业研发一款药物可能会换好几拨人。换一拨人就要重新做实验,重新走流程,AI的加入会促使药物研发重新成为一项系统工程。

第二、更多的数据积累。

刚才讲到做实验,实际上数据积累本身是有价值的,但传统药企来没有在挖掘数据上投入很大的精力,导致数据之间的关联性并不强,遗漏研发规律。所以现在大模型在参数足够多的情况下,有可能外溢到不同的种类,可以进行相互参考。最近一些论文已经有这方面的探讨,我认为这也是未来的发展方向。

第三、药物研发预测性。

过去我们的所有的药物研发几乎很难讲预测性,更多是出现一个病就想办法做药,不管是实验方法也好,还是做发现、筛查,优化也好,都是有病才治病。

但一个AIDD平台可以把相关规律做总结,比如预测五年以后的新冠病毒是什么样子;通过深度学习和分子动力学预测个体身体状况,那么我们也可以更针对性地寻找相关的抗体或者药物。

刘伟:AIDD平台可以整合药物创新药物研发中的诸多复杂流程,AIDD公司会把很多工具都整合在一个平台上、快速迭代AI模型、干湿实验结合,目的是方便用户使用,提升迭代效率。所以AIDD平台绝不是静态的,而是一直动态变化,它需要吸纳新数据,自身进行迭代提升,即便是很少的数据也可以有非常大的提升。

除了行业内通常提到的数据反馈、流程迭代循环,我们也碰到非常不一样的例子—不是通过数据反馈去训练模型,而是通过湿实验结果数据来约束AI模型的搜索空间。

例如小分子或者抗体结合位点,只要了解了晶体结构实验结果后,就可以比较精确的框定分子和靶点结合位点,活性预测模型的提升能力可提升50%以上。

段宏亮:医药研发企业更多是医药项目驱动型,它们更在意的是管线。

医药企业自身的CADD部门,或者叫AI部门,往往只有三五个人,多是配合公司内部的医药研发项目,或者做一些比较常规的医药开发软件,更多是一种辅助作用,并没有太多的精力做原创性的算法技术开发工作。

但是对于AI制药公司来说,就不太一样了。

大多数AI制药公司的导向并不在于开发新药管线,而是算法开发。多数AI制药公司创始人是IT出身,他们更多是招聘大量的AI算法人才,研发CADD+AIDD的交叉类产品,以及一些底层算法开发。比如AF2出现后,他们可能会做一些蛋白质结构设计的新算法开发,进而用来做一些抗体药物的设计改造。

有个数据,截止到2022年11月,国内有80多家AIDD公司,主要分布在科研资源丰富或者产业集群的地带,以北京、上海和深圳三地最为突出,均有10家及以上AI制药企业选择落户。

根据创始人/团队的不同背景,中国AI药企主要分为6类:高校/研究所成果转化、互联网大厂入局、基金孵化;或海归博士、资深药企专家、互联网人创业。

可以说,这80多家公司给整个制药行业带来了无限的可能性。虽然我们不确定哪一家或者哪几家能够在整个AI制药行业竞争中胜出,但单纯靠医药企业内部的CADD平台,很难给我们这个新的AI制药行业带来太多的想象空间。

]]>
医疗AI //m.drvow.com/category/healthai/ukXtv9fVuEqxG32W.html#comments Wed, 21 Jun 2023 10:09:00 +0800
医科院药物所汪小涧:创新药时代,堆砌化合物数量不能成为科研的KPI| AI制药十人谈 //m.drvow.com/category/healthai/z1VkvxsMt4Nrt2n3.html “至少有一半以上的新药没有过临床,都不是因为新药本身,更多是因为产品本身的盈利能力和公司的整体战略方向。如果把这一切都归结为科学问题,显然是不太合适的。”

“十年前,很多人认为只要化合物达到一定数量,质量上就一定有所突破。有个数据是,硕士生毕业前要完成30-40个新化合物的合成,博士生的这一标准为60-80个,硕博连读生则为80-100个。科研不能光靠蛮劲,这样的结果是大家化合物质量上花的心思少了,总是奉行‘测了活性再说’的原则。”

汪小涧是中国医学科学院药物研究所(下称“药物所”)研究员,他所在的合成药物化学研究室是该所重点科室之一,从上世纪60年代建立至今走出了黄量院士、梁晓天院士等老一代科学家。前不久,汪小涧研究员在与雷峰网《医健AI掘金志》的对话中,表达了他对AI制药行业挑战的一些看法。

2005年,汪小涧本科毕业于中国药科大学药学理科基地班,随后直博攻读本校药物化学专业,师从中国药科大学药学院院长的尤启冬教授。

2010年,汪小涧进入药物所合成药物化学研究室开展研究工作,主要开展药物分子设计、合成及生物活性研究,包括新药临床前研究项目的管理工作。

目前,汪小涧已成为"天然药物活性物质与功能国家重点实验室”以及“天然药物活性物质发现与适药化研究”北京市重点实验室的课题组长。

但作为一名青年科研工作者,汪小涧参与的新药研究项目不在少数,其中3项为国家1类新药,有1项目前已经进入临床III期研究,另外两项则处于I期临床研究。作为顾问专家还参与多项已上市1类新药的适应症拓展和机制研究。

通过自身经历,汪小涧对新药研发有了更深的理解。他讲到,“过去读书时看到很多新药终结在临床II期,甚至III期,以为是药物的安全性、有效性或者质量出了问题。但后来经历更多了才发现,至少有一半以上的新药没有过临床,都不是因为新药本身,更多是因为产品本身的盈利能力和公司的整体战略方向。”

但现状是,如今全球十大知名药企,中国竟无一上榜。

对此,汪小涧指出,“中国想要转型创新药,亟需变革发展模式,不能光靠堆砌化合物的数量,奉行’测了活性再说‘,而是以临床为导向去做新药。”

他进一步表示,科研不能光靠蛮劲,药物创新最佳路线和组合应该是从事临床研究的人发现问题、开展基础研究的人阐明机制、研究化学的人合成功能分子、从事药理学研究的人开展系统的体内外生物活性和安全性评价。

如今,基于行业良好前景,2023年创新药市场正逐步回暖,再背靠利好政策,板块将进入提速期。如何让更多科研机构、高校人才摆脱仿制药时代的研究范式,堪称任重而道远。

近日,《医健AI掘金志》推出《AI制药十人谈》系列,探究AI制药的前景与隐忧。

以下为《医健AI掘金志》与汪小涧研究员的对话内容,《医健AI掘金志》做了不改变原意的编辑与整理。

《医健AI掘金志》:您本科在中国药科大学基础药学理科基地班,博士是药物化学,到医科院工作后专注合成药物化学,什么时候开始使用计算机技术做药物设计?

汪小涧:基础理科基地班是中国药科大学的特色班,目的是从本科阶段开始培养一批从事基础药学科学的人才,1996年获批建立。

我在2001年入学,那时基地班已经发展出药化、药理、药分、药剂等药学四大基础课,可以说所有专业都有“药味”,均瞄准创新药物研发。近年来,学校的药理与毒理学学科进入世界排名前1‰,是国内高校第1名。

后来我研究生保送至本校药物化学专业,师从著名的药物化学家尤启冬老师。药物化学专业属于国家重点学科,也是药学领域的的基础和带头学科,比如国内药学界诸多院士,彭司勋、沈家祥、蒋华良、陈凯先、李松、等前辈,都是药物化学背景。

印象很深刻,我研究生第一年是2005年,那时候药物化学学科还比较偏有机合成,我们更多是用有机化学的方法寻找并合成分子。但是随着“计算机辅助药物分子设计/发现”学科兴起,我们就想试试计算机能否帮到我们。

所以像Accelrys、MOE、AutoDock、Glide、Sybyl等计算化学软件都接触过。

我大概从2018年开始尝试AI技术开展分子设计的,那时候发现有人从受体角度,有人从配体角度,还有从分子动力学角度、力学角度、深度学习角度等做分子设计。尽管方法各式各样,但几乎所有的科研论文都和计算沾点边。这也说明,大家都希望能借助计算方法让分子设计更有效。

《医健AI掘金志》:记得您博士毕业是在2010年,这一年也是中国医药产业的分水岭,之前是仿制药时代,之后是创新药时代。为何当时决定去医科院药物所工作,没想过去药企吗?

汪小涧:没错,我整个研究生期间,中国药企依然以仿制药为主。包括现在国内药企的研发和商业模式,都是想更快、更多地把国外药物品种仿制出来销往市场。

这个问题无法回避,到现在为止仿制药也是中国药企最关键的收入。所以能感受出来,当时药企的研究模式、技术手段,相对科研院所都略差一些。

而且仿制药和创新药是两套思路,前者是在存量业务上放供给、降价格、争取各种政策鼓励扶持(比如集采);后者是在增量业务上找对方向、建立专利保护。

再加上我求学过程中从没有接受过仿制药方面的培训,做的都是新分子,研究思路上也很难对齐。在我们的受教育观念里,有志于新药发现的人才大多都是以研究所为起点。

比如中国医学科学院药物研究所的老一辈科研人员创制了丁苯酞,双环醇以及人工麝香等为代表的原创新药。

《医健AI掘金志》:和其他高校相比,医科院药物所在药物设计上有哪些侧重,研究特色是什么?

汪小涧:单纯从研发能力看,跟中国药科大学和国内知名大学药学院,上海药物所等都相差不大,技术、人才以及文献资源基本各大高校和研究院所都有。但是医科院药物所一直以来都有较完整的产学研体系,这是一些高校所不具备的优势。

第一,1958年药物所建立之初,就以重大疾病防治药物为主要方向,坚持以创新药物为重点。

下设合成药物化学、天然药物化学、药理学、药物分析、生物合成、新药开发等研究科室,学科建设完整。我所在的合成药物化学研究室,是我所的重点科室之一,走出了黄量院士、梁晓天院士等老一代科学家。

第二,大家有所耳闻的北京协和药厂,一厂二厂都隶属于药物所,负责产学研转化。

也就是说,所有课题以产业化为导向,一旦发现有苗头的候选药物,可以立刻组织人手做临床前的开发研究。

所以我们的外包极少,只有在技术受限的项目上才选择外包,不像有些biotech公司可能把整个合成或者药理活性评价都外包出去。这样做还有一个好处,临床前的大部分工作都是自研,保证了数据可靠性。

第三,创新药带来的收入也很可观,我们所得以持续推进新药研发。

比如上面提到的双环醇,生产权直接转给了北京协和药厂,大概每年能带来10多亿的收入。丁苯酞转给了石药集团,年收入60- 70 亿。人工麝香也是一个独家品种。

《医健AI掘金志》:中国创新药自主研发,大概从2010年开始建立完整的生物医药产业。您在报告中提到,创新药物发现亟待变革性新模式,是指哪些地方需要变革?

汪小涧:我们一直在讲一句话,带量采购常态化下,仿制药高毛利时代已经结束,国内创新药面临爆发期。

新阶段下有三种情形:传统药企转行做新药、新成立的创新药公司小步快跑,还有一部分CRO、CDMO公司帮助药企转型。

总体来说,它们为了减小做新药的风险,都在引入新技术,所以无论是CADD还是AIDD,只要能起到事半功倍的效果,大家都会积极采纳。所以我认为,前端的计算能力并不是最卡脖子的地方。

最关键的在于什么?

第一、要做什么分子?

第二、怎样做才能通过临床?

后者好理解,更多考验人的耐力、团队专业性、公司财力。

在我上学时,看到很多新药研发死在临床II 期,甚至III期,快要能成功的时候失败了。当时我以为是药物质量造成的,安全性、有效性等各方面的性质可能不是最优。

但后来经历更多了才发现,很多情况下是研究团队水平较低、临床方案没有针对性、甚至有些公司是财力不足,导致这些分子最终没有通过临床研究。

我相信,至少有一半以上的新药没有过临床,都不是因为新药本身,更多可能是因为产品本身的盈利能力和公司的整体战略方向。

像我们知道的全球药企TOP10,辉瑞(美国)、默沙东(美国)、艾伯维(美国)、强生(美国)、诺华(瑞士)、百时美施贵宝(美国)、罗氏(瑞士)、赛诺菲(法国)、阿斯利康(英国)、葛兰素史克(英国),他们如果抢不到某一个新分子研发的前三名,宁愿不做。

也就是说,这个分子完全有可能能够成为新药,仅仅是因为公司策略或者利润率不够被公司叫停。

就像此前麻省理工学院Andrew Lo主任说的一句话,“即使一个药物开发有成功的可能性,即使它每年会产生数亿美元的收入,但是,这也不足以证明,将公司的资源投入到该药物上是合理的。因为同样的资源,可能可以开发出另一种价值10亿美元的药物。”

所以,如果把这一切都归结为科学问题,显然是不太合适的。

那么对于前者来说,要做什么分子也就成为药物研发中至关重要的一环。

之前药物化学更多是靠化学方法堆化合物,分子设计所占的比例并不大。很多人认为只要化合物达到一定数量,质量上一定有所突破。

有个数据是,硕士生毕业前要完成30-40个新化合物的合成,博士生的这一标准为60-80个,硕博连读生则为80-100个。

科研不能光靠蛮劲,这样的结果是科研人员在化合物质量上花的心思少了,总是奉行“测了活性再说”的原则。现在很多科研机构依然在走这条路,虽然嘴上说要重视质量,但在操作环节他们还是在做更多的化合物,从而显示其工作量。

这其实也受限于技术,当时包括现在没有一个特别有效的研究方法,只能期待数量多了,从中找到一两个或若干个好的化合物。

所以我觉得,现在技术方法多了,中国想要转型创新药,亟需变革发展模式:国家要以临床需求为导向,鼓励各个科研院所、企业去做新药。

药物创新最佳路线和组合应该是从事临床研究的人发现问题、开展基础研究的人阐明机制、研究化学的人合成功能分子、从事药理学研究的人开展体内外生物活性和安全性评价。这就要求要把临床医学、基础医学、生物学和化学等知识进行很好的整合,要思考把研究的内容如何用到人体上,最终达到治疗疾病的目的。

如果一味地堆彻化合物的数量,无论从效率上还是时间上都是非常大的短板。

孙子兵法的第一句话就是:兵者,国之大事,死生之地,存亡之道,不可不察也。这句话对我们开展药物研发也有指导意义。

做一个新药,瞄准任何一种疾病、选中任何一个靶点、确立任何一个课题,都需要一个团队,甚至几代人的努力,绝不能一拍脑袋就上了。现在更多要推演、推算,在做分子之前,心里就要有七成的底,要能真正从早期试验中就展示出药效或安全性的特色才能让产业良性发展起来。

最终,我们要从一个“劳力型”的工作模式,转化为以推演、推算的“脑力型”的工作模式。

《医健AI掘金志》:谈到AI 制药行业,大家会觉得这个领域出成果太慢。自从2012年首家AI制药公司成立,至今已经十多个年头,依然没有一款药物成功获批上市,甚至进入临床试验的药物都凤毛麟角。这是为什么?对您来说,AI能给药物发现和设计带来哪些帮助?

汪小涧:AI已经在很多领域证明能力,或者部分证明能力,唯独医疗领域对新技术的反馈速度较慢。

为什么?

拿2018年那场风靡全球的人机大战来说,为什么谷歌的AlphaGo能够掀起AI浪潮,关键在于“快反馈”。

它只要在电视直播下打败人类中水平最高的棋手,就能立刻能感觉到它的神奇。像柯洁、李世石,他们和AI连下几局都被“剃光头”,这种对比非常明显,甚至柯洁杀得泪洒赛场,哽咽道“它太完美,我不知道怎么赢它。”那是所有人都容易铭记的一幕。

随后AI技术大量应用在图像识别、无人驾驶、以及蛋白质结构领域,这种应用不是随意选择的。

对于图像识别,你的脸一放上去,名字、公司等信息就能立刻识别出来。

对于无人驾驶,只要司机在路上开得又快又稳,就能证明AI技术没问题。

而在生物学领域,谷歌的DeepMind也很聪明,做的是蛋白的结晶。因为蛋白结晶出来以后,跟PDB数据库(数据库里的结构都是经过X射线、核磁、冷冻电镜等试验技术测得的,结果真是可靠)一比,就能立刻知道对错。

但在医药领域,你说这是AI做出来的新药,需要很多人、很长时间去证明。这是一个非常慢的反馈。等新药出炉后,再去追溯到底是AI设计出来的,还是人类专家设计出来的,就不好说了。

从我们的角度看,AI能够加速我们的实验设计,甚至能够给出新颖的分子结构,但这个分子结构真的不用后期改造了吗?

专家就真的那么听话,只合成一个分子,不合成一些衍生物吗?

就算专家只在结构上做了一个小的改动,比如氢变成了氟,甲基变成了羟甲基,那也是人工加工的痕迹。 所以到底哪些算做专家的神来之笔,还是AI的无心设计?这个很难说。

AI真正的技术突破是2018年,由于图像识别,深度学习方面的突破,在此之后人工智能、机器学习等字眼频繁进入大众视野。现在一些AI公司,像英矽智能、晶泰科技、深势科技、望石智慧,这都是很知名的AI公司,他们大概也是这个时间点成立,所以从2018年至今没做出药物来很正常。

而且,这些公司更多是计算机背景,也要花时间学习药物知识、筹建团队、摸索方法、寻找资金,所以我觉得,目前能到达临床I期的药物就很不容易了。

我并不觉得“慢”就是坏事,尤其是在药品研发推向临床时,做更多的实验挖掘实际上都是为了早点把药的特点搞清楚,这点很重要。

从整个流程上看,创新药首先从实验室发现新的分子或化合物开始,经过动物实验了解其安全性以及毒性反应,了解在动物体内的代谢过程,作用部位,和作用效果,再经过首次人体试验,经历I期II期,III期临床试验,证实安全有效及质量可控制之后,才可以获得药物监管机构的批准。

前面化合物阶段,AI确实可以加快一些实验行为,但后面动物的长毒试验必须是9个月以上,这个时间是跑不掉的,不是说加入了AI 就能少做一段时间。再往后,进入临床阶段,AI能够参与的工作就更少了。

《医健AI掘金志》:CADD和AIDD,或者说AI方法跟物理方法,各自有哪些优缺点,未来两者要融合发展吗?

汪小涧:目前CADD还是我们最常用的分子设计手段。这种方法比较直观,可以看到小分子和蛋白的结合模式,从而让我们进一步设计分子。虽然现在也有不错的AI工具,但是在分子设计领域,无论是小分子还是蛋白三维表示,还存在一些缺陷。 

另外,尽管AI能够帮助分子设计,但它无法完全替代人类智慧。一是慢反馈, 二是生物学数据很少,而且质量不高,能够做出一个有效的AI方法,像图像识别,无人驾驶等取得那么明显的成功,目前还很难实现。

所以未来一段时间内,特别是生命科学这一块,CADD、AIDD以及专家经验,一定是三者融合发展的模式。

最近ChatGPT的诞生,是AI智力涌现的结果,这种智力的提升并非是模型本身的变化,而是随着参数变大而不断提高,例如当参数量比较少时只能做简单的语言理解,参数量增加后就逐渐可以做推理类的数学题等。

在近期的计算机发展史上,很长时间没有看到过如此惊艳的发展。以至于很多国家都开始限制它的使用,比如美国限制学生用它写作业,限制教授拿它写论文,暂停马斯克等人的研发训练。

但未来不排除有更优秀的AI出现。届时AI或许不会取代人,但是会用AI的人一定会取代不用AI的人。

《医健AI掘金志》:AI制药两条路线,AI+分子,AI+疾病。近期由ChatGPT带火的AI大模型,会如何参与到两种路线中?

汪小涧:前者是利用自研的算法去发现新的分子,并且将大量有关靶点、疾病、临床试验和实验室数据投喂给算法,以预测新分子的物理化学参数、结合分数、与药物相似的特征等属性,挑选出具有成药潜力的分子,带入临床。比如,英矽智能、晶泰科技。实际上,我现在就是以分子为导向。

后者是将药物的研发流程反了过来,先在微观的层面找到基因和疾病的关联,再去寻找控制基因表达、抑制疾病发作的药物。比如,Insitro、哲源科技。AI+疾病偏医学,但分子偏向治疗。医学治疗要大得多,它与疾病的发生、发展、预防、诊断等相关因素都有关系。

ChatGPT的上线,意味着语言类AI底层技术NLP显著进步,同时启示AI其他领域应用更高效率的Transformer和产出更类人的RLHF算法。

在分子生成方面,AI+分子可以仿照ChatGPT的想法,通过一些分子生成的软件或分子生成的算法,为大家带来更多的分子。实际上,现如今人类发现的分子比真正的化学空间小得多,相当于地球在宇宙中的这样的一个对比。

AI+疾病这块,ChatGPT可以为诊疗可能带来一定的突破。

微软的Bing已经开始用ChatGPT进行搜索,这种技术也可以用到医疗场景。比如,病人过去都是问医生,希望医生能够提供病情诊断,治疗建议。但医生毕竟是少数,不用医生的能力也不在一个层次,如果AI能做出不错的诊疗,做出ChatGPT for medicine,for diagnosis,那么对医患来说都是好事。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/z1VkvxsMt4Nrt2n3.html#comments Wed, 07 Jun 2023 10:34:00 +0800
晶泰科技与礼来签署药物发现合作,以AI+实验机器人驱动首创新药管线研发 //m.drvow.com/category/healthai/KlKFGukRkAUebT2L.html 5月31日,以AI+实验机器人驱动药物研发的晶泰科技宣布与美国知名药企Eli Lilly(礼来)签署一项AI小分子新药发现合作,预付款及里程碑总收益可达2.5亿美元。

本次合作将充分发挥晶泰科技AI药物研发平台 “干实验室”与自动化机器人“湿实验室”结合的技术优势,为礼来从头设计并交付具有竞争力的候选化合物,赋能礼来开发并向临床推进具有竞争力的新药管线。

根据协议规定,礼来 将支付最高可达2.5亿美元的预付款及里程碑费用,针对某个未披露的创新靶点,由晶泰科技利用其特有的小分子药物发现平台ID4Inno™研发首创新药,填补未满足的临床用药需求。

作为AI+实验机器人的先行者,晶泰科技将延续其“智能算法+机器人实验+专家经验”三位一体的药物研发模式,基于其丰富的成功经验与礼来团队密切合作,完成一站式新药从头发现,交付药物候选后由礼来进行临床前开发、临床开发和后续的商业化。

ID4Inno™搭载了晶泰科技的高精度计算化学算法与500多种AI模型,可以针对靶点探索超大规模的可成药空间,对多种药物性质进行设计和筛选。综合评分最高的分子将在由数百台机器人工作站组成的自动化实验室中被合成出来,经过一系列生物化学,细胞,药理药代等测试验证其活性和成药性,而计算数据和实验数据会快速反馈给ID4Inno™算法平台,形成AI算法与真实实验的DMTA(设计-智造-测试-分析)闭环,在模型迭代中不断优化分子设计,直至找到各方面成药性质超出预定基准的理想的药物候选分子。

晶泰科技的AI+冷冻电镜平台、体外体内筛选评价平台等技术,也将在这次合作中发挥作用,加速晶泰设计并交付具有创新骨架的活性分子。

晶泰科技以生物医药及新材料研发平台为定位,为药企提供一站式的小分子药物发现、生物药创新发现,自动化化学服务,和药物固态研究服务,在全球拥有超过200家药企和科研机构客户。其AI+机器人的智能研发平台整合量子物理、计算化学与AI的一系列前沿的智能算法工具。

同时,其自主研发的自动化实验室以高效并行的机器人实验,将人类科学家从繁复的实验试错中解放出来。这一“虚实结合”的研发平台能快速且规模化地生成来自真实世界的高质量数据,进一步提高晶泰科技预测并验证药物候选的能力,赋能专家在更加高效的创新探索中实现突破。

晶泰科技已在深圳和上海打造上千平米的自动化实验工作站集群,并计划将这一成熟技术在香港、波士顿复制,为数十个平台上正在进行中的新药发现合作提供强有力的交付保障。

晶泰科技CEO马健博士表示,"很荣幸礼来选择了晶泰科技‘AI+机器人’驱动的药物研发平台作为药物创新的合作伙伴。晶泰科技打通了智能算法与机器人实验的数据闭环,在挑战全新靶点上具备独到的技术优势与丰富的成功经验。期待我们的平台能帮助礼来实现更富收获的管线开发,将优质高效的药物尽早带给全球患者。"

关于晶泰科技

晶泰科技是一家以人工智能(AI)与机器人实验驱动的药物研发科技公司,通过提高药物研发的速度、规模、创新性和成功率,致力于实现药物研发的行业革新。

作为一家立足中美、服务全球的企业,晶泰科技始终坚持探索最优解决方案,以充分利用前沿的研发与计算资源,最大化满足客户与合作方的需求。

晶泰科技的智能药物研发平台将基于云端超算的智能算法与大规模自动化实验机器人集群进行整合,形成高精度预测与针对性实验相互印证、相互指导的研发系统。

作为全球先锋人工智能药物研发公司之一,晶泰科技已建立起一整套量子物理干实验室与先进湿实验紧密结合的研发迭代流程,挑战传统研发的效率瓶颈,赋能新药研发实现创新速度与规模的突破。

雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/KlKFGukRkAUebT2L.html#comments Wed, 31 May 2023 11:59:00 +0800
医疗AI新阶段:从数字心明星产品,到数字人体AI平台 //m.drvow.com/category/healthai/AkAxMJVR1ksLneNr.html 时隔两年,数坤祭出一份全方位升级的医学影像AI平台。

近日,第87届中国国际医疗器械博览会(CMEF)首日,国内医疗AI公司数坤,携全疾病多模态数字医生解决方案亮相,并在现场发布了“数字人体”平台2.0版本。

据悉,该平台覆盖了40余种AI产品,涵盖了CT、MR、DR、超声、DSA多个模态,同时也全面覆盖了疾病筛查诊疗的各个环节,实现了疾病全流程的高精度导航协同和精准诊疗。依靠其开放性,数字人体平台2.0将全面赋能医、教、研、产,作为新型基础性设施助力医疗健康行业高质量发展。

CMEF首日,数坤科技发布“数字人体平台2.0”,中国医师协会放射医师分会会长金征宇教授(左二),中华医学会放射学分会主任委员刘士远教授(右二)到场见证

相比于两年前数坤在CMEF会上发布“数字人体”1.0,数坤科技创始人、董事长毛新生这样评价2.0:数字人体”平台已经实现了从单一场景到全流程、从单一病种检测到多病种分析、从单一模态到综合模态、从辅助诊断到辅助精准治疗的全面跨越式升级。

两年的技术坡爬,是数坤作为行业领军者在创新速度和量级上的全方位蜕变,同时也标志着医疗AI领域技术与实力的成熟,正在推动行业进入商业化验证的新阶段。

两年再推“数字人体”,一个关于医学影像AI的平台化构想

数坤成立于2017年6月,正是AI火热期。其创始团队曾在国际商业机器公司IBM担任高管、负责过IBM Waston技术孵化的光鲜履历,为这个项目带来颇高关注度。

往前推15个月,李世石和阿尔法狗的人机世纪大战后,AI概念晋升显学。与传统医疗行业的结合,意味着AI的应用场景被极大丰富。数坤科技也成为这场医疗AI浪潮的亲历者。

医疗AI的主要应用领域有辅助诊断、新药研发、医学影像等。其中,医学影像在医疗数据总量中占比约80%,包括CT、核磁、超声、病理、内窥镜、眼底等,因而医学影像的数据处理相关产业备受市场追捧。

腾讯觅影、阿里ET医疗大脑、科大讯飞智慧医院,以及有着“百度”基因的深睿医疗,均是这一时期入场。

而肺部影像数据量较大,结构化程度高、国内发病率高的基础条件,使得医学影像AI领域的大部分公司猛扎这一细分赛道,2017年因此被业内称为AI影像“肺结节年”。

诸多企业高调入局意味着对资本市场的推动作用更加突出,这对于入局者来说无疑是一个好消息。但产品同质化,同样注定这终将成为企业的一条软肋。

在创办早期,数坤避开了竞争激烈的肺结节检测、眼底筛查等红海领域,选择从病患人群逐渐增大、AI研发难度更高的心脑血管疾病入手,至今六年里,数坤以每年一个的速度连续推出数字心 AI、数字脑 AI、数字胸 AI、数字腹 AI等原研产品。目前,数坤科技是全球唯一在心、脑、胸关键领域,同时获NMPA三类证+MDR CE认证的医疗AI企业。

2020年11月,数坤获得行业首张AI+CTA三类证,凭借拳头产品迅速打响了行业知名度。但公司并未止步于此,而是持续将产品由“AI+CTA”向“数字人体”拓宽。

数字人体,是数坤科技对于影像AI的平台化构想。

毛新生曾讲到,“过去数坤科技研发的冠脉CTA,一站式卒中方案、肝脏MR,都在具体场景进行突破,但下一代的影像AI产品,必须打破单一科室、单一模态的限制,从患者的人体机能出发,以整体化的视角为患者带来更精准便捷的智慧医疗服务。”

随着“数字心”、“数字脑”、“数字胸”等AI产品的陆续成功研发,数坤拥有了对整个人体各部位的解剖结构、相关病变的数字化精准感知。这也意味着,数坤科技已经到了“谋定”的重要时刻。

2021年5月,第84届CMEF会上,数坤科技“数字人体”平台1.0正式发布,其包含了心血管、脑血管、肺部病变、肝脏病变、肌骨系统等多部位的智能影像,并正式实现从CT模态向MR模态的跨越,全球首发推出肝脏MR AI产品,也从影像科应用逐步拓展到胸痛中心、卒中中心、心脏专科等多临床场景。

时隔两年,在本次博览会上,数字人体平台再次迎来全方面升级——涵盖了包括CT、MR、DR、超声、DSA更多影像模态,同时也进一步全面覆盖了疾病筛查诊疗的各个环节,实现了疾病全流程的高精度导航协同和精准诊疗。

展台上,雷峰网&《医健AI掘金志》注意到,数坤科技设立了“CT AI”“MR AI”“超声AI”以及“手术AI”四大核心展示区:

在“CT AI”方面,数坤科技带来了行业最全面的CT场景解决方案,包含心、脑、胸、腹、肌骨五大关键诊疗领域,不仅可实现智能部位识别、精准质控、多部位智能联合诊断,还随着产品的持续创新,为医生带来了智能工作新方式。

以心脏CT检查为例,数坤科技推出了获得NMPA三类证的一站式全自动冠脉CTA+CT-FFR,可通过单次无创检查实现全自动冠脉形态学和功能学评估,为冠心病诊疗提供了全新的选择。此外,数坤科技的“数字心”产品家族还包括冠脉钙化积分、冠脉易损斑块、冠周脂肪及CT心功能的智能分析等,可全方位赋能医生临床和科研需求,为不同阶段的心血管疾病患者提供多学科高质量医疗服务支撑。

在“MR AI”方面,数坤科技重点推出了全球首创的MRI肝脏疾病一站式智慧诊疗解决方案,覆盖肝癌“筛-诊-治”全路径,以及最新研发的冠脉MRA与CMR智慧诊疗解决方案。目前,数坤科技在肝脏和心脏疾病领域均实现了CT&MR双模态联合诊断,形成了从疾病筛查、辅助病变分析与诊断、辅助临床决策的诊疗全路径覆盖。

“超声AI”的推出,标志着数坤科技在影像模态上的进一步突破。超声是乳腺癌的最常用的检查手段之一,然而乳腺超声面临着高年资医生匮乏,医生工作量大,易出现漏检、误诊,有效随访管理难等现实情况。此次数坤科技发布的AI新品“乳腺超声智能导航系统”,可实时识别乳腺病灶,自动提取病灶边缘、形状等特征,完成BI-RADS分类,一键生成结构化报告,提升医生诊断信心,提升单一病人检查效率约30%。此外,还可以结合智能随访功能,对乳腺病灶进行动态评估,实现全方位、全周期的医疗健康管理服务。

“手术AI”的推出,则意味着数坤科技进一步打破了单一科室的限制,并在疾病流程上由前端的“筛查”、“诊断”,向后端的“治疗”纵向延伸。

据介绍,本次发布的“经皮手术导航定位系统”,支持胸腹多部位,可以全自动进行AI辅助术前规划,快速生成个性化全景解剖地图、自动推荐单针多针穿刺路径、精准模拟消融模型,在术中对病人呼吸与体位实时监测,实时预警术中穿刺风险,实时可视化穿刺过程,兼容组织活检、冷/热消融及粒子植入等多种诊治方案。

再比如, “胸外科辅助手术决策系统”基于数坤科技独家智慧解剖引擎,可在3分钟内准确自动完成肺部数字化三维模型重建,实现肺部结节检出、脉管分割分类、肺段流域分割全流程,有效处理变异解剖并提供亚段分割,支持肺段、亚段级血管的精准手术规划。

在发布会现场,董事长毛新生用四个“全面”表达数坤科技的新布局:

从CT到磁共振、DR、超声,我们覆盖了全部的模态;

从心到脑、胸、腹、肌骨,我们覆盖了全身主要的部位;

从心脑血管疾病到肺癌、肝癌、乳腺癌等常见的肿瘤疾病,我们覆盖了人类重大常见的疾病;

从重建到影像的诊断筛查,到治疗的决策和手术,再到临床的科研和教学,我们在智慧影像、智慧手术、智慧健康领域全面布局,覆盖了医生工作的全部流程。

他进一步总结道:“这意味着我们的数字人体已经到了一个全新的阶段,从最早的冠脉CTA这样单一的明星产品,已经发展成为超40个AI产品聚合平台,打破了设备之间的壁垒、影像数据之间的壁垒,科室间的壁垒,形成了以疾病为中心,以患者为中心的全新的智能解决方案。”

“航母级”产研能力,医学影像AI公司的成功关键

“很多的AI医疗产品出来以后,都是IT人自己高兴。”北京大学人民医院原院长王杉曾这样评价AI技术与市场脱钩。

作为医疗AI行业的领军者,数坤科技深谙医工结合的重要性。在团队组建、研发布局和应用落地上,数坤科技走过的每一步都是业内的重要参照。

数坤科技的核心创始团队在IBM的工作经历,使其天然具备对于新技术的敏感性,后来团队也吸引到更多的人才,有超过200名涵盖人工智能科学家、软件工程师及医生等专家组成的世界级多学科团队,其研发团队成员曾在Kaggle、AI Challenger、NeurlPS等多项世界级人工智能领域竞赛中赢得冠军。

此外,从影像到临床,心、脑、胸、腹、肌骨各领域,数坤科技还跟不同科室专家合作,包括跟重点专家组成团队,与顶尖高校、医院组建联合实验室,以加深对于临床的理解,这使得数坤科技在基础技术攻关上更胜一筹。

即便如此,“数字人体”的研发也并非一蹴而就:最初的开发工作聚焦于最具技术挑战性,且具有高临床价值的心血管疾病等治疗领域,能够达到这一高度,证明数坤科技的产品、技术、商业化、人才已经到了“可复制”的关键期,下一步是将其拓展到其他关键治疗领域,最终建成一整套完整坚硬的竞争壁垒。

数坤首席技术官(CTO)郑超告诉雷峰网&《医健AI掘金志》,“从预防、诊断、治疗、康养的各个环节,一家医疗AI企业能够走出一条专业化道路,能够保持自身的技术和产品优势,能够帮助国家补短板、填空白,从这些方面来看,特别强调企业的综合能力。”

不仅要自主研发业界领先的AI技术平台,同样也要为医疗健康数字化和智能化打造行业基础设施。这些年来,数坤科技一直以这一标准要求自己,既要在专科服务上亮出“尖刀”,又能提前看到医疗智慧化转型的大趋势、大机遇。

“以本次发布的数字人体平台2.0为例,就是数坤科技在影像模态、技术架构,以及与不同科室的应用交互等方面的全方位实践。”郑超表示。

首先,一次集齐所有重要模态影像。

X射线、CT、核磁、超声等多种不同类型的影像,每种影像的信息内容不同,处理难度也不同。此外,从单一的CT模态跨向更多维的模态,如何去组合使用这些数据,并且随着数据量越来越大,如何去利用这些数据构建一个更合适的模型,这一技术难度并不比打造ChatGPT要小。

其次,存储、神经网络等底层技术升维。

在医学影像AI中的应用场景有人体结构、病灶区的分割,疾病的早期诊断,解剖结构、病灶区的检测,提供疾病提示和辅助诊断等功能。但问题是,目前智能医学影像的应用局限于单一病种,需针对不同病种单独进行算法训练和设计开发。如何快速开发针对不同病种、不同模态数据或多模态融合的算法是一个行业难题。

郑超表示,“医疗影像AI领域并没有开源的东西可以直接用,需要企业主动构建更大、更宽、更广的神经网络;需要自主研发一些存储系统,支持在更多维度数据下的快速检索、高速存储;需要设法在web页面里实现更好的实时交互等,都提出了技术挑战。”

对于企业来说,这种原发性创新是一个艰辛的过程,但成效也同样显著。用数坤自己的话讲,数字人体平台2.0真正实现了“One for All”。

如今,作为院级影像智能化平台入口,数坤科技的“数字人体”平台及“数字医生”产品组合已被全国已近3000家医疗健康机构高粘性使用,在国内Top100医院的渗透率超过90%,目标公立三甲医院的渗透率近80%,市场覆盖率行业第一。

科研引领促发展,AI医疗行至质变关键期

另一方面,郑超也指出,除了上面所说的影像AI带来临床应用层面,数字人体赋能下的科研创新,同样会加速智慧医疗产业的发展。

具体来看,数坤智慧科研平台首先能够产生大量丰富有效的结构化数据,把有价值的影像数据管理起来,一键输出结构化的影像学特征,进而帮助有效提高输出有价值科研数据的效率。

其次,大部分临床医生在做科研的时候没有规范化的数据分析的思路,所以数坤智慧科研平台会提供一个医学科研的“大脑”,把规范的数据分析流程嵌入到平台中,让医生不需要担心数据分析和处理的方法问题,平台就能一站式全自动地完成全部流程。

郑超表示,“这就相当于实现了由医生们提供idea和数据,数坤智慧科研平台去做数据分析和处理的清晰分工。”

第三,数坤智慧科研平台为医生提供了一个科研百宝箱。目前医学常用的数据分析工具包括SPSS、R、Python等,医生不必再去新学一种计算机语言,把流程工作交给AI平台,缩短整个科研周期。

如今,“数字人体”2.0平台具备多模态影像集成、分析能力,在这个基础之上,数坤科技已经具备了做“新一代的医学科研”的基础。

更进一步的,对产业而言,这是一种好现象。说明影像AI与医生不是对立面,目前已经能够真正赋能于医、教、研、产各个环节,促进医疗更精准、更一致、更可及。社会各界统一这样的认知有助于促进实现技术成果的转化,带来更多的社会和经济效益。

目前,我国正处于实现“健康中国2030”战略目标的关键期,也是智慧医疗领域发展的黄金时期。

围绕“数字人体”平台,毛新生在本次CMEF上,亦明确了未来数坤科技的发展方向:接下来,在继续与行业专家发展数字人体平台的同时,我们还需要越来越多的伙伴共同合作,在全国各地能够把数字人体更好的用起来,给广大医疗机构提供价值,合作共赢,共谋发展,一起推动行业的进步。

雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/AkAxMJVR1ksLneNr.html#comments Tue, 23 May 2023 18:26:00 +0800
AI技术下沉乡村卫生室,腾讯做对了? //m.drvow.com/category/healthai/fd0DAO5Z07xI048N.html

今年55岁的方必勇,是贵州龙里县一个村子的乡村医生。

三十多年前,他考入黔南卫生学校“农村医学”专业,成为村子自解放以来的第一个科班生。光景最好时,他用了十五年时间做到了乡镇卫生院院长,又用了十五年时间回到乡村卫生室,背起药箱,走乡串寨,成了方圆五十里有名的村医。

“乡镇医院里不差一个我,但是村里就差这样一个我。”这是方必勇选择留在村里的理由。

如今,像方必勇一样的基层村医,龙里全县有240余名。在这个常住人口近24万人的小县城,几乎每一个村医要管理1000人,才能撑得起基层医疗卫生事业。他们属于医疗诊疗环节的“末梢”,行走在当地县城的“毛细血管”。

作为乡村医生,日常工作主要分为两块,一块是公共卫生服务,主要是定期随访四大慢病人群,建立健康档案以及给村民打预防针;另一块是基本诊疗,打针开药或向上转诊。

过去,方必勇用得最多的诊断工具就是“老三样”——血压计、听诊器、体温计。但基础设施的落后严重限制诊断准确度,一旦用药不准或过量,不仅耽误病情,情况严重的甚至还会酿成医疗事故。

“背上一个坏名声,村民以后就不愿意来了。”连方必勇这样经验老道的村医,依然害怕出问题。

实际上,这也是导致我国医疗卫生服务长期失衡的重要原因。

据全国第三次卫生服务调查显示,目前,我国80%的医疗卫生资源集中在城市,其中80%又集中在大中型医院,“小病买点药,大病奔三甲”,成为多数患者的真实就医写照。

因此,如何让村民放心在基层首诊,按需转诊,成为全国各地乡村卫生室的当务之急。

“基层村医要多扛一点,技术水平提高一点、服务能力完善一点”,这是龙里县医共体总院执行院长邓威经常说的一句话。在他看来,只有从源头做好分诊的“分”,才能保证分诊的“诊”,要善于将远程诊疗,AI导辅诊等先进医疗技术引进基层,才能一步步推动新型医疗服务体系建立,真正走出一条可复制的医改之路。

很多人不知道,在扶持基层医疗首诊上,腾讯医疗AI早在六年前就提前布局。

大专家空中坐诊,AI村里辅诊

“区域医疗发展的最大问题是什么?大医院一号难求,小医院门可罗雀,大病小病都跑大医院。”

邓威院长对这一现象深有感触。他原来是龙里县人民医院普外科主任,对于普外科这样的大型科室来说,收治病种繁多,急诊量大,手术多且复杂,工作超负荷是常有的事。但最难的问题是,一旦急重症患者错过“黄金就诊时间”,后果往往是不治身亡。

龙里县医共体总院执行院长邓威,走访乡村卫生室

邓威拿龙里县举例,龙里县超1500平方公里,下辖5镇81村,优先采用“就近就诊”才是最优策略。

然而,现实是目前龙里当地基层医生普遍存在学历低,大部分都是专科毕业,很少一部分通过继续教育拿到本科证书,存在技术水平不高、服务能力较差等问题,导致他们面对接诊时遇到的棘手情况,不会看病,很难与上级医院做好配合。

长期以来,我国针对基层医生能力提升制定了各种办法,比如专家下乡帮扶,基层村医外出进修。但多年来临床一线的工作经历,让邓威看到了不少问题。

“本身县级医院人手就不足,专家下派后各科室日常运作可能就出现问题,且不说医生下乡会不会‘打酱油’,光是医疗技术提升本身就是一个长期过程,专家撤回后,基层医生马上又回到原点。同样,基层村医每季度例行外出学习,基层卫生所就要关停,老百姓就诊就出了问题。

此外,邓威指出,过去医院也想过通过远程连线的方式帮扶基层医生,但设备大都固定在会议室,每次会诊都要花费大量精力统筹上下级医疗机构的医患时间,最终这批远程设备大都沦为了医院的开会工具。

因此,对于基层卫生室而言,一个尴尬处境是门诊医生全科技能不到位,被动输送仅有的病源,又不能跳出基药的用药桎梏,更无专科特长门诊。因此,不少人称:“现在的基层卫生室只具备公卫的功能,日常只做着测测血压、刷医保、配慢病药的‘搬砖’业务而已。”

2015年9月,随着国务院办公厅印发《关于推进分级诊疗制度建设的指导意见》,“基层首诊、双向转诊、急慢分治、上下联动”的十六字方针正式出台,释放加快建设各地分级诊疗制度的信号。

邓威表示,国家政策送来及时雨,一扫龙里县过去束手束脚的医改作风。

“从这以后,我们县医院和县委县政府,一直在构思如何构建一个可持续的医疗协同体系。更确切来说,基层首诊是分级诊疗的发展基础,要让患者对分级诊疗‘买单’,关键是要让优质的医疗资源在基层得到共享,让基层医院的实力‘硬’起来。”

实际上,这也是AI等新技术下沉龙里的重要契机。

2015年开始,针对龙里当地特点,腾讯与合作伙伴中迈医疗开始构思软硬件支持,率先在龙里各级医疗机构进行试点,目标是建成覆盖省、州、县、镇、村五级医疗机构的远程医疗服务体系。

值得一提的是,自2021年7月龙里县启动“医共体”建设以来,县人民医院、县中医院、县妇幼保健院以及 14 家乡镇卫生院、1家社区卫生服务中心实施“集团化办医”,近一步推动了各级医疗机构资源互通,为腾讯在龙里全县推进AI导辅诊平台吹来东风。

透过一个例子看AI在村医手中的用法。68岁男性,自诉有高血压,初次就诊,AI代入专科医生的视角,会这样辅助村医来问诊:

首先,会追问患者高血压的时间信息,包括出现多久、是首次出现还是复发,并追问相对客观的指标,比如血压的具体数值(收缩压/舒张压);


接着,追问相关诱因、伴随症状,比如AI还单独追问了“是否有粉红色泡沫痰”,“是否出现右上腹疼痛”。为什么会提这么具体的问题?实际上,这是患者有无心力衰竭的高危预警症状,AI试图一一排查。


最后,采集过敏史、既往史、个人史、检验检查等情况,全面评估患者情况,自动生成结构化的电子病历。

对于不常见的症状,或者没有把握的诊断,村医们习惯先找手机里的AI问一问。他们大致能感受到AI给出的参考是有条不紊的,但AI背后的知识库可能远超出他们的想象:

AI导辅诊技术背后的医学图谱,涵盖了近100万医学术语节点,以及近400万条医学关系链,为基层医生搭建了一个包含疾病知识、治疗方案、临床路径、用药规则等海量知识的“医学百科”。目前,AI导辅诊系统能够精准预测272种基层常见病,鉴别诊断超过3000种疾病,远超出国家卫健委要求基层乡镇卫生院开展诊治的66种基本病种。

同时,为了让AI更懂患者的口语化主诉表达,系统还用自然语言处理技术,学习海量的标准化医学文献,以及经过高年资医生标注的临床病历,形成具有数十亿参数的医学AI大模型,辅助基层医生更规范、全面地了解患者病情。

此外,以电子病历为基础,通过数字医疗协作系统“一键拨通”县级医院对口科室,就可第一时间获得上级专家一对一指导,为患者进行病情研判和精准诊疗,快速提升基层医生诊疗操作能力。

作为亲身使用者,方必勇在用了五个月后,已经能够熟练在移动大屏和手机上操作这一工具,每周都能与龙里县第一人民医院心内科的田医生连线交流。他直观感受到,“现在是AI和上级医生带着我一起学习,每次远程会诊就是一次示教,专家在线做信任背书。乡亲们知道不出村就能挂上专家号,就诊人数也变多了。”

龙里县团结村村医温园红,使用AI问诊后一键拨通上级医院

一组数据显示:距离龙里县二十多公里外的草原卫生院,2020年门诊量是8900多人次,自从接入AI导辅诊系统+远程会诊系统后,2021年全年门诊量提升2倍,达到了19000多人次。

与此同时,龙里各级医疗机构的差异化门诊报销比例,即省医门诊全自费,县医院为45%,乡镇卫生院为55%,进一步推动“大病不出县、常见病不出镇、小病不出村、康复回乡镇”的基层医改目标落到实处。

小步快跑、快速迭代,用互联网思维做一款医疗AI产品

“有些东西我们其实几年前就在做了,之所以这个时间点发布,是因为还是希望能有一些真正的成绩拿出来。这个需要时间的打磨,还需要有落地的印证。”

在2022年底的腾讯数字生态大会上,腾讯健康副总裁吴文达曾指出,腾讯的产品发布原则,不能够停留在纯PPT、讲概念的层面,必须有真正的产品操作页面拿出来,而且是已经开发完了,也实际验证过了,才会对外做展示。

事实上,从腾讯2018年6月正式开放旗下首款AI+医疗产品“腾讯觅影”的AI导辅诊引擎,已经走过五年时间。

这一过程中,如何实现导辅诊技术把传统的“人找服务”转变成“服务找人”,从住院、门诊和互联网就医场景中,把每一个就医步骤全部按时间顺序推送给患者,让患者能够平滑地完成整个就医过程,需要腾讯与医院和医疗信息化厂商打好配合,也需要提前练好内功。

腾讯AI导辅诊产品负责人赵静,最早负责QQ空间的对话交互,2018年以来转向医疗产品开发,她对雷峰网表示,早在2017年,腾讯AI导辅诊产品就开始做底层技术积累,将医疗AI、自然语言处理(NLP)、医学知识图谱等技术一体化,核心思路是通过NLP的技术研究医学文本,辅助医生诊断。

她形容道,“这个过程需要时间的积累,好比一个医学小白成长为独当一面的医学专家,需要经历熟读医学书籍的积累期,临床实习的诊断技能提升期,以及大量临床实践的执业期。与人类医生的学习路径相似,AI导辅诊也要遵循由浅入深的学习过程。”

首先,运用自然语言处理和深度学习等AI技术,学习、理解和归纳权威医学书籍文献、诊疗指南和病历等医疗信息,自动构建出一张“医学知识图谱”;

其次,基于病历检索推理和知识图谱推理知识,建立诊断模型;

最后,在人类医学专家的校验下,优化诊断模型。

因此,我们能看到,腾讯AILab、天衍实验室、优图实验室、等腾讯公司内部的AI实验室多次联手研发,贾佳亚、姚建华、郑冶枫等世界级科学家牵头项目,提供算法支持并参与模型开发工作。国内顶级医学专家,学科带头人,如宫颈癌方向侨友林、眼科方向王宁利、消化道方向李兆申等担任具体项目顾问,长期指导不同病种研究方向。

在第二十届中国计算语言学大会(CCL2021)的“智能化医疗诊断赛道”,腾讯天衍实验室团队提交的方案凭借较高的疾病预测准确率和症状召回率,成功获得该赛道第一名。此外,面向医疗大数据、自然语言理解、医疗影像等方向,多篇论文曾被自然语言处理领域的顶级会议ACL和人工智能领域顶级会议IJCAI接收。


近年来,在互联网技术和政策、疫情等大环境的推动下,在线问诊需求正高速增长,对自然语言处理技术在该领域的研究成果和应用落地也越来越多。但医疗行业有其特殊性,涉及到数据隐私、数据安全、数据伦理等诸多问题,一直被视为战略高地。

正如吴文达曾说过的一番话,“通过小型科研用AI的方式,监测某一个患者的并发症,这个不难实现。但如果要批量大规模做这个事,真正在医疗上面应用到AI,离不开数据质量的规范化。”

但事实情况却是,数据一直被各家视为“护城河”,作为稀缺资源并未广泛流通,零散分散在医疗机构的各种信息化系统中。

因此,腾讯AI导辅诊产品在落地过程中,坚持与已然打入医院内部的医疗信息化(HIS)厂商合作的核心目的,就是能力互补一一腾讯更专注于核心的AI算法,更多开放的是能力,医疗信息化厂商更懂医院、医生及医疗,这样的合作能加速技术在医院场景中产品化落地的进程。

直观数据显示,2018年AI导辅诊引擎发布当天,腾讯分别与智业软件、山东顺能、广州海鹚、金蝶医疗、健康160等医疗信息化厂商及其合作医疗机构签署了战略合作协议,上述五家医疗信息化厂商服务的医疗机构近千家,由此奠定了如今腾讯AI导辅诊的千院规模。

“这样的合作模式非常符合我们互联网公司‘小步快跑、快速迭代’的风格。”赵静表示,“产品一经推出就会上线,在线上做反复的迭代升级,我们也会亲自实地调研,盯医生用后的反应,也会邀请部分医生参与到优化过程中。”

从最早挤入一线大三甲,到如今辐射偏远基层卫生室,两项工作的难度不尽相同。

但经历过三年疫情大考,武汉战疫、上海战疫以及乡村战疫等,极限形势下的医疗AI落地方案不断更新,“比如各省份的问题需求,我们内部的研发配合,各地区的政策力度,HIS厂商的区域服务能力,能让我们积累具体场景下的软硬件耦合经验和部署实践。”赵静说到。

据了解,龙里县的数字化分级诊疗体系搭建,医院合作技术成本从5000万级别降至10万级别,每年可为群众节约就医成本370万元。这也意味着,腾讯AI导辅诊下沉龙里,跨越地域与资源的界限,正在带来一场深刻的医疗变革。

AI浪潮之巅,医疗AI的下一站

近期,随着ChatGPT上线火爆全球后,各个行业都开始高度关注到科技变革的力量。

据IDC统计,到2025年AI应用市场总值将达到1270亿美元,其中医疗行业将占市场规模的五分之一,中国已经迎来医疗AI的风口。

今年3月22日,腾讯在发布的《2022年第四季度及全年财报》中透露,正大力投入AI与云基础设施建设,将AI能力应用到工业质检、智能制造等产业场景,以及医疗、助老、生物多样性保护、农业等多个社会领域。

间隔一周后,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生对外简单透露,“腾讯正在研发类ChatGPT聊天机器人。”对于腾讯的聊天机器人是集成到QQ、微信,还是通过腾讯云向B端用户服务,汤道生回答三个字:“都会有。”

在3月国内大厂集体进入AI大模型“军备竞赛”的时刻,腾讯高层的表态,似乎有意在这一波浪潮中引而不发。

值得注意的是,早在2022年4月,腾讯曾首次披露“混元”AI大模型刷榜夺冠消息,当年12月,腾讯正式推出国内首个低成本、可落地的万亿参数“中文NLP大模型”——混元NLP大模型,并已悄悄嵌入腾讯广告、腾讯搜索等多个核心业务场景。

接连动作,已经明确腾讯加码NLP赛道的野心。而混元NLP大模型如何进入医疗场景,成为腾讯的一道重要命题。

但毫无疑问,AI导辅诊是NLP大模型发挥价值的热门赛道。这有很大的想象空间。

首先,重点研究因果推理,疾病预测将实现可解释。

过去的NLP系统更像一个黑盒,只能输出结果,很难解释为什么是这个结果。但如今ChatGPT等大模型在这方面有了不错的提升。比如让ChatGPT去解一道数学题,它既能告诉你答案,还能分步骤解释解题思路。

ChatGPT解题思路

“因此,推理逻辑是GPT等大模型的最大升级。”

赵静说到,“如果这一技术放在辅助诊疗、疾病预测场景下,不仅能够自动对话梳理患者病史,比如发病时间、伴随症状、首发复发、体检指标、相关诱因以及过敏史,既往史,家庭史等,快速出具预测结果;同时,还可以展示相似病人病历,依据病理给出判断理由。”

今年2月23日,中共中央办公厅、国务院办公厅印发了《关于进一步深化改革促进乡村医疗卫生体系健康发展的意见》,明确提到一点:要逐步促进村医执业医师化,到2025年,乡村医生中具备执业(助理)医师资格人员比例提高到45%左右。

以龙里为例,目前基层乡镇卫生室已经建立远程会诊体系,未来除了不定期的远程带教和远程查房外,基层医生还可会通过AI导辅诊工具补齐知识短板。从县域医疗发展的整体出发,这种模式也将促进“输血式”的远程“拉帮带”,升级为自驱式的“造血式”常态化学习,从而进一步提高基层医护人员的医疗服务能力,有效推动县域优质医疗资源的扩容和下沉。

其次,发挥AI大模型强大的整合信息和语言组织能力,能提高智能预问诊、院外随访“人味儿”。

“它可以读取就医场景所有的医疗政策,就诊流程手册,基于这些内容提供相应的服务引导,具体到科室,路线等,这是更加人性化的交互,可以做到比你更了解医院场景,甚至在提供服务时比现有的智能客服更有温度。”

与此同时,赵静指出,要实现这些功能还有不少难点。

在准入门槛方面,算力壁垒决定训练成本高,目前国内只有几个大厂具备能力布局大模型。而OpenAI逐步放弃开源,极大增加了国内科技企业的复现难度。头部厂商能否支撑训练及推理环节的算力需求,还需要考虑资金充足程度与公司战略。

在数据方面,如何获取高质量的数据,利用医疗数据训练完成后,模型准确性或可适用度到底有多高,还值得论证。互联网词汇存在负面信息,单纯凭借学习能力无法清除这些训练数据,因此,具体标注技术细节、对标注员的培训等仍需要国内科技企业探索。

在人机交互方面,如今大多数ChatGPT的生成过程包含随机性,让它看起来更不受控制,或者生成虚假回答。但医学领域强调客观、准确、及时,如何在医学这一严肃的垂类领域做出好的交互工具是个不小的挑战。

如今,由ChatGPT引发的AI热潮,已经行进到炉火纯青的关键阶段,再立浪潮之巅,赵静和团队都有不少感触,“或许我们不是颠覆者,但我们一直在做难而正确的事。”

雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/fd0DAO5Z07xI048N.html#comments Fri, 21 Apr 2023 10:12:00 +0800
AI大模型不止于技术内卷,生命科学界正式打响落地第一枪 //m.drvow.com/category/healthai/tYHSzFC3Owl5JvlH.html 生命科学领域迎来新故事。

最近的一段时间,很多人都在讨论AI,几乎每一个前沿科技关注者脱口而出,“ChatGPT开启微软谷歌对决”、“中国AI大模型之争”、“英伟达推出核弹级显卡”。

当这些话题凑在一起,AI便沾了一身烟火气。业界借用2007年乔布斯发明iPhone的现象级事件,盛誉这是属于“AI的iPhone时刻”。

不可否认,在这波AI浪潮中,百度抢占先机。

3月16日,百度发布大语言模型产品“文心一言”,李彦宏站台,继ChatGPT后推出全球首个对标产品。一周后,3月23日,李彦宏所创百图生科,发布生命科学大模型驱动的“AI生成蛋白质平台(AIGP,AI Generated Protein)”,同时发布AIGP生态合作计划,旨在将生命系统与AI计算结合,在行业伙伴的加持下,为科研、环保、材料、消费等领域提供解决方案。

相比较而言,国外尽管有Meta、IBM Research、Salesforce Research等公司和机构更早推出生命科学大模型,却仍处于“论文发表”阶段。而AI技术本身就要跟场景密切结合,无论是百度还是百图生科,都在技术落地上更进一步。

百图生科联合创始人兼CEO刘维

百图生科联合创始人兼CEO刘维,在发布会当天对雷峰网&《医健AI掘金志》表示:

“这一模型早在百图生科两年前成立时就有酝酿,在当下时间点推出,既来自于这波AI大模型浪潮的推动,同时也说明,百图生科已经积攒了较高的平台化能力,诸如世界最大规模的免疫图谱、全球最快复合物结构预测模型、全新蛋白质药物ImmuBot等等,到了化零为整的发展阶段。”

AI进入大模型“黄金年代”

何谓“AIGP”?

实际上,与之相近的一词,是最近火出圈的“AIGC”(AI Generated Content),即利用人工智能技术来生成内容。AI绘画、AI写作等都属于AIGC的分支。相应地,AIGP,即用AI自动生成蛋白质。

因此,尽管“AI生成类”任务千差万别,但背后的逻辑别无二致—— 大力出奇迹,只要投喂足够的数据,AI就能够表征人类的知识,从而实现从“发现”到“创造”。

因此,尽管过去十年跨模态的生物数据得到了快速的增长,但是在数据的挖掘和应用方面仍然存在着许多挑战和难题。这种速度增长的数据对传统的生物学或者生物信息家来说,已经难以用小工具去分析。

得益于数据、算力、模型本身的充分发展,如今人工智能落地已经进入“大模型”时代。

美国斯坦福大学的权威研究团队,更是将这一类大规模预训练模型形容为“基础模型”(Foundation Models),意味着其会是各种行业智能应用必不可少的大型基础设施。

在NLP、CV等多类任务上,大模型已经展现出碾压性优势,发展生物计算大模型正当时:人体这一多尺度的复杂网络,加上多模态、高噪音的超大规模生物数据,非常需要独有的超大模型来提升研发效果。

因此,百图生科自2020年成立以来,便开发了具有千亿参数的生命科学大模型体系“xTrimo”。

据悉,百图生科生命科学大模型“xTrimo”,全称 Cross-modal Transformer Representation of Interactome and Multi-Omics,面向最难的生命科学问题,是全球首个、也是目前最大的生命科学领域的“超大规模多模态模型体系”。

该大模型从跨物种、跨模态的生命信息中学习蛋白质如何构成和实现功能、如何相互作用、如何组合和调控细胞功能的关键规律,从而破解生命的自然语言——蛋白质。

基于大模型,AI在一系列任务算法上取得了明显的进展,除了更好地完成结构预测等基础任务外,也开始可以根据不同的问题输入,以生成的方式,设计创新的蛋白质,来回答各种生命科学问题。

因此,如果说千亿级参数的ChatGPT掀开了语言生成式人工智能的序幕,那么正在从千亿参数迈向万亿参数的“xTrimo”,则是吹响了冲击诸多生命科学命题的号角。

百图生科CTO宋乐博士

正如百图生科CTO、首席AI科学家宋乐博士表示,“基于大规模预训练模型,正在成为解决问题的一种范式。药物发现等生命科学问题的社会价值和行业价值极高,比起其他任务场景,需要更多企业投身到这个趋势中,实现前沿项目的加速研发。”

国产AI大模型的顶层设计

能在两年时间内完成千亿参数AI大模型的全部准备工作,对任何公司来说都是一个不小的难题。

对比OpenAI来说,2015年公司成立,足足等了三年才正式推出GPT-1,直到2019年2月,GPT-2版本开启公测阶段,又隔三年才终于通过ChatGPT打响AI大模型。

一定程度上,AI研发需要细水长流,即便是集齐Sam Altman(Y Combinator总裁)、Elon Musk(特斯拉CEO)、Peter Thiel(PayPal联合创始人)、Reid Hoffman(LinkedIn联合创始人)等一众硅谷科技大亨的OpenAI,七年时间才让AI技术的民主化不再是纸上谈兵。

与此同时,OpenAI的爆火再次说明,中国也需要有自主“大模型”,而且在OpenAI等科技巨头的牵制下,AI大模型已经有明确的技术下限。

宋乐表示,“这需要在模型搭建之初,就做好顶层设计工作。主要分为三大块:数据设计、模型设计、训练方法设计。”

一、数据设计

对于AI大模型来说,生成结果的质量如何,取决于灌输了何种质量的数据。因此,AI生成蛋白质的本质问题在于,是否已经到了“输出即用”的程度?

在发布会现场,刘维也举例道,我们能要求AI自动生成一个圆形蛋白质、胡萝卜形蛋白质、甚至是花形蛋白质、但这些蛋白质没有一点实用价值,只是一种技术模拟。换句话说,如果没有大量且高质量的数据做“投喂”,AI生成只是一个“空壳”。

为此,百图生科在过去的两年中,主要工作放在了建立生命科学数据图谱之上。

据悉,目前百图生科已经建立全球规模最大的免疫图谱xAtlas,覆盖66+亿蛋白,超过300亿蛋白互作关系,1亿单细胞,以及6100+万免疫互作关系,和6000亿泛细胞共现关系的大规模图谱。其中,90%的数据来自于公开或半公开的非结构化数据,其余的10%则来自内部实验室产生的私域数据。

宋乐表示,尽管这些数据听起来很容易找到,但整理起来难度极大。“因为这些数据散落在不同的数据集,甚至是非结构化数据,在各种论文、专利中。因此,如何抽取重要数据,并且关联数据,比如对齐、聚类、去重、筛选等,需要大量的专业人员付出努力。”

具体来看,百图生科的生信工程师会基于自有实验体系,重新测量、评估数据,以验证公开数据之间的相关性或准确率,测量结果将影响模型训练时对数据的使用权重;同时,围绕数据对应关系的建立,百图生科花费了一年的时间实现了公开数据的对齐,比如,将蛋白质与基因配对,将相互作用对应的两个基因或蛋白质进行关联等。

刘维表示,前期百图生科的生物投资动作,也是如今能够和医药行业伙伴在数据层充分合作的重要原因。目前全球已投资超过50家早期企业。

投资生态版图

实际上,仅仅是以上公开数据,就足以炼就生命科学领域的专有AI大模型,为何还要补充内部实验数据?

如果拆解ChatGPT来看,这一模型之所以强大的原因,在于验证了参数增长、训练数据量增大,对AI模型的重要意义;其次,ChatGPT采用“小样本+人类反馈微调监督学习”的方法,解决了大模型数据标注工作量巨大的问题,是模型得以迅速迭代的基础,并且显著提升了真实性、减少了有害信息的输出。

同理,在生命科学领域里面,加标签的成本要高很多,比如,给一个蛋白质的序列加上标签,往往需要大量的实验,包括电镜的收数据、解数据。

“因此,通过高通量实验等产生的数据,就可以直接绕过加标签这一步,可以理解为生命科学大模型的监督信号,让它能够合成有功能的蛋白。”

宋乐进一步表示,“这个就是AI从大规模预训练模型走到具体实用的一种模式。”

据悉,在内部数据获取方面,为更好地实现引擎的干湿闭环,百图生科构建的免疫模拟和扰动实验体系,从临床出发,开展10余个免疫治疗前后的队列项目,计划采集样本千余。

以组学实验室为例,百图生科针对10余种不同来源的组织进行样本处理,每年可采集1000万个单细胞测序数据。而在更后端的早期成药性筛选环节,每月可交付2000个样品,检项包括靶点抗原亲和力,多聚性,热稳定性,酸碱峰分析,基于质谱的完整分子量和糖型分析。

刘维表示,为了加速推进几十、上百个药物管线的开发,百图生科在苏州建立了一套完整的从抗体发现,到蛋白打印,再到抗体工程和优化的平台,能够高通量地实现药物亲和力、特异性、表位、功能、可开发性的全方面数据采集。

“可以说,这一套高通量实验验证体系,就是为了实现干湿数据的端到端闭环,也是近两年开始,我们这一代公司才有这样强的需求。”

从蛋白实体、到蛋白和蛋白相互作用,从单个细胞、到多细胞系统,这些在免疫模拟系统内产生的高通量私域数据,加之百图生科基于公开数据精细化加工所得到的多模态数据,汇成了AI大模型的“数据基石”。

二、模型设计

搭建生命科学领域的AI大模型,同样是一个“从无到有”的创新过程。正如宋乐所言,为何模型参数选定为“千亿”,而非“十亿”、“百亿”,或者“万亿”?事实上,从性能和成本上看,千亿参数是一种平衡。

首先,千亿参数对于自然语言大模型来说也是非常大的量级。目前每个蛋白质长度是几百,总体而言,蛋白质数据量级已经能够媲美自然语言数据,数据量已经达到千亿级别,万亿或者更多。

宋乐表示,“如今的蛋白质数据已经能够媲美自然语言数据,数据量早已达到TB Trillion级别,在拟合过程中尝试过不同亿级的参数,最终发现,参数越大,对问题理解程度和表征能力越强。而千亿参数才能充分吸收蛋白质相关信息,才能精准预测蛋白质结构问题,以及denovo(从头生成)精准度较高的蛋白。”

刘维补充道,“反过来看,是不是一定有千亿参数才可以进行蛋白质结构预测和设计?”

他表示,“通过几个轮次的模型迭代来看,如果AI做的设计出来东西,跟普及度更高的动物筛选平台差不多,或者拉开的差距不大,那么AI就没有优势可言,因此,‘一万亿倍差距’才是我们值得探索的目标。此外,我们的特长是解决行业中目前无解或者更前沿的问题。”

实际上,目前生命科学大模型仍有参数上升趋势,但从现实成本考量,千亿已经算是是行业中极高的技术门槛。

宋乐指出,训练一个千亿级的大模型,可能需要上千个GPU,运行3到5个月,每年对类似xTrimo这样级别的大模型进行几次训练,需要在计算资源方面花费上亿元。“而我们背靠百度算力资源,也是能够把生命科学大模型做出来的一个重要原因。”

此外,百图生科与百度云联合构建了“混合异构的生物超算中心”,能够支持动态获取高达几千到几万个GPU,以及相应的CPU资源。

值得一提的是,目前xTrimo的下游模型,比如抗体抗原复合物的结构预测、亲和力预测,单细胞在扰动下面的响应预测等等,都达到了业界的最优水平。

刘维表示,“无论是预训练模型设计,还是下游模型微调上看,既是对AI和生物两种背景人才合作和碰撞的好机会,也是百图生科对未来尖端人才融合培养的一次尝试。”

同时,刘维保持着一如既往的开放态度,谈到AI大模型的发展趋势,“如今AI大模型的技术浪潮,确实带来一种繁荣,甚至一开始还会出现重复造轮子,无序竞争的现象。某种意义也不是坏事,意味着更多人才和公司发展出来,自然会有所分化,找到适合自己的垂类方向。”

三、训练方法设计

在发布会现场,“行业敬畏”是出现极多的一词。

如何理解呢?

百图生科企业发展副总裁瞿佳润(Vicky)表示,“生命科学大模型已经取得了很大进展,但它天然具有持续迭代的特性,因此需要不断地去整合生命科学领域的各种数据、知识和技术。”

百图生科企业发展副总裁瞿佳润(Vicky)  

以数据为例,因为生命体的高度复杂度,目前数据量很大,但仍然是有限的。随着生命科学领域观测手段和技术的发展,吸收更多的数据尤其是垂直类数据,将使我们能够更加精细精准地理解进化,理解生命。

这也就意味着,要实现这一目标,百图生科需要不断吸纳新的合作伙伴,特别是那些在体外模拟体系、超精度观测和特殊验证体系等方面具有丰富知识和技术的生命科学家。

敬重科学的力量,并且利用成熟的商业合作推动技术具像化,正是这次AI风口的最大魅力。

但百图生科带来的想象力并不止于此。在生命科学行业,具有通用能力的大模型成为基础设施,在支持具体的新任务时,只需要利用该任务的标注数据进行微调即可,一般工程师就可以实现。

在大模型时代,所有面向生命科学的公司,都可以便捷地用最先进的AI技术来解决各自的业务问题,不同规模的企业重新站在同一起跑线上,将大幅加快生命科学的面世进程。

正如瞿佳润所言,“百图生科的目标,是让更多人带着高价值问题,零门槛或低门槛启动起来。”

对此,全球顶尖生信专家Robert Gentleman教授评述,“如果将这一模型视作‘idea generator‘,一切会变得更加美妙”。在百图生科的基因里,“用科技让复杂世界更简单”,与之遥相呼应。

一场生命科学进击之战

困扰AI的最大问题,是应用。

说到底,百图生科究竟有没有起底生命科学的实力?从目前的合作伙伴上看,百图生科已经赢在了起跑线上。

瞿佳润透露,目前xTrimo体系的进展和已经应用的具体案例,截止目前,xTrimo大模型已经在蛋白结构预测、抗体序列生成、细胞表征等问题上实现SOTA,并在细胞功能预测、denovo药物设计上取得突破性进展。

AIGP 3大功能模块+12项核心能力示意图

据雷峰网&《医健AI掘金志》不完全统计,在F2P、P2P、C2P等AICP三大能力上,典型合作伙伴有:

F2P:MBZUAI(石油污染降解酶联合设计)、世界渐冻人日(渐冻症调控蛋白设计)、西湖大学(and-gate蛋白设计)、STEALTH PARITNER(基因疗法递送蛋白设计);

P2P:HARBOUR BIOMEO(高性能免疫调控弹头设计),华辉安健(难成药靶点精准设计)、逻晟生物(定表位抗体筛选)、新景智源生物科技(可溶性TCR亲和力优化);

C2P:免疫学研究所(巨噬细胞靶点和调控蛋白发现)、清华大学(多种自免疾病靶点和调控蛋白发现)、北京大学肿瘤医院(胃癌靶点和调控蛋白发现)、中国医学科学院肿瘤医院(食管癌新细胞调控靶点挖掘)、索智生物(IBD协同双靶点挖掘)。

刘维表示,目前百图生科的AIGP平台,可支持同时跑四十多个生命科学研发项目,如果按照传统的生命科学逻辑研发,这可能需要花费十亿美金。

与此同时,他也坦诚表示,如今的AIGP平台还是一款不算完美的产品。尽管前沿Denovo蛋白质预测的指标已经达到SOTA或首创,但原因很简单:“这些领域原来基线太低,不意味着我们都能高质量地完成工业任务。”

因此,回过头来看,为何百图生科选择与行业伙伴共同深入到原创药物的设计、研发、临床试验等环节,而非定位于“CRO”的角色,致力于外包服务?

在发布会现场,刘维、宋乐从经营运作和技术发展的角度给出相似的回答:

“两年的时间基本够干什么呢?数据整理完成第一个阶段,实验体系完成第一个阶段,大模型架构完成第一个阶段,对一系列的任务评估问题达到SOTA,只能说搭起一个架子。而生命科学最大的魅力,正是在于未知问题的上限高。”

因此,如今百图生科推出AIGP平台的逻辑,恰恰只是一个开始。

据悉,在发布前,AIGP平台已经进行了一段时间的内部测试,有近20家合作伙伴和百图生科开展了AIGP联合研发合作。随着这一平台开启“公测”新阶段,行业伙伴的使用与反馈,论证模式的可行性,也会加快其后续的迭代速度。

正如刘维所言,“他们既是我们今天的第一波联合开发者或者用户,也是我们未来的合作伙伴,而且百图生科跟主流的CRO企业间仍然是合作的关系。”

百图生科AIGP平台发展计划

在这次的AI浪潮中,一家公司是否具有技术理想主义,被再次定义为技术草莽时期的“胜利”。但百图生科的布局在于,它已经构建了一张够的着的商业蓝图。

一年前,刘维强调,“百图生科研发的目标直接锚定在“first-in-class”(全球新)药物,对标的医药巨头基因泰克”。一年后,有人问到“逐步开放技术生态,是否会更趋向于生命科学领域的OpenAI?”

他的回答是:这需要一种平衡,在技术发展初期,要愿意像OpenAI一样俯下身来打磨产品。

]]>
医疗AI //m.drvow.com/category/healthai/tYHSzFC3Owl5JvlH.html#comments Thu, 20 Apr 2023 11:17:00 +0800
「霰弹枪测序法」推动者、ACM Fellow姜涛:从中科大计算机,走入AI生命科学的光辉岁月 //m.drvow.com/category/healthai/dEMCmU2p3gosNjSD.html 姜涛是极少数能同时把计算机理论和生物学都做好的学者。

近四十年的工作学习生涯中,姜涛最初并非从事生物信息学工作,而是研究计算机理论和算法。

直到1995年,他获得首次学术休假,决定利用机会拜师Richard M. Karp。人类史上规模最宏大的跨国跨学科工程人类基因组计划进行之际,就连Karp这样享誉国际的计算理论界泰斗都投身其中。

就这样,姜涛走上生信道路,新世纪后又参与了第二次生命科学浪潮——基因芯片设计与应用。

43岁,姜涛当选美国科学促进会会士(AAAS Fellow),又在一年后接连升任UCR校长讲座教授和计算机协会会士(ACM Fellow)。1988年博士毕业至今,姜涛发表了超300篇论文,高产期一年多达18篇。

回顾这一路的发展轨迹, 姜涛认为自己多少带有些运气成分,“个人成就总是离开不科学发展大环境,如此才能保证科研工作的影响力及可持续性。”

但换句话说,那又何尝不是时势造英雄,即所谓“时来天地皆同力,运去英雄不自由。”

中科大,学术的春天

1958年,兰州市郊北山之麓,一座新学校拔地而起。

此处黄土光裸、风沙肆虐,来人无不叹句荒凉。

原来,在铁道部的领导下,唐山铁道学院、北京铁道学院两所学校(部分系所及员工)迁至于此,组建起了这所新的“兰州铁道学院”,也就是后来的兰州交通大学。

“西部大开发”,一个充满了时代性的口号,将许多人的一生留在了那里。姜涛的父母就是如此,他们随唐山铁道学院西迁至兰州,把家安在了大西北,并养育了一对儿女。

上世纪70年代,我国部分地区的中学学制为四年(初高中各两年),等到姜涛1979年考入中科大时,也仅仅16岁出头。在当时平均年龄为16.7岁的同级学生中,姜涛比中科大少年班的学生也大不了多少。

实际上,姜涛完全有机会参加1977年的高考,当时已通过了省里的高考预考,但姜涛自觉书没读够,便拖到了两年后。兜兜转转,姜涛回到了老家安徽。


1984年,姜涛(左二)在中科大毕业时和室友合影

1978年3月,时任中科大校长的郭沫若在全国科学大会上发表了演讲《科学的春天》,鼓励全国的青少年学习当代科学技术,打破陈规,披荆斩棘,开拓我国科学发展的道路。

这篇激情洋溢的演讲令姜涛深受震撼,时隔四十余年,他仍然形容那篇演讲是“诗一样的鼓舞”。

同样在1978年,作家徐迟在《人民文学》发表了报告文学《哥德巴赫猜想》,这篇讲述数学家陈景润成长与研究经历的文章一经问世就引起了热烈反响。全国各地报纸、广播电台纷纷全文转载和连续广播,在当时掀起了崇尚科学的热潮。

1979年,来自西部黄土高坡的姜涛,与来自江苏张家港的周耀旗(现任深圳湾实验室系统与物理生物学研究所副所长)一起进入了中科大,还差点成了同班同学。

周耀旗曾介绍,1979年的高考化学科目非常难,他在这门科目上发挥得却不错,因为这个优势填报了中科大的近代化学系。

姜涛原本的计划也是学习化学专业。他的母亲曾在兰州铁道学院给排水系执教,研究水环境等相关课题,化学知识背景深厚。在母亲的耳濡目染下,姜涛的高考化学成绩非常优异。但在改革开放后,中国半导体产业逐渐进入全面复苏阶段,中科大无线电电子学系(现名为电子工程与信息科学系)成为了全国教育重心。

著名电子学家、时任中国科学院电子学研究所所长顾德欢先生出任首任系主任。姜涛谈到,“从实用性方面考虑,父母更鼓励我选择无线电系。”

那时,中科大各院系一直延续着“五年制+大一不分专业”的教学模式。入学第二年,姜涛选择了计算机专业。1982年,计算机专业独立建系,不再隶属于无线电系,姜涛也在这一年结束了长达三年的基础课程学习,开始进行专业课学习。

受时代所限,即便是中科大这样的高校,在七、八十年代能够提供给学生的上机机会也十分有限。姜涛描述,“只好把主要精力放在基础学科上,一边学习数学、物理、化学的课程,一边排队等待上机。”

一天,数学系的王树禾前来教授图论课,还是穿着他那件发皱的蓝色中山装。在姜涛的记忆中,王老师有科大组合数学四大天王之一的美誉,他编撰的《图论》深入浅出、鞭辟入里,被计算机系选为教材。

但更重要的是,他每堂课总是特意查找有关数学家的生平,为枯燥的内容增色不少。


王树禾、李炯生、陶懋颀、李乔(从左到右),在中科大被称为组合与图论四大天王

那堂课结束后,姜涛很快便找到了一个可行的科研方案——理论研究,从自己擅长的数学与算法入手。

后来,在王树禾教授的鼓励之下,他便将目标确定为一个悬而未决的图论问题:哈约斯猜想(Hajós' Conjecture)。实际上,这个猜想早在1961年就由法国数学家哈约斯(Hajos, G.)提出,简单来说,就是如何将一个图拆分成少量不相交的圈。

经过半年的研究,尽管姜涛没有完全解决这一问题,但他至少在平面图的范围内证明了哈约斯猜想。后来这一成果于1984年发表在中科大的学报上,是姜涛为数不多的中文研究成果,也成为了他竞争郭沫若奖学金的重要成绩。

值得一提的是,由于新中国此前从未设立过学金,只有“助困”性质的人民助学金,郭沫若奖学金也被视为“新中国第一奖学金”,更被无数科大学子视为梦寐以求的最高奖。

1982年开春,学校隆重举行1981年度郭沫若奖学金获得者、三好学生、优秀学生干部授奖大会。获奖者有姜涛、白重恩(清华大学经济管理学院院长)。

对姜涛而言,这是他学术生涯的起点。

选错学校、自挣学费,一份轰动性的计算机成果

姜涛的出国经历堪称曲折。1984年,姜涛与周耀旗同年毕业。

相比之下,周耀旗获得了国家公派留学的名额,在中山大学进行一年集训后顺利出国。而姜涛所在的计算机系,在中国仍是一个新兴学科,并不属于多个公派留学的计划覆盖范围之内。

于是,姜涛准备“曲线出国”——报考清华大学的研究生,争取已分到清华的日本留学名额。

可在准备考试之前,中科大计算机系公布了公派留学计划——从应届毕业生中选拔一些优秀学生出国留学,毕业后回到中科大任教。尽管一番折腾,姜涛最终拿到了留学名额,并通过了英语考试。

出国在望,手续却不太顺利。

这项留学计划原本启动时间就比较晚,且当时国内的计算机科学底蕴尚浅,姜涛与国外几所高校沟通留学事宜都没有成功。原定于1984年秋天启程的留学之旅,便拖了下来。

经过漫长的等待,两封来自美国的录取通知姗姗而来,一封来自马里兰大学,另一封来自明尼苏达大学。这两所学校都被是公立名校,但相比较而言,马里兰大学的计算机专业排名要更靠前。

然而,那个年代信息流通缓慢,姜涛找来的一份美国大学计算机科学专业的排名(Gourman Report),显示明尼苏达优于马里兰。所以,拿着这份“过时”的排名,1985年初,姜涛去往明尼苏达大学。

1986年于明尼苏达大学

作为中科大计算机系的公派留学生,姜涛这一批学子担负着学成归国任教的任务。在挑选专业时,姜涛站在学校和国家更需要的角度考虑,选择了当时国内尚未开设的软件工程专业。

一段时间后,姜涛发现软件工程专业的很多课程自己没有学过,很难跟上进度。加上当年在科大排队上机的经历,让他在编程功底上欠缺太多,于是决定转向其他研究方向——计算机理论。

当时的明尼苏达大学计算机系中,这个方向的老师并不多,姜涛选择了其中一位美籍菲律宾教授Oscar Ibarra。这位教授当时正在进行晶格自动机(cellular automata,作为并行计算的一个基本模型)的研究.因此,姜涛博士阶段的研究主要围绕这一主题进行。

生计问题是姜涛在留学期间的另一重压力。

国家资助了姜涛留学第一年的学费与生活费,次年开始所有的开销都要自己承担。于是姜涛选择了在当时最适合学生做的兼职——担任学校的教学助理与科研助理,获取奖学金。读博士期间,姜涛有一半的时间在做教学助理,另一半的时间在做科研助理。

1987年,姜涛在晶格自动机通讯复杂度研究上取得了初步成果,开始参加国际学术会议;1988年,攻读博士学位不到四年的姜涛已经达到了毕业标准。

毕业前夕,姜涛参加在华盛顿特区举行的IEEE Structure in Complexity Theory年会时,结识了会议的一位“圈内人物”——李明。

李明已经博士后毕业,在美国任教,和姜涛一样是一位纯粹的计算机理论研究者,与生物学的缘分尚未来临。但这次的会面为二人在加拿大重逢,成为关系密切的朋友与合作伙伴,共同研究生物信息学埋下了伏笔。

二十世纪八十年代末,留学生想要留美任教手续十分繁琐,难以获得签证,毕业后往往要先离开美国一段时间,再回去才能应聘教职。作为北美州唯二的两个发达国家,加拿大与美国毗邻,二者的社会文化环境、科研条件等都较为相似,几所杰出的高校也具有很好的科研基础。

在美国签证发放不断收紧的情况下,姜涛前往加拿大的麦克马斯特大学任教,李明也离开了美国前往加拿大工作,先后入职约克大学与滑铁卢大学,和姜涛所在的麦克马斯特大学车程不到一小时。

1994年,姜涛(居中)在麦克马斯特大学的科研团队

初到加拿大,姜涛在当地的计算机理论领域“举目无亲”,不远处的李明既是老乡,又是在美国求学时的旧相识,自然而然地来往密切起来。

“对我来说,李明是一位兄长,我在工作上得到了很多他的帮助和提携。”

李明比姜涛年长几岁,向来不吝惜向姜涛传授自己的科研经验,甚至于后来姜涛转向生物信息学的研究也与李明的鼓励密分不开。除此之外,两人在Kolmogorov complexity理论在计算复杂性及算法平均复杂性分析中的应用方面也有多项合作,并解决了多个著名难题。

二十世纪九十年代初,在李明的激励下,姜涛参与到人类基因组计划中的一个重要测序方法——霰弹枪测序法的研究之中。其中一个相关的重要问题是:当给定一组字符串后,怎样计算它们的最短公共超串(shortest superstring)。

姜涛首次得到了一个著名算法的线性逼近分析。后来,团队中又加入了来自荷兰CWI的John Tromp、 MIT的Avrim Blum、贝尔实验室的Mihalis Yannakakis三位学者,合作发布了一篇STOC论文《 Linear approximation of shortest superstrings》,在当时的计算机理论领域引起了强烈反响,带动了一大批做算法的学者研究这一问题。

2006年,姜涛(右一)和李明(左一)合影

可以说,霰弹枪测序法是姜涛的生物信息学入门之作。

1994年,姜涛和他在麦克马斯特大学的第一个博士生王鲁生,以及加州大学伯克利分校的Eugene Lawler教授(著名组合数学家;已故),合作开发了一个关于多序列比对的快速近似算法。

这一算法在当时引起不小的震动。不少本领域的权威人士,如Pavel Pevzner、Eugene Myers、Webb Miller等都认为“这个结果既 surprising ,又非常deep”,并被写进多本生物信息学教科书。

1995年,姜涛和王鲁生以及另一位在加拿大西安大略大学的张凯中教授合作,一起开发了一种比较树结构的方法,称为“树比对”,并于当年发表。这种方法较传统树结构比较方法(树编辑)在计算上有多种优越性,所以也在生物信息领域之外(如数据库查询,XML数据处理等)得到广泛应用。

这一研究的份量在姜涛看来不轻,因为长期以来生物信息学总是借鉴其他领域的方法,如,机器学习、数据挖掘、自然语言、图像处理,“而它是为数不多的,将生物信息学方法推广到其它领域的范例之一”。

这是姜涛从计算复杂性理论转向算法研究的分水岭,却不能算是他进入生物信息学领域的标志,“这时候我还从还没有真正看过生物数据,只是做了一些算法问题。”

直到1995年学术休假时,李明建议姜涛,“生物信息学现在非常重要,我们应该尽早涉入。”

拜师计算机理论大佬

出于对李明的信任和尊敬,姜涛决定利用学术休假学习生物信息学。

1995年,姜涛利用一年的学术休假“拜师”Richard M. Karp。Karp(1985年图灵奖获得者)是一位计算机理论、算法领域的大师,一生有诸多传奇。1968年,他离开工作十年的IBM沃森研究中心,前往加州大学伯克利分校(UC Berkeley)工作。

那里是计算机科学理论的一个著名研究中心,Stephen Cook(1982年图灵奖获得者)、Manuel Blum(1995年图灵奖获得者) 、姚期智(2000年图灵奖获得者)等一批知名学者都先后在此任教,学术气氛十分浓厚。

不过,这样一位计算机科学界的顶级大佬,在90年代初期来了一个“大转弯”——将研究重心移到了生物信息学领域。

这在学术圈是轰动性的大事。很多学者猜测是由于HGP(人类基因组计划)的启动,使得Karp看到了计算科学在基因组测序及分析方面的潜力。没过多久,Karp本人就亲自证实了这一猜测。

姜涛是最早得知Karp研究变动的人。1995年,在姜涛发去拜师邮件后,很快便收到了Karp的回信:“我即将搬去华盛顿大学(西雅图),你有没有兴趣同往?”

1993年,人类基因组计划的发展如潮水般凶猛,自动化基因测序仪的诞生推动HGP进入了实质性的运作阶段。1994年,3000个(原计划为600- 1500) 标签分辨率为1CM (即1%重组率)的遗传图谱的绘制,标志着HGP进入一个新阶段——物理图谱绘制阶段。

Karp之所以要动身去往西雅图,一个重要原因是HGP的研究中心之一设在了“西雅图华盛顿大学基因组测序中心”。现在,有一个机会摆在姜涛面前。

这个中心里,领导者是物理图谱领军人士及人类基因组计划发起人之一Maynard Olson,具体合作者包括Gane Wong及于军,大家共同创立了当时世界上最严谨、精确、系统的基因组物理图谱制作方法——多酶完全水解物理图谱,还将其用于规模化物理图谱制作,并为基于克隆的DNA测序提供直接材料。

那时候姜涛还没到35岁,但觉得时间过得飞快。这是一段绘制人类DNA图谱的“军备竞赛”,医药公司以及私营企业实验室加入竞争,迫使人类基因组计划陷入一场疯狂角逐。

姜涛逐渐认识到,“在生物学问题里,不能再为了做出漂亮的算法而只关注简化后的数学问题,必须直面所有真实的生物数据。”

如今,姜涛仍对那段经历印象深刻,很大一部分原因是此前他从未脱离老本行,即便是合作一些生物课题,也是将自己定义为一名计算机理论学者。

Karp看出了姜涛的疑虑,临别之际他送给了姜涛一句话,“没有关系,都是科学,不要太关注领域的界限。”

姜涛与Richard Manning Karp教授

重回麦克马斯特大学,姜涛赶上了被誉为“加拿大基因组计划”的CGAT项目(Canadian Genome Analysis and Technology)。该项目计划耗资2200万美元,为期5年,用以资助加拿大学者从人类染色体图谱绘制和小鼠免疫系统基因测序,到社会问题研究的所有项目。

姜涛与李明再续合作,顺利申请到第一批经费,约十几万加元。

姜涛称,“尽管这笔经费并不算多,但提供了认真去做生物信息学的良机。”

不过,加拿大启动基因组计划,只是HGP推动各国参与生命科学大讨论的冰山一角。

自1999年以来,伴随着测序仪的改进和新的用于组装和注释软件的开发,人类基因组测序已在全球数十个主要研究中心全面展开。这也意味着,HGP培育了一种新的科学研究协作文化。

1999年,姜涛去往美国加州大学河滨分校(University of California - Riverside,UCR),任计算机科学与工程系教授。对于这次任职,姜涛一是想认真做生物信息学,二是加强与生物学背景的学者合作。

因此,即使李明已经邀请他去往滑铁卢大学任职,但考虑到河滨分校拥有世界级水平的植物系,姜涛还是选择了后者。

他讲到,“我在工作面试中能感觉到,该校的教授们非常愿意和计算背景的人合作。”首位向姜涛伸出橄榄枝的就是一位植物遗传学大咖——刚上任UCR自然科学与农学院长不久的Michael T. Clegg教授。

Michael T. Clegg教授

Clegg希望在任期内完成一件事:重振正在衰退的统计系,发展新兴学科。

因此,他对生物信息学很感兴趣。姜涛的到来让他看到了希望,两人迅速讨论决定合作研究一些植物基因的遗传机制并全面分析植物基因组中的各种重复序列。

经历了半年的前期准备工作,2000年,两人与当时刚搬到加州大学圣巴巴拉分校的李明合作,成功申请到了NSF-ITR第一批大规模项目。

对他们来说,此举相当有振奋意义。“这个项目不仅是由美国国家科技署发起的支持信息技术优先领域的特殊项目,而且第一批大规模项目的命中率不到1%,结果还是由白宫直接官宣。”

毫无疑问,姜涛也借此打响了在美国任教的第一枪。

“算法是终身兴趣,生信是一生事业”

今年是姜涛在河滨分校任教的第23个年头。这些年里,姜涛发表论文300余篇,是一位名副其实的“多产型学者”,也是一位炙手可热的“合作者”。

2001年,姜涛被第二位合作对象“锁定”,植物病理系的James Borneman教授。

Borneman是一位微生物学家,多年来一直与多个实验室合作,希望了解微生物在病原体和疾病中的作用。

当时他敏锐地注意到,“DNA微芯片技术”正成为各国学术界和工业界研究和开发的热点,尤其在1998年6月29日美国宣布正式启动“基因芯片计划”,联合私人投资机构投入了20亿美元以上的研究经费后,以基因芯片为核心的相关产业迅速在全球崛起。

这对Borneman来说无疑是他从事微生物研究的最佳窗口期。他难掩激动,“这场研究消除了人工培养微生物的环节,将推动我们研究成千上万的微生物。”

所以,对于这场“豪赌”,Borneman必须选对团队。

他注意到,姜涛的丰富算法研究经验将对芯片探针的设计至关重要,加上他在生物信息学中的积累,正是此次项目的最佳合作人选。

在姜涛的帮助下,系里的热衷于算法的同事Marek Chrobak也加入进来。

这是一位波兰学者,早年工作与姜涛在加拿大时从事的计算复杂性分析有不少交集,此次姜涛亲自邀请自然是热情接受,姜涛因此感慨,“我来UCR做起了生物信息学,至少系里有一个人能够理解自己。”

紧接着Della Vedova Gianluca(来自Milan Bicocca University的一位访问学生)、UCR博士生Andres Figueroa的加入,五人团队的人选正式敲定。

James Borneman、姜涛、Marek Chrobak

2001年,以Borenman教授及姜涛为主导开发的OFRG技术(Oligonucleotide Fingerprinting of rRNA Genes),一度成为当时最先进的微生物群体分析手段,可以用来分析植物根部土壤中的微生物群体组成。

时隔多年,姜涛站在更长远的视角上,认为“这次研究在基因研究历史上影响并不大,很快便被大规模测序技术普及所替代”,但值得一提的是,这次研究却奠定了姜涛此后的一个研究主线:利用计算机科学的手段解决实际的生物学问题。

此后,姜涛频繁开展相关领域的合作,其中之一是与同校的分子生物学家Frances M. Sladek合作。

她多年通过实验手段研究核受体的调控机制,于2002年找到姜涛想通过计算方法来扩大研究范围,加快研究进程。因此二人研究发明了一种新型马尔科夫链(当时起名为optimized Markov chains,后被人改称为permutated Markov chains),并建立一个重要核受体(HNF4a)绑定位点当时最大的数据集。


2003年,姜涛(红衣居中)与UCR科研团队

除此之外,姜涛还赶了一个“时髦”。

在RNA-seq技术出现不久之后,基于RNA-Seq数据的转录组组装,即从数百万个短读段中重建所有全长mRNA转录本并确定它们的峰度,成为分子生物学学界的一大挑战。

2010年,姜涛和UCR博士生李炜、清华大学访问学生冯建兴,共同提出了一个通过RNA-seq读段来重建转录组,并估计每个mRNA转录本(isoforms,也叫基因异构体)峰度的算法,称为Isoinfer,属于这方面最早的方法之一。

2011年,姜涛与团队利用数据的稀疏性,对这个算法做了进一步改进,称为Isolasso,并得到了更广泛地应用。这一研究的影响是广泛的、双重的。

首先,由于下一代测序(NGS)技术的快速发展,及其对生命科学和医学的潜在影响,RNA-Seq数据分析在生物信息学中属于时兴主题。

其次,尽管许多RNA-Seq应用程序取得了成功,但在RNA-Seq数据分析中仍然存在不少挑战,其中之一来自RNA-Seq读取中的偏差的理解和处理。

因此,姜涛等人提出的处理RNA-Seq偏差的方法,属于结合了统计学、机器学习和组合算法的技术典范。

2002年夏天,姜涛开始频繁回国访问并到清华担任客座教授,为新世纪初的中国生物信息学事业做出了重要贡献。而他做的第一件事,就是和大学同学钟扬恢复了联系。

实际上,两人自毕业后已经十七年未见。但当年钟扬在复旦大学研究植物多样性及进化并开始对生物信息学发生兴趣。通过同学关系联系上姜涛后两人一拍即合,确定了合作关系,并共同承担了国家基金委第二期“龙星计划”生物信息学在复旦的授课。

2005年,两人首次提出了一个利用基因在基因组上的顺序来分析直系同源基因的一个新方法,解决了同源基因序列极其相似的难题。

2002年,姜涛与钟扬于虹桥机场,2010年钟扬在姜涛所在的UCR实验室。

值得一提的是,2002年徐鹰回国创办了生物信息国际研讨会(IBW),不仅打开了国内外学术交流的通道,更在此次会议中讨论做出决定:“以后每届的IBW会议,都在会议所在地,开会前办五天的龙星计划。”

如此一来,国内生信队伍原本各自为营,但在徐鹰等学者的努力下聚集起来,有力的推动了生物信息学在国内的发展,姜涛在此后的很长时间里,也成为IBW会议的“常备军”。

第三届IBW议特邀代表与部分学生(姜涛在前排左一)

几乎在同一时间,2003年,姚期智在清华计算机系成立了一个“计算机理论讲席教授组”,姜涛成为最早入组的学者之一。

实际上,这正是姚期智在清华开创的特殊教育模式。

为培养中国的计算机精英研究生,姚期智希望吸引海外人学者回国授课,但每位教授回国时间又很有限。

“姚先生想到了当时清华初起的一个好办法,成立一个6-10人讲课团队,每个人讲一两个月的课,加起来就是一整年的课程,保证了对学生培养的连续性。”

 姚期智教授

由此,清华的计算机学科第一次集齐了理论、应用、系统结构和软件四大领域的优秀学者,分别为姜涛、邓小铁(香港城市大学)、堵丁柱(德州大学达拉斯分校)、李明(滑铁卢大学)、蔡进一(威斯康星大学)、尹依群(普林斯顿大学)、滕尚华(波士顿大学)、刘燕虹(纽约大学石溪分校)、Ko Ker-I(纽约大学石溪分校)、邵中(耶鲁大学)。

到2007年,姚期智建立了清华大学理论计算机科学研究中心,扩招研究生,同时组建了第二届讲席教授组20人,其中美国国家科学院院士4名、美国人文科学院院士2名、美国国家工程院院士1名、奈望林纳奖得主2名。

随着各个讲席教授组在清华的成功,自动化系决定成立一个“计算生物学讲席教授组”。通过李衍达院士,张学工教授及美国冷泉港实验室的张奇伟(中科大77级)的努力,这一想法很快得到实现。

2008年5月,清华大学自动化系下的“生物信息学与系统生物学讲席教授组”正式成立,美国南加州大学教授、计算生物学奠基人之一Michael S. Waterman教授受聘为讲席教授组首席科学家,讲席教授组的成员包括姜涛、张奇伟、王永雄、刘军、孙丰珠(博士师从Waterman),陈挺等著名世界级学者。

至此,我国第一个生物信息学与系统生物学研究中心诞生了。

2012年长城上,姜涛(前排左一)与Michael Waterman  (居中白帽者)、张奇伟(带墨镜者)等清华同事以及学生合影

近些年来,姜涛长期在清华大学访问,和多位教授合作培养了六名博士生,研究领域主要集中在算法及机器学习方法在生物信息学领域的应用上,尤其是RNA异构体功能的预测。在与雷峰网的交流中,姜涛极认真地说到,“算法是我的终身兴趣,生物信息学是我一生的事业。因为生信领域有大量数据,包括不同物种的测序数据,是机器学习理想的应用场景。同时,这一领域缺乏基准真相(ground truth或标签),又极具有挑战性。”基于这个想法,姜涛多年来的研究主线从未出现偏差。这是正是很多计算机科学出身的学者极为重视的一点。只不过,姜涛的态度很明确,他是一个依旧谈论“理想”的人。“我希望建立一个像基因功能数据库Gene Ontology (GO)一样的基因异构体功能标注数据库,并得到广泛应用,让基因异构体之间的功能差异得到更多生物学家的重视,使得今后我们每当谈到基因功能时,必想到不同的异构体。”为了这个理想,姜涛还有很长的一段路要走。

未知是最大的动力

有意思的是,这么多年过去,姜涛一直没做两件事,一是管理工作,二是发朋友圈。

这是姜涛刻意为之。他坚持认为,自己的性格不适合做管理工作。早在中科大读书之时,他就已做了取舍:宁可泡在图书馆里找课题做研究,空余时间在足球场上踢出一身汗,也没有考虑去竞争学生会组织工作。

近年来,姜涛的博士生每年稳定在五名以上,高峰时曾经到过十来名,他更不考虑谋个管理职位,而是省出时间多和学生一对一交流。

“你能想象,如果和每个学生每周都深聊的话,还是非常忙的。”

至于朋友圈,他谈到,“作为一位理论研究工作者,我写作的速度跟思考的速度远远不匹配,所以发朋友圈对我来讲跟写论文一样,是件大事,需要认真计划。”

但这样一位学者,却对社会学、心理学很感兴趣,总觉得自己的科研和兴趣爱好终究会联系在一起。

“当年出国时基本上对美国社会一无所知,很长时间是通过看美剧来了解美国的家庭及朋友圈文化。

但在美国生活了这么多年,孩子们长大以后却告诉我电视剧所描述的与真实生活差别还蛮大的。”

在对生活和研究上,姜涛的态度都是一样,未知是最大的动力。

作者注:

1993年,中国参与人类基因组计划,生物信息学科迎来大爆发。在近三十年的时间里,一大批生物、化学、物理、计算等专业的学者,前仆后继加入到学科的产研建设,那是一个灵感迸发、情谊绵长的年代,也是一个走出质疑、迷茫的年代。

目前,雷峰网启动《生物信息学的三十年往事》专题,将陆续推出徐鹰、潘毅、周耀旗、许东、姜涛、张奇伟、唐建等新老学者的人物故事,记录光辉岁月,以照后人之路。

关于生物信息学的更多故事,欢迎与本文作者吴彤交流,微信号:icedaguniang

雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/dEMCmU2p3gosNjSD.html#comments Thu, 20 Apr 2023 10:43:00 +0800
生物制药亟需一场「工具革命」,一站式AI药物发现平台迎来「赛点」时刻 //m.drvow.com/category/healthai/FZqXUZFabeYJy34e.html 过去的一周,是人工智能最为火热的一周。

继GPT4.0发布后,百度发布了文心一言,微软发布了Copilot,同一天Google发布了对标ChatGPT的Bard,而英伟达则发布了新的GPU H100,相对上一代产品,训练性能和预测性能都有数倍到数十倍提高。

人工智能领域风起云涌,而创新药研发领域也迎来了改变。

2023年3月24日,新药研发领域的人工智能基础设施和服务提供商碳硅智慧宣布,公司自主研发的AI驱动的新药研发平台——DrugFlow1.0正式发布。

据悉,DrugFlow努力打造覆盖药物研发完整流程的软件平台,基于自动化硬件产生的数据迭代模型,并将专家融合到流程中,最终形成数据驱动人机协同的统一设计平台,显著提高药物研发的确定性。

来自浙江大学、北京大学、华东理工大学、四川大学、中南大学、中科院上海药物所、医科院药物所、广州国家实验室、罗氏中国研发中心、石药集团、和誉生物、华深智药等相关领域的知名学者和企业界专家出席了会议。会议采用了新颖的虚拟直播形式,会议期间浏览人次近万。

AI驱动的新药研发SaaS平台--DrugFlow1.0正式发布

杨波

发布会开场,由浙江大学科学技术研究院院长、浙江大学智能创新药物研究院常务副院长杨波教授做开场致词。

她谈到,浙江大学智能创新药物研究院正是希望培养一批智能新药创制领域的优秀人才,助推我国原创药物的研发。侯廷军教授本身是研究院的教授,也是计算化学领域的专家,而碳硅智慧CEO邓亚峰是AI领域的专家,二位都深耕行业多年。本次发布的DrugFlow1.0,一方面是两位专家及碳硅智慧团队的智慧结晶,另一方面也正是响应了国家开发自主知识产权基础软件的号召,希望未来DrugFlow能真正助力我国的新药研发工作。

邓亚峰

接着,碳硅智慧CEO邓亚峰进行了《突破 AIDD 核心技术,做创新药领域的赋能者》的主题演讲。

他的演讲内容分为五块:新药研发领域面临的挑战和痛点、中国新药研发的巨大市场、AI的蓬勃发展以及与物理驱动方法的异同、碳硅智慧成立的初衷和愿景,以及DrugFlow产品的功能和特色。

邓亚峰详细介绍了DrugFlow背后的核心技术,并就关键技术指标与领域已有产品进行了详细比较。

据悉,DrugFlow涵盖靶标发现,苗头化合物发现和先导化合物优化等环节,集成了世界领先的靶标发现、活性预测、成药性预测、分子生成优化、虚拟筛选、AI建模等模块,帮助药化专家更高效便捷地找到潜在成药分子。

DrugFlow努力打造覆盖药物研发完整流程的软件平台,具有“准确性高、原创可靠、易用性好、安全灵活”四大优势。其基于自动化硬件产生的数据迭代模型,并将专家融合到流程中,最终形成数据驱动人机协同的统一设计平台,必将显著提高药物研发的确定性。

此次发布的DrugFlow1.0版本,主要发布了活性预测、成药性预测、分子生成、AI建模四大功能。

在活性预测上,DrugFlow1.0包含重打分和对接两个主要功能。

一方面,DrugFlow基于物理对接构象,提供了当前领域最优的重打分函数RTMScore,能显著提高虚拟筛选能力,帮助用户更好地选择分子。

另一方面,Inno-Docking模块在集成物理对接模块AutoDock Vina的基础上,又集成了自研的AI 对接程序CarsiDock。CarsiDock完全基于AI建模,并且考虑了构象合理性,是一种全新方法。在公开的主流评测上,CarsiDock在预测误差RMSD小于等于2Å的条件下,第一次将准确率提高到90%以上,达到了91.2%。在RMSD小于等于1Å条件下,CarsiDock比物理方法和其他AI方法成功率高出26%。此外,DrugFlow1.0还提供了完整的蛋白预处理、配体预处理、自动智能化设置对接参数能力。

在成药性预测上,DrugFlow1.0提供了Inno-ADMET模块。

该模块支持17种物化性质、5种药化性质、21种成药性参数、27种毒性性质的系统性评价。目前该模块提供两种自主知识产权算法,一种是基于多图神经网络的MGA方法,不仅可以输出ADMET预测性质,还提供了性质与子结构关系的可解释性,另外一种是基于预训练Transformer的MERT方法,具有更高的预测准确率。总的来说,Inno-ADMET模块具有“预测终点多且准确率高”、“速度快”、“可解释性”的优点。

在分子生成上,DrugFlow1.0既支持基于活性配体的分子生成方式(Ligand-based),也支持基于蛋白口袋结构的分子生成方式(Pocket-based)。

一方面,Ligand-Based的分子生成方法是基于活性配体进行分子生成的全新药物设计方法,提供了MCMG和RELATION两种算法。其中MCMG是一种基于配体的多约束分子生成方法,通过知识蒸馏结合条件变换器和基于QSAR的强化学习算法来满足多约束条件,可生成具有所需理化和药理学特性的新分子。而RELATION则是基于蛋白口袋-配体复合物3D生成和双向迁移学习结合的分子生成方法,能够生成大量结构有效并且对蛋白具有一定亲和力的化合物。

另一方面,Pocket-based的分子生成方法只需要提供蛋白蛋白口袋结构,比如这次发布的ResGen算法。它是一种基于蛋白口袋的3D分子生成算法,通过自回归模型和多尺度建模技术,在保证生成分子多样性的同时,生成具有较好结合亲和力、且具有合理蛋白-配体结合姿势的分子。该方法不仅适用于药物从头设计,还支持基于片段的分子生成。

在AI建模上,DrugFlow1.0针对用户希望基于自有数据进行AI建模的需求,提供了AI Modelling模块。

该模块提供数据预处理、数据批分、计算描述符定义、机器学习算法建模等功能,用户只需在网页输入数据、做好参数设置,就可以建立自有的AI模型。为了提高建模效果,系统还采用了AutoML做参数和模型选择,并支持Transformer和GNN预训练技术,相比传统机器学习算法,可显著提高模型精度。此外,在结果页面,AI Modelling还提供了完整的模型评估指标,并对模型表现作出相应解释。

除了以上模块外,DrugFlow1.0还提供了一些易用小工具,比如AI解核磁谱工具——NMR Parsing。

它为药化专家合成工作中最常见的解谱场景量身打造,基于CReSS和CMGNet两种AI检索和生成算法来解析未知化合物的结构,用户只需要输入碳谱的化学位移值,就可以快速解析分子结构,大大提高解谱效率。

邓亚峰表示,DrugFlow1.0产品不仅在分子生成、AI自动化建模等功能上独具一格,而且在对接和重打分以及成药性预测等传统功能上,具有世界领先的技术能力。成立仅半年多,团队就在Nature Communication、核酸研究以及药物化学期刊等领域顶级刊物上发表了十多篇文章,证明了团队的技术实力。

随后,邓亚峰就AIDD的技术发展和公司规划作出展望。

他表示,目前在新药研发领域踏踏实实做自主知识产权国产化软件的团队并不多,碳硅智慧团队既具有这样的实力,也具有强烈的使命感。

“碳硅智慧愿做创新药研发领域的赋能者,在推出药物发现SaaS平台DrugFlow的同时,基于最先进的AIDD技术和自动化解决方案,愿与战略合作伙伴一起携手针对重点管线进行合作研发。”据悉,目前碳硅智慧已在小分子、AAV设计等领域达成重要战略合作。

最后,邓亚峰表示,我们已经看到了AI在分子生成、对接、重打分等方面的突破,随着预训练模型、AIGC、强化学习等新AI技术在领域的落地,未来AIDD技术的演进会更快。今天DrugFlow的发布,仅仅是一个开始,我们未来一定会迎来一个AI驱动的生命科学时代。

何浩

在产品发布之后,碳硅智慧商务拓展副总裁何浩介绍了“星火行动。

DrugFlow 高校支持计划”,该计划针对现有软件使用成本高、不易用、不适合教学等问题,旨在为高校老师同学提供技术先进、易用且优惠的国产AIDD软件,且贴心地支持教学场景,希望以此推动AIDD软件在高校的普及,为中国培养更多AIDD人才。

目前,已有北京大学、浙江大学、四川大学、中山大学、吉林大学、南开大学、暨南大学、中国药科大学、澳门科技大学、中科院深圳先进技术研究院、广州国家实验室等十余所知名院校加入了星火行动,并给予了积极评价。

在发布会的最后,进行了战略合作伙伴签约仪式。

由碳硅智慧CEO邓亚峰和石药集团上海翊石医药科技有限公司总经理宋云龙进行了战略合作签约。

在签约仪式上,宋云龙总经理表示:上海翊石作为石药集团全资子公司,一直致力于小分子创新药的研发,碳硅智慧团队在AIDD领域具有深厚积累,DrugFlow产品技术领先,此次和碳硅智慧合作,希望能充分发挥双方优势,尤其是DrugFlow1.0在早期分子设计上的优势,期待合作成果早日落地。

AI如何驱动药物研发?

发布会后,AI驱动新药研发进展与挑战研讨会正式举行。

侯廷军

浙江大学药学院教授,碳硅智慧首席科学家侯廷军,以《基于 Al 的药物发现:机遇与挑战》为题做了分享。

侯廷军认为,当下创新药物发现亟待变革性新模式,创新药物研发周期长、投入高、风险大且源头创新不足,缺乏先导结构发现的关键技术等问题。

而AI技术已经应用于药物研发的多个环节,人工智能技术推动了CADD方法的发展。深度学习模型的出现,加之硬件和数据的进步,使得训练能建模复杂非线性问题的模型成为可能。

此外,侯廷军还认为AI制药面临三大挑战,

挑战一: 新一代AI技术对性质预测并未表现压倒性的优势,要如何有效提升基于AI的性质预测方法的预测能力?

挑战二: 基于AI的打分函数在虚拟筛选中表现不佳 ,如何有效提升基于AI的打分函数在虚拟筛选中的预测能力?

挑战三: 关键成药性参数和毒性终点预测精度较低,如何有效提升关键成药性参数和毒性终点的预测精度?

唐赟

随后,华东理工大学药学院唐赟教授,以《基于网络的虚拟筛选方法》为题做了分享。

唐教授认为,传统的基于结构虚拟筛选和基于配体虚拟筛选方法,过去20多年来在先导化合物发现方面已有许多成功的应用。但是这些方法也有一些局限性,而目前大概只有八分之一的靶标具有已知的三维结构,使得基于结构的虚拟筛选方法对大部分靶标还无法应用;为了对那些没有三维结构的靶标也能使用虚拟筛选方法进行药物发现,必须发展新的方法。

发展基于网络的虚拟筛选方法,不需要已知靶标的三维结构和负样本,从而大大扩展了可进行虚拟筛选的靶标数量。

刘振明

北京大学药学院刘振明教授,关于《创新药的新机-新技术驱动的候选药物研发》,分享了他的看法。

刘教授看来,AIDD/CADD是生物医药研究的世界潮流和发展趋势,如何应对和破解创新药研发的困境,在我们的对外合作过程中,已经很高兴的看到中国的一些创新药企业开始关注前端研发,愿意和中国的高等院校一起去做这些之前认为价值低的事情。

AIDD的最终目标是品种交付,刘振明教授认为,更为明智的选择是遵循和赋能候选药物的发现流程,在某几个环节去提升新药研发的效率。

研讨会进入尾声,一场主题为《AIDD 的未来和挑战》的圆桌论坛顺利进行。

圆桌论坛由碳硅智慧首席运营官施慧主持,浙江大学药学院教授,碳硅智慧合伙人谢昌谕、广州国家实验室研究员陈红明、四川大学杨胜勇教授、中国科学院上海药物研究所郑明月教授、中南大学药学院教授,碳硅智慧首席算法科学家曹东升、中国医学科学院药物研究所汪小涧教授、上海和誉生物医药科技有限公司联合创始人,生物学SVP陈椎、罗氏中国创新中心AIDD负责人林翼共同参与讨论。后续,雷峰网&《医健AI掘金志》将推出详细报道。

雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/FZqXUZFabeYJy34e.html#comments Mon, 27 Mar 2023 19:41:00 +0800
GAIR Live | CASP 15冠军大论道:AlphaFold2「扫荡群雄」之后,结构预测还有路可走吗?(下篇) //m.drvow.com/category/healthai/aN4Vs08IfhMOZKcE.html 在蛋白质-小分子复合体预测方面,“药物设计和酶设计”等领域的项目未来是否加速落地? 当下火热的AIGC技术,能为AI生命科学领域带来多少可能?

在CASP比赛创建者John Moult教授看来,这一比赛从来不是闭门造车,或是学术界的圈地自嗨。

2018年,在第13届CASP比赛中,一个顶着谷歌子公司帽子的参赛选手亮相,其AlphaFold系统以最高的预测准确率击败其他参赛队伍。

2020年,在第14届CASP比赛中,这一公司再次卷入竞技场,凭借AlphaFold二代系统以绝对的优势大获全胜,并在次年将技术成果全部发表于《Nature》和《Science》等顶级期刊。

这便是如今的AI殿堂级公司--DeepMind。

从那以后,人们首次将“人工智能”和“蛋白质结构预测”两个毫不相关的领域联系在一起。而DeepMind背后的谷歌,也凭借CASP大赛织造了一张梦寐以求的医疗商业蓝图。

从业内人士的角度,这或许是意料之中。正如John Moult教授创立CASP比赛的初心,便是希望以此推动计算生物学研究,加速理解细胞构建原理和推进药物发现,最终惠及全人类。

显然,DeepMind已经蹚出了一条可参照的发展路径。

不久前,CASP 15落下帷幕,尽管本届比赛中未见DeepMind身影,但诸多华人团队参赛热情高涨,在蛋白质单体/多体结构预测、蛋白质-蛋白质复合体结构预测、RNA结构预测、蛋白质-小分子配体复合物结构预测等多赛道上夺得桂冠。

不少参赛选手直言,“这是‘后AlphaFold2时代’的首届大型同台竞技,所有选手都获得了业内前所未有的关注。”

在AlphaFold2的冲击之下,蛋白质结构预测是否还能为人们带来新的惊喜?

本届首次新增蛋白质-小分子复合体预测和RNA结构预测两大赛道,是否意味着蛋白质结构预测不再稳占“C位”?

RNA结构预测领域是否会出现如AlphaFold2一般引发革命的技术工具?

从基础研究到应用研究,人们不断讨论着在CASP 15背后行业发展的诸多可能。

近日,由雷峰网GAIR Live&《医健AI掘金志》举办的《生物计算“奥赛”冠军团队论道:当生命科学遇上史诗级AI,何去何从?》线上圆桌论坛落幕。


本次论坛邀请了多位在CASP 15中取得出色成绩的参赛者,由上海智峪生科CEO王晟担任主持,江苏理工学院生物信息与医药工程研究所教授常珊、密歇根大学计算医学和生物信息学系博士后研究员郑伟、浙江工业大学信息工程学院教授张贵军、上海智峪生科技CTO熊鹏参与讨论。

在上篇中,几位嘉宾共同分享了在CASP 15中的参赛经历,以及在AlphaFold2冲击下,蛋白质结构预测赛道该何去何从。

在下篇中,将聚焦本届两大新增赛道:蛋白质-小分子复合体预测和RNA结构预测在应用层面的潜力,探讨当下火热的AIGC技术在AI生命科学领域的可能性。

“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网与中国计算机学会(CCF)合作创立的CCF-GAIR大会,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。

经过几年发展,GAIR大会已成为行业标杆,是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。

GAIR Live作为雷峰网旗下视频直播品牌,旨在输出新鲜、深度、原创的大咖访谈与对话内容,打造辐射产、学、研、投的特色线上平台。

以下是主题论坛的现场内容,雷峰网《医健AI掘金志》做了不改变原意的编辑和整理:

蛋白质-小分子复合体预测赛道的落地之问

王晟:在蛋白质-小分子复合体预测方面,“药物设计和酶设计”等领域的项目未来是否加速落地?  

常珊:其实不完全是蛋白质和小分子,刚刚我们探讨的有两个target,受体是RNA。当然我们做算法开发时,会偏向以蛋白质作为受体的蛋白质-小分子的相互作用预测。

但在去年江苏生物信息学专委会上,有学者对靶向RNA的配体小分子设计,以及相应的药物筛选表现出兴趣,给我们很大启发。因此,当CASP15上有这样的题目时,我们就有很大的动力去研究靶向其他受体的小分子算法开发。

而且郑伟博士说得很有道理,如果先靶向RNA,是不是比靶向后续它表达出来蛋白质更有效一些?这也是一个很好的思路。所以我觉得这一块的确值得我们去深入研究相应的算法。我感觉这样的一些工具,相对于蛋白和小分子的预测的工具来说,应该更少一些。印象中,我师兄华中科技大学黄胜友教授团队做了一个类似程序。

在本次CASP15的蛋白质-小分子的赛道设置上,组委会出了大概20多个题目,非常多,但有些场景我感觉跟药物设计不是特别匹配。

比如其中一个题目是,“有一个受体,这个受体有很多结合的小分子,有56个配体, 请预测所有小分子的结合位置。”一般的药物开发体系很少需要预测这么多配体分子。

因为我们平时和制药公司合作比较多,经常合作做一些药物方面的设计和开发,制药公司并不关心你能找出多少小分子,它们真正关心的是,不管你是自己生成,还是从数据库里筛选,只要能够找出一个抑制蛋白质的最合适的小分子就可以。

不过有人在CASP15交流会上透露,可能下一届就会有小分子的筛选问题--从众多小分子中筛选出最合适的配体。这也是目前制药公司都很关心的问题,因此我们现在还要继续完善方法,从而更针对于制药过程中的关键问题。

值得一提的是,自从我们在CASP15比赛上获得了蛋白质-小分子赛道第一名后,能明显感觉到合作企业和科研机构变多了。另外我们也和江苏本地的普美瑞生物科技公司合作开发了一些抑制剂,或PROTAC(Proteolysis-Targeting Chimeras,即蛋白水解靶向嵌合体)分子。目前一些实验结果都非常出乎意料,刚刚筛选出来的配体降解能力就达到了皮摩尔(pM)级的水平,这意味着不需要进行多轮优化就可以去做后续实验。

王晟:常老师说得非常对,CASP比赛中有一个pose(构象)的问题。简单来说,就是给你一个蛋白质,一个小分子,要把它建模到正确的口袋里面且形成合理的相互作用,查看和“标准答案”复合物之间是不是足够得近。

刚才说的 ranking问题,其实包括两层含义,一是构象预测/排序问题-找出最好构象的过程需要产生很多构象然后排序打分-即CASP15关系的复合体结构问题,二是不同分子的排序-即screening问题。在CASP蛋白质预测中,分成了 3D预测和QA预测,小分子结构预测中我个人理解上将二者融合起来一切称为1-构象预测/排序问题。

而制药公司也很关心的是screening问题。就是在众多的小分子中,比如从几千个,几万个,甚至几百万个,几亿个小分子中,筛选出一个或者几个抑制蛋白质活性的小分子。

实际上,我认为这几个问题的底层逻辑是相通的。如果我们能够把Pose问题或者docking、结合位置都做得准确,构象RMSD做到很小,同时能量也计算正确,那么对工业界关心的screening问题,也一定会有很好的推动作用的。张贵军老师对于蛋白-小分子,或者叫做大分子和小分子的对接,复合物建模应用有哪些看法?

张贵军:我们课题组主要做蛋白结构预测的研究,复合物方面研究工作刚刚开始,这也是今后需要努力的一个方向。

实际上,无论是大分子,还是小分子,和靶标蛋白来形成相互作用,最终形成一个复合物,其中一个有效的方法是通过开发打分函数,评估小分子或大分子在口袋里面的舒适度。此外,还有一种比较可靠的方式,即搜索模板,并基于模板信息做比对建模。

小分子这块我不太了解,但是从大分子-大分子相互作用的结果来看,我们可能需要一种新方式。因为它本来就是一体,如果单独对它建模,再进行刚性、柔性对接,这一定不符合实际的生命过程。所以fold和dock的过程应用同步进行。最近我看到有Arne Elofsson课题组的一个工作就是按照上述思想开展工作,精度提升非常高,受此启发,我们课题组也在开展相应工作,我相信未来在蛋白质结构预测、复合物组装方向的下游应用会进展迅速。

王晟:张贵军老师讲了一个非常有意思的点,就是在实际的生物体当中,不管是大分子-小分子,还是大分子-大分子,它们在生命体中的相互作用,并不像传统的计算模拟--先把两个分子的结构搞出来,再把它们对接到一起,而是类似于“共折叠”(co-folding)的模式。

过去的Autodock Vina是怎么做的?蛋白质保持可以刚体模式也可以让口袋去区域保持柔性,建模时候小分子可以和蛋白质侧链一起按照能量下降以及蒙特卡洛方式去调整位置。因此,小分子和口袋区域蛋白质侧链具有一定的自由度,但蛋白质至少在主链上是没有什么自由度的。

但真实情况下确实是这样吗?并非如此,为什么?

诱导契合学说(induced- fit hypothesis)谈到,在对接过程中,不仅小分子自身改变pose(构象),结合空腔中的氨基酸残基位置也会改变,有时候可能会导致蛋白质loop区域的位移,即配体和受体双向奔赴的过程。

所以,我们现在能不能用一种更好的建模方式,同时把这两种分子作用在一起?

实际上,AlphaFold2-Multimer(专长于蛋白复合物特别是结合界面结构预测的模型)已经初步尝试co-folding的方式,效果非常好。

那么类似的理念用到蛋白质-小分子的相互作用上,会不会也有奇效?答案是肯定的。

我们这次参赛的方法就是利用了类似理念。把AlphaFold2的这套方法,在蛋白序列后面再加上小分子frame,通过frame再构造成一个整体相互作用的模拟。我认为,未来这条路径一定大家都选择的方向,因为它更加偏向真实的物理过程。

郑伟:在蛋白质-小分子的binding问题上,早些年CASP其实一直在关注这个问题。在CASP10之前一直有一个赛道---蛋白质功能预测(protein function prediction),用于预测蛋白质ligand binding site。当然它没有特异性,只让你预测蛋白质的哪个位点可以绑定小分子,选手只要给出该预测信息即可。

但在CASP11之后,这条赛道就一直被取消,直到本届CASP15又重新设置基于Pose的蛋白质-小分子结构预测赛道。

因此,我觉得蛋白质-小分子赛道重新提上日程,而且是以更加精细的预测项目出现,一个重要原因是蛋白质单体或者蛋白质复合物的结构预测精度已经非常高。

我们有了蛋白质结构、小分子的具体的binding位点,binding pose、以及具体的小分子信息之后,你可以预测工作就更多了。整体来看, CASP的赛道设置不是特别割裂,每条赛道之间都相互促进。
另外,我非常同意王晟师兄的意见。我们确实应该系统考虑蛋白质-小分子的折叠问题,而不是先折叠蛋白质,再让小分子“打配合”。

实际上,PDB数据库中解析的真实实验结构,很多蛋白质可以配合小分子,也可以不配合小分子;甚至一些蛋白质和小分子配体后,但它的侧链结构,甚至主链结构都会发生小范围的变构。

所以蛋白质本身在折叠过程中,或者和小分子配体去做联合折叠时,它不应该是一个彼此割裂,或者“先有鸡还是先有蛋”的问题,它肯定是一个联合发展的折叠问题。

因此,如果我们利用类似于共进化信息,控制蛋白质-小分子的体系,是更有预测优势的。当然,具体怎么构建这种蛋白质和-小分子共进化,可能比较难。

因为即使在结构预测领域,共进化也不是百分之百都解决透了的。而且在蛋白质复合物里面,共进化要比单体更难。所以推广在蛋白质-小分子问题上,我们怎么设计共进化,或者是怎么发现潜在的共进化就更难了。具体的药物落地这一方面,我研究得不是特别多,张贵军、常珊两位老师已经总结得很好。

熊鹏:关于蛋白质-小分子的相互作用,我研究比较少,也就不发表太多的评论。我主要跟大家谈一谈RNA-小分子结合的问题。

RNA结构和蛋白质结构有很大差别,因为蛋白质的最小折叠单元是domain,每个domain有一个疏水折叠核心(hydrophobic folding core),那些小分子结合的口袋,都是位于domain内部或者domain之间的空腔,预测蛋白质和小分子的结合,需要先预测蛋白质的整体结构。

但RNA所有的基团都是极性基团,在折叠过程中并没有类似的疏水核心。所以RNA的最小折叠单元并不是domain,而是motif(少数碱基形成的结构模块),由motif组装后形成RNA的三维结构以及小分子接口。

CASP15上有好几个target,都涉及RNA和小分子的相互作用。但这些相互作用并不牵涉到整个RNA结构,只是牵涉了其中一些motif。比如R1117 target,就是小分子结合到差不多十来个碱基左右的motif口袋中;还有一个是人工设计RNA,其来源也是将一个结合小分子的天然motif,拼接到人工设计的框架上。

也就是说,对于和RNA结合的小分子而言,它与RNA的结合并不牵扯到RNA的整体三维结构,而只是作用于结构中的特殊motif。因此,如果我们要针对RNA的小分子做药物设计,问题的关键并非RNA的整体形状预测,而是RNA内部功能motif的预测。

这也是我之前一直非常强调的问题。可能我们并不需要过度关注RNA的端对端预测、overall fold预测,如果能够把RNA的一些关键结构的motif预测好,那么对于理解RNA的功能,比如说如何结合小分子就已经足够了。

王晟:熊老师讲了一个非常深刻的观点。因为我们知道RNA结构中,很多地方它是飘在那里的,类似于蛋白质里的intrinsically disordered regions (IDR) 。

熊鹏老师希望我们抓住问题的本质,也就是说,RNA跟蛋白质是类似的,都有一些motif组成的区域,只不过相对来说,蛋白质的这种刚性区域多一些,IDP相对少一点;RNA的非刚性区域可能会更多,但如果RNA要和小分子等结合形成结构,一定会有motif的存在,把它们给咬合在一起。

因此,从RNA的这点特性出发,对于我们理解RNA功能,如何设计把靶标于RNA的小分子抑制剂都至关重要,而且对于我们今后如何去预测RNA结构也提供了全新思路。

ChatGPT在生命科学领域的前景如何

王晟:再谈一下时下最火热的话题——ChatGPT。这段时间,以ChatGPT为代表的AIGC概念相当火爆。不少生物计算实验室也拿出了一些成果。 能否站在您的角度,谈谈AIGC在AI生命科学领域的应用前景?

常珊:ChatGPT的放在生命科学领域来说再合适不过了。因为我们去表述生命科学中的一些分子,不管是核酸、蛋白还是小分子,都是以类似于语言“序列”的方式去表示,比如DNA 序列,蛋白序列、小分子SMILES。所以我觉得ChatGPT背后的语言模型天然适合生命科学研究,生命科学研究者也要尽快训练大型语言模型理解蛋白质、分子、DNA和RNA。

刚才王晟提到几个程序,我之前看过文献,但没有深入地去看这方面的算法细节,但GPT和ChatGPT出来后,我发现它的算法可以直接用在生物上,但是我们也要注意两个潜在问题。

一、数据。

ChatGPT在训练过程中,数据有很多,而且处理得比较干净。但对于生物学数据来说,哪怕在PDB数据库中的数据也可能有错误,而且这些错误数据可能没法通过简单方式做清洗。只有通过大量的实验才能做精确筛选。因此,在当前的生物学数据现状之下,训练完成的算法/模型都会有一些影响。

二、模型公开试用加大负反馈风险。

模型如何做验证,最常用的方法就是开放做公开试用。对于ChatGPT这种通用型模型来讲,大家会担心广泛且公开的试用,如果反馈学习可能会把模型“教坏”。但对生物学模型来说,判断一个模型好坏还是需要一些实验的方法,但是反馈可能会慢一些,导致模型迭代优化的速度会相对缓慢。

我们最近也用语言模型做了一个抗菌肽的序列设计,核磁解析的结构发现和设计一致,所以我觉得语言模型天然具有优势,只是在数据、模型后续迭代上需要进一步完善。

张贵军:分享几点。

一、AIGC等生成式AI技术现在确实非常火,我们已经看到ChatGPT技术、扩散模型等技术在小分子三维构象、蛋白质复合物预测等生命科学领域的潜力,未来可能会引领下一场变革。

三年前,我对人工智能的态度是,这个技术是生物信息研究中的一个必要条件,但不是充分条件,不是我们做什么都要用人工智能。但经过几年发展,我的想法也在不断改变。因为人工智能可以建立了强大的能量模型拟合函数,甚至包含上千亿个参数的大模型。在这种基于数据的模型表达下,或许AI真的能够充分表征生命系统。

刚才大家讲到的生命系统,有蛋白质、核酸等发分子表达,这些都可以想象成是通过 “生命语言”来进行调控。蛋白质序列本质上类似于自然语言:氨基酸以多种组合排列形成具有功能的结构,就像字母构成单词、单词形成句子所具有的含义一样。因此,在自然语言处理(NLP)技术应用到蛋白质结构建模问题也就不足为奇。

但人工智能进行蛋白质研究时,我们应该如何规避潜在问题?

一、围绕蛋白质做系统性研究。

人类基因组编码的蛋白质数量不少于20万个,但目前已知的只有2万多个,但由于可变剪切机制,同一个基因可以表达成多个不同的蛋白质,这2万多个人类基因究竟能编码多少个蛋白质目前仍是个谜。但可以确定的是,其余大部分蛋白质编码基因都在做调控。因此,未来需要进一步协同考虑蛋白质跟小分子、DNA、 以及RNA等相互作用,从而进行相关设计。

二、从生命本质出发研究问题。
用AI研究生命系统,实际上是人工智能模拟生命系统。因此,回到最本质的问题上,什么是智能?生命能够被完全模拟吗?

实际上,现在进行的蛋白质结构预测和设计,以及RNA研究、复合体研究等,它们即便能够通过语义、语法与规则被表达出来,但它们如何形成“生命”?事实上,蛋白质本身是没有生命的,通过蛋白质之间的互作以及细胞之间的协作,最终才形成生命活动,这是需要思考的一个方面。

就预测而言,现有挑战在于揭示蛋白质的折叠机理和活体状态的多态问题。目前AI模型拟合出来的还是一个静态的蛋白质结构;

就设计而言,脱离实验室条件,人工设计的蛋白质安全性、稳定性、耐药性(人工设计蛋白进入体内,白细胞可能会把它当成一个病毒来处理,马上产生抗体,蛋白质就可能会失效)如何都不得而知,而能否适合工业生产又有很多不确定性。

因此,回到问题的源头,为什么人是有生命的?因为人体存在一系列的群体连锁反应,最后组成了一个复杂的、拥有智能和意识的生命体。

在前不久的第11届全国生物信息学会议上,来自军事医学院的李昊称,“最近的模型可解释性方法将使我们能够打开“黑匣子”,从而增强对折叠原理的理解。”足以看出生成语言模型在设计功能序列方面的巨大潜力。

目前我们课题组也在不断深入研究,从最初采样到现在的能量模型,接下来我们就考虑蛋白质整体结构预测、多域、复合物模型,以及相应的模型质量评估技术。

郑伟:AI生成内容最近特别火,我也在关注,ChatGPT和stable diffusion都试玩了一下,从AI产生的内容质量来看,确实蛮令人惊叹。 

具体地,AIGC在生命科学领域,或者在结构生物学、计算结构生物学领域都有什么应用。我个人认为,AIGC非常适合用在蛋白质设计和蛋白质结构预测。实际上,目前这一领域已经开始尝试算法应用,比如PLM(protein language model )方法。

它是利用机器学习去学习隐式的蛋白质进化的语言信息,类似于隐式的MSA信息,从而用学习到的蛋白质语言信息来替代传统的MSA。

总体来说,这一技术的前景很好。但是目前来看,我们训练出来的PLM模型,以及一些大公司放出来的PLM,结果不太令人满意,在CASP15中分数不高。

当然我个人觉得排名低不影响算法前景,目前分数不高可能是因为现在大家都在拼算力,以及大家刚开始描述MSA或者使用蛋白质语言,还在摸索阶段。

熊鹏:前面几位老师都分享了语言模型在蛋白质结构预测、蛋白质设计方面的应用,我就从另外一个角度聊一聊对ChatGPT的看法。

现在生命科学学术圈的每年论文增幅约几十万篇,我们逐篇地阅读起来肯定是不充分的。因此我一直希望能有一个AI机器人,或者学术辅助工具,帮我了解一个新领域、帮我看文献,给我一种学术指导。所以ChatGPT出来后,我很希望它能够实现这一目标。

但据一些老师的测试结果,目前ChatGPT还没有很好地实现学术辅助的功能。比如你问他一些专业的问题,它可能会给你列出一堆参考文献,但是你仔细去翻看那些参考文献,发现都是ChatGPT基于语言模型虚构出来的论文。格式都对,看上去很专业,但实际上什么都不是,纯碎是瞎编乱造的内容。

所以,如果要重新开发一个对我们做学术有帮助的AI机器人,可能需要重新训练一套新的模型。它既需要帮助我们去阅读文献、理解文献、总结文献、帮我们快速进入一个新领域,也帮我们做一些学术交叉的研究。
我相信在不远的将来,这个目标肯定能够成为现实。

公众提问

Q:请问常珊教授:今年您带队参加的蛋白质- ligand复合体结构预测,这一技术在合成生物学,尤其是小分子多肽和蛋白质受体作用的预测上,有没有投入实用的可能性?

常珊:这是完全有可能的。

尽管和蛋白质结构预测相比,序列生成相对落后一点,但是目前Meta(Facebook)、Baker等几个团队都发表了很多论文,涵盖多肽设计、小蛋白设计、单体蛋白设计等。其中Meta(Facebook)最近测试了30多个蛋白,效果都不错,所以我觉得这一块落地的可能性还是很大的。合成生物学对蛋白质序列设计非常重视,所以我觉得能够设计出更好的蛋白质,一定会有助于合成生物学的发展。

Q:请问张贵军教授,您带队获准确性赛道复合物接触残基精度评估第一名,会带来哪些实用性成果?

张贵军:第一,模型的实用性,对后续的药物研发等过程非常重要,因为药物研发通常要花费十几亿美元,耗费十几年的时间,最终可能仅有10%的成功率。因此,如果预测模型并不精准,下游的环节都会有问题。

第二,蛋白质结构预测是一个不断优化的问题,因此我们要采用不同的方法去做精修,比如建立一个力场,去模拟蛋白质折叠过程,不仅要找到得分为90分的蛋白质模型,还需要找到 20 分的, 30 分的、40分、50~90等中低段模型。

第三,在多态问题上,实际上已经有一些例子,比如抗体设计、抗原设计。但我们发现一个有意思的现象,预测的pDockQ可能在90分以上,但与实验测定情况相差较多;有些实验分数非常高,但预测的pDockQ却在0. 23以下。这可能都是因为预测和实际结构多态现象所导致的原因之一,这也是我们将来非常重要的研究方向之一。

Q:请问郑伟博士:您在多条赛道上获第一名。有蛋白质单体单结构域、蛋白质单体多结构域、蛋白质复合体结构预测类别等赛项。后续的技术转化有哪些?团队都有哪些产学研合作?

郑伟:首先,药物研发的靶点很多都是蛋白质,所以蛋白质结构预测得好,无疑对药物研发来说是一个基础保障。

其次,今年的蛋白质-复合体的预测精度有明显提升,一定会在制药领域有一定应用前景。因为有些药物不光仅是 RNA药物,或者小分子药物,可能也是一些蛋白类药物。比如医药领域有一些抗体类药物,其实也是比较依赖于蛋白质-复合体结构预测这一基础问题。

CASP15上公布了antibody-antigen的复合体,也公布了nanobody-antigen的复合体,有些课题组在某些target上做得不错,我们课题组在大部分的nanobody和antibody上,复合体预测的精度非常高。所以我个人觉得在制药领域,复合体结构预测的落地速度会加快,因为它对抗体类的药物研发作用更直接。

Q:请问熊鹏博士:您对于RNA结构预测的研究进展,未来的落地规划是怎样的?

熊鹏:RNA结构计算在落地方面,相对容易的是通过“计算+实验”的方法做一些功能RNA分子的设计。因为功能RNA分子直接应用场景,比如基因治疗药物、调控元件等。第二是同时用计算+实验的相互迭代的方法,也能够更快地改进我们的方法,改进我们的计算模型。

长远来看,靶向RNA的药物设计是一个重要方向。RNA-小分子的相互作用预测,RNA-蛋白质在细胞内的调控元件的一些相互作用预测,将真正推动在生物医药领域的落地。


]]>
医疗AI //m.drvow.com/category/healthai/aN4Vs08IfhMOZKcE.html#comments Fri, 24 Mar 2023 09:56:00 +0800
北京普惠保增设疾病筛查服务,能否成为高赔付率之外的「留客」新路径? //m.drvow.com/category/healthai/fmRBj9pSi1Gfh25D.html 惠民保的下一程,需要怎样的改革和创新?

2023全国两会期间,这一话题引起了多位代表、委员的关注。复旦大学上海医学院副院长朱同玉在媒体采访中表示,建议推动惠民保产品升级,鼓励研发针对带病体的专属普惠保险产品。

区别于基本医疗保险的社会属性,惠民保作为商业性质的保险,由商业保险机构联合组成共保体,由政府部门指导和监管,参与了多层次医保体系的制度创新。

凭借投保门槛低、保额高、价格亲民等优势,惠民保迅速在全国推广开来,成为居民在基本医疗保险之外最有力的健康保障。

惠民保进入全国推广的四年来,各地政府与惠民保设计者们在政策扶持与产品优化等方面进行了诸多尝试,希望为这一“社商融合”的代表性产品增加更多源动力。

惠民保的“普惠性”能否再进一步?

2020年是惠民保发展的转折点。

2015年,深圳率先上线了一款由平安养老承包的重特大疾病补充医疗险,这是地方政府对“惠民保险”的最初试水。但随后几年中,这一模式并未在全国推广开来。

直到2020年初,全国也仅仅上线了9款惠民保产品,除南京等少数城市加入探索的队伍外,大部分地区仍在观望中。

自2020年3月起,国务院与国家医保局相继出台了相关政策,推动惠民保在全国各省市落地。在政策扶持下,惠民保迅速在全国风靡开来。

截至2020年12月,全国已有15个省份39个城市上线了惠民保产品;截至2022年12月底,全国共有29省、159个地区、289个地级市推出232款惠民保产品,约1.58亿人次参保,保费收入约180亿元。

惠民保产品的探索和发展,在基本医保、传统商业保险当中探索出一条新型普惠商业保险之路,在参与主体、参保人群、保障方式多个维度的创新实现了商业保险参保人群的重大突破。

复旦大学风险管理与保险学系主任、复旦发展研究院中国保险与社会安全研究中心主任、中国保险科技实验室主任许闲曾撰文介绍,惠民保的创新之处主要有三个方面。

首先,惠民保搭建和加深了良好的保险运营生态链,形成了“政府部门+保险公司+第三方平台”较为稳定的三方主体关系。

其次,惠民保产品以“百元价格+百万保障+无限制投保”为特色,更多地放松投保条件,将高年龄、高危职业、既往症群体等传统商业保险不可保的群体纳入保障池。

最后,惠民保产品责任以“住院责任(医保内外)+特药责任(医保内外)+特色保障”为基础。

对于无法在商业险投保的既往症患者,惠民保采取可保折扣赔的方式,将其一同纳入投保人群之中,按照一定比例赔付相关医疗费用,赔付比例低于健康群体,使既往症患者也能在惠民保中受益。

可以说,在基础医疗保险之外,惠民保的普惠性当属最高,但仍旧难以避免地忽略一部分群体:年轻、健康的低风险投保人,这些没有发生医疗行为的群体较难从中获益,一定程度上影响了惠民保的参保率及参保人群结构。

为此,部分省市已经开始探索更符合当前需求的惠民保创新与改革路径。

政府全方位支持,惠及更多投保人

在中再寿险发布的《2022年惠民保可持续发展趋势洞察》报告统计中,浙江惠民保的参保率在众多省市中一骑绝尘。

据浙江省银保监会发布的数据,浙江惠民型商业补充医疗保险2022年已率先实现省域全覆盖,承保2774.8万人,提供风险保障54万亿元,参保率达58.1%,续保率达76.6%,各项指标均居全国首位。

湖南大学保险精算与风险管理研究所发布《“惠民保”产品研究蓝皮书(2022)》中也指出,浙江惠民保中赔付率排名前五的几款产品,赔付率均在90%以上。

这是浙江省在长期摸索中总结出的一套推动惠民保可持续发展的指导方针:“5597指标”,即全省投保人数稳定在基本医疗保险参保人数的50%以上,平均投保年龄低于50周岁,资金赔付率达到90%以上,续保率达到70%以上。

在这套方针的支持下,不论是投保率、续保率还是赔付率,浙江惠民保的成绩都让其他省市望尘莫及,这些成果离不开浙江省政府的强力推动。

2023年全国两会期间,近 10 位全国政协委员联名递交提案《关于加强顶层设计、鼓励医保个账购买,加快发展个人健康险的建议》,鼓励优先使用基本医保个人账户购买个人健康险,从而引导个人健康险扩大覆盖,降低群众自费支出。

而浙江省早已走在全国前列,早在2021年7月开始施行的《浙江省医疗保障条例》中就已明确,职工医保参保人可用个人账户余额为本人和家人购买惠民保。

浙江省也是率先在国内实行惠民保项目一站式结算的地区,“西湖益联保”正是其中之一。

2022年9月,“西湖益联保”商保窗口落地浙江大学医学院附属第二医院(以下简称“浙大二院”),提供健康宣导、理赔协助、保障咨询等一站式服务,提高理赔效率。

参保人员若在浙大二院院内检查出保障范围的疾病,即可在商保服务窗口工作人员的帮助下,直接在院内完成理赔,实现“一站式”理赔结算,不再需要单独报销,为参保人破除了报销流程中的障碍。

同时,为了让惠民保更加“物有所值”,浙江省政府不断推动惠民保产品优化,提升赔付率。

仅在2021年,浙江绍兴的“越惠保”就进行了三次完善,赔付率从18.45%提升87.54%;2022年,“越惠保”再次进行优化后,赔付率高达93%,吸引了更多人参保、续保。

浙江省政府所做的种种努力使更多的参保人得以享受惠民保的权益,对参保率的提升也产生了显著效果。

惠民保改革新路径:让医保服务被“看见”

即便是走在前列的浙江惠民保,年轻、健康的低风险投保人仍旧很难被覆盖其中。对于各地惠民保来说,他们需要的或许是普惠性更高的前置医疗服务。

在北京普惠保创新与改革路径的探索之中,北京市医保局与北京普惠保共保体开始尝试在普惠保的服务内容中增加高科技附加值服务,提升参保人的使用体验,从而留住投保人。

在北京普惠保的投保人群之中,年轻、健康的参保人常常无法从中获得相应的服务,参保人不免认为每年的保费“打了水漂”;中老年参保人则是慢性病的高发群体,与其在病发之后再去治疗、报销,不如将工作做在平时,提前进行疾病筛查,让疾病变得可预防。

为此,北京普惠保联合多家医疗AI产品提供商,为参保人提供疾病筛查等普惠性服务,鹰瞳科技是其中的首批合作企业之一。

鹰瞳科技成立于2015年,聚焦视网膜影像人工智能,致力于为慢性病的早期检测、辅助诊断和健康风险评估提供人工智能解决方案。2021年11月5日,鹰瞳科技在港交所上市,被业内誉为“医疗AI第一股”。

此次参与“科技赋能”北京普惠保项目的核心产品,是鹰瞳科技旗下一款进行AI眼底筛查的便携式眼底照相机。

据鹰瞳科技政府业务负责人张军介绍,自今年1月起,这款眼底照相机开始在北京市13个区县内陆续落地,分布在北京普惠保共保体中5家保险公司的柜台及药房,在88个网点共计投放了110台设备。

利用眼底照相机对视网膜进行拍照后,内置的AI软件即可通过分析视网膜影像预测多种风险因素,实现心脑血管系统、内分泌与代谢系统、神经系统、及眼部相关的数十种健康风险指标的评估。

该设备的操作流程也十分简单,参保人使用手机扫描设备二维码,根据语音提示操作,仅需1分钟即可完成筛查。

不同于以往的保险赔付,北京普惠保此次提供的疾病筛查服务面向的是全体参保人,即便是没有发生医疗行为的参保群体,也能免费参与到筛查服务之中。

一方面,这项活动使年轻、健康的参保人群也享受到北京普惠保的福利,让投保人不花“冤枉钱”;

另一方面,针对高患病风险的投保人,在医院之外的免费疾病筛查更加便捷,能够帮助投保人早发现、早治疗相关疾病,从而降低普惠保的赔付压力。

据张军介绍,除各网点投放的110台眼底照相机外,鹰瞳科技还准备了40台机动设备,为北京普惠保的参保企业进行上门筛查服务,并走进社区为居民提供公益筛查。

张军透露,鹰瞳科技目前与十余个省市的惠民保产品正在接触中,计划在各地上线惠民保AI眼底筛查服务,惠及不同省市的惠民保参保人。

普惠性的疾病筛查服务是否能够帮助惠民保进一步提升参保率与续保率,仍需时间验证。

但毋庸置疑的是,这是惠民保产品又一次创新性的进步,在医疗AI技术赋能之下,北京普惠保第一次将惠民保变成“看得见的服务”,让每一位参保人都能切实享受到保险的福利。

同时,北京普惠保也为各地的惠民保产品提供了一条可供参考的发展路径,让惠民保的设计者们看到了在提高赔付率之外,增强客户粘性的另一种可能。

正如鹰瞳科技副总裁苏文所言,先进的医疗AI技术与惠民保的结合能够真正地惠及每一位居民,以鹰瞳旗下便携式智能眼底照相机为代表的高度智能化医疗器械产品,使边远地区的群众也能享受到大城市专家级的医疗服务和诊断技术,这也是鹰瞳科技参与惠民保项目的初衷。

不断对惠民保产品进行优化,在保险产品内填充更多前置、高效的医疗服务,才能更好地实现可持续发展。雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/fmRBj9pSi1Gfh25D.html#comments Fri, 17 Mar 2023 10:02:00 +0800
GAIR Live|五位学者大论道:ChatGPT,能否重构中国生命科学界的底层逻辑?|(下篇) //m.drvow.com/category/healthai/LE3LwCBNm8OgGfnP.html 前不久,腾讯研究院发布《AIGC发展趋势报告2023:迎接人工智能的下一个时代》指出,AIGC的商业化应用将快速成熟,市场规模会迅速壮大,预测将率先在传媒、电商、医疗等数字化程度高、内容需求丰富的行业取得重大发展。

与此同时,诸多国外商业咨询机构更是直接给出数据:未来五年10%-30%的图片内容由AI参与生成,2030年AIGC市场规模将达到1100亿美元。

星星之火,可以燎原。早在五年前,AIGC还籍籍无名。它有一个相当拗口的名字--AI生成虚拟内容。以2018年的视频换脸技术Deepfake为代表,“AI伪原创”一词,便从那时传开。

随着深度学习的发展,AIGC逐渐渗透在图像、视频、CG、AI训练数据等各类领域,人们对于这一技术的期望也逐渐丰满。

时至今日,AIGC技术能否用于计算生物领域的新引擎,医疗健康赛道何时迎来新型基础驱动力,成为时下产学研各界的共同关切。

近日,由雷峰网GAIR Live&《医健AI掘金志》举办的《ChatGPT的一把火,能否烧到AI生命科学界?》线上圆桌论坛落幕。

本次论坛,由中国人民大学数学学院龚新奇担任主持,中国科学院深圳理工大学(筹)计算机科学与控制工程学院院长潘毅、百图生科首席AI科学家宋乐、深圳湾实验室系统与物理生物学研究所资深研究员周耀旗、分子之心创始人许锦波,天壤创始人薛贵荣参与讨论。近期ChatGPT爆火,欢迎添加作者微信(微信号:icedaguniang),互通有无。

在上篇中,几位嘉宾共同辨析“AIGC”这一概念,探讨生命科学界中的哪些成果属于AIGC,以及ChatGPT在生命科学领域中可能实现的任务。

在下篇中,将分别探讨AIGC为生命科学带来的可能性与其自身局限,以及中国能否在应用场景上快人一步,实现技术落地与产业转化。

“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网与中国计算机学会(CCF)合作创立的CCF-GAIR大会,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。

经过几年发展,GAIR大会已成为行业标杆,是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。GAIR Live作为雷峰网旗下视频直播品牌,旨在输出新鲜、深度、原创的大咖访谈与对话内容,打造辐射产、学、研、投的特色线上平台。

下是主题论坛的现场内容,雷峰网《医健AI掘金志》做了不改变原意的编辑和整理:

ChatGPT,是否会成为生命科学跨越式发展的契机?

龚新奇:目前来看,ChatGPT的文本生成功能确实挺强,第一次让我们感觉它像个人一样,能够自然地聊天,读懂你的感情、还可以体会到一些细微的褒贬。而且你可以正反提问,甚至还可以夸奖它、批评它。因此,ChatGPT的出现,能否比肩AlphaGo或是AlphaFold2的出现,是否会成为生命科学跨越式发展的契机?

周耀旗:我不认为ChatGPT可以比肩AlphaGo或是AlphaFold2。AlphaGo当年战胜了人类最好的棋手,而AlphaFold2在高精度蛋白质结构预测上取得了革命性进展,但ChatGPT对生命科学来讲,错误率太高、准确度不够,还不能算作一个跨越性的成果。

但我对它的未来版本充满了信心,特别是当ChatGPT跟搜索引擎结合,会大幅度提高它的精确度。因为它可以出具文献出处,还可以帮我们提供各个领域的综述、问题解决思路、促进不同领域沟通,甚至帮助学者撰写文章初稿。那么未来跨专业、跨语言的交叉研究就变得容易一些。

所以我认为,未来升级版本的ChatGPT完全可以成为一个创新枢纽。科学家把更多精力放在提出问题上,并根据AI的建议来优化、验证解决问题的方法和思路。所以ChatGPT的出现还是有一定的意义,它推动了一个有想象力时代的到来。

潘毅:我认为今后ChatGPT很有可能成为生命科学领域跨越式的发展契机。至于它的影响力,我跟周教授有不同看法,我认为ChatGPT的影响力会大于AlphaGo和AlphaFold2。

为什么?

AlphaGo为专为围棋而设计,AlphaFold是专为蛋白质结构预测而设计,所以它们是一个为专业而生的AI平台。相比而言,ChatGPT是一款通用型AI平台,既可以交流,又可以撰写邮件、视频脚本、文案、翻译、代码,写论文等等,普罗大众都可以试一试,所以ChatGPT的影响力要远比AlphaGo和AlphaFold更广泛、更深刻。因此,虽然ChatGPT在生命科学领域里比不上AlphaFold,AlphaFold在围棋上比不上AlphaGo,本质是术业有专攻。

最近我和老同学黄学东聊天,发现他对ChatGPT的评价很高,“微软如今加码ChatGPT,是因为ChatGPT之于AI,相当于芯片之于计算机这么重要。”

要知道,黄学东多年担任微软Azure AI技术研究员和首席技术官,前不久刚刚当选2023年美国工程院院士,此前他并未将Alphago和AlphaFold定义为一个“里程碑式”的技术突破。

当然,周教授说得很对,ChatGPT在生物领域的影响力也许还没达到,目前ChatGPT无法处理复杂冗长或者特别专业的语言结构。但随着AI技术的改进,几年以后它一定会赶上,甚至会超过AlphaGo和AlphaFold。

从另一方面考虑,如今ChatGPT作为一个通用平台,应该如何推动生命科学发展?

一、生命科学领域的学者为其注入专业性更强的生物知识,只有进行足够的语料“喂食”,ChatGPT才有可能生成适当的回答。那时候,它或将用于蛋白质结构预测,蛋白质设计、蛋白质相互作用分析等各类任务。

二、指挥ChatGPT编写程序,比如Java程序、HTML程序,以及各种API( 应用程序编程接口)。那么未来生物学家只需要发出指令,ChatGPT就能完成从代码编写、接口耦合到程序测试的一系列工作。这也意味着,尽管很多人不能完全精通各种计算机语言,但我们只需要会做一些策划性工作,就能快速搞定项目。

宋乐:从通用人工智能的角度来说,ChatGPT确实是一个非常大的进步。因为在A I领域,过去的对话机器人很难媲美ChatGPT。因为ChatGPT除了逻辑严密的创造能力之外,还具有记忆能力,在连续的对话中不用大家提供重复信息,其语言组织和表达能力也更接近人类水平,使对话更自然流畅。

但实际上,ChatGPT的创造性、流畅度,多轮对话能力,依赖于多种AI技术的结合,包括它的训练方式都和过去的AI模型不太一样。

OpenAI使用了RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习) 技术对ChatGPT进行了训练,且加入了更多人工监督进行微调。因此,ChatGPT进一步提高了AI模型与人类的交互能力,对信息含义的理解能力,以及自我判断能力。

所以,ChatGPT的本质是对人类语言(自然语言、程序指令)反应能力的数学逼近。相比较而言,过去我们和计算机交互,要么自己打字,要么输入非常结构化、死板的程序语言。但现在就可以直接以用自然语言和计算机交互,把它视为人类助手。

最近斯坦福一位教授发现,GPT-3.5的智力已经和9岁的小孩相当,这是以前任何AI 程序都不可能达到的高度。总体而言,我认为ChatGPT是可以被视为里程碑式的AI成果,而且它确实会带来一系列的工业级应用,甚至未来基于ChatGPT衍生出更高级的AI模型。

说到这里,ChatGPT也有一些局限性,比如因为知识缺失,产生一些不正确或者荒谬的答案。

比如你问它“红烧蚊子腿怎么做”,它会给你一个正了八经的回答:先把蚊子腿洗干净,再熬制糖浆,然后放入葱姜蒜煮熟。”它只是把“红烧猪肉”的做法重复了一遍,把“猪肉”换成了“蚊子腿”。

还有一些有趣的例子,比如你叫它做一些算数运算。如果只是简单的单位数运算还好,但如果数字比较长,或者比较复杂,它就做不了。实际上,这体现了ChatGPT当前的训练模式的局限性,更加偏向于基于序列的拟合,或者表征生成序列的形式去训练。

所以ChatGPT还能朝什么方向优化?

有三点思路:

一、未来需要向ChatGPT注入一些知识图谱,比如数学运算能力、生物识别能力,补齐它在这些维度的智慧;

二、对于蛋白质设计、药物设计等细分领域而言,就可以直接“外挂”一些专业模块,比如复合物结构模块、亲和力模块、蛋白质稳定性模块,当“外挂”越多,它的智力更高,也会输出更更贴合需求的结果;

三、我们也可以学习ChatGPT的算法思路和模型训练方式,“投喂”十亿级、百亿级的蛋白质序列数据,训练出一个专用于蛋白质设计的模型。

薛贵荣:我们比较有幸,2018年做过AlphaGo的复现,2021年我们做过AlphaFold2的复现。但总体来说,这些领域我们有胆量尝试,但从来没有尝试过的就是语言类AI模型。

众所周知,自然语言处理(NLP)、机器学习(ML)发展了很多年,但人机交互仍然不能做到问答自如,逻辑流畅。根本原因是建立自然语言处理模型的实用系统,需要不同层面的知识,比如汇学、句法学、语义学和语用学等知识。

而且NLP是一个交叉学科,涉及了方方面面的知识领域,包括计算机科学(给NLP提供模型表示、算法设计、计算机实现的技术)、数学(给NLP提供形式化的数学模型和形式化的数学算法)、电子工程:(给NLP提供信息论的理论基础和语言信号处理技术),以及心理学、哲学、统计学等等。所以从开发难度上看,ChatGPT都是当之无愧的AI界“天花板”。

另一方面,无论是AlphaGo还是AlphaFold2,都是某一领域的专业软件,但ChatGPT更像一款平民版AI,能够承载几个亿的用户一起测试,因此,它在覆盖面、影响力上,都远超AlphaGo和AlphaFold2。未来,大家肯定希望像ChatGPT这样的技术能够应用在生命科学场景中。

比如,现在的医疗问题是大家有问题找专家,但在医疗资源分配不均、医疗供给量不足的情况下,这一问题始终得不到解决。那么ChatGPT就可以发挥出“消费级应用”的特长,渗透入看病、制药等环节,降低专家依赖,一步讲清所有深奥的“病理、药理”。而经历过疫情三年后,大家更关注健康问题,我们也更加期待ChatGPT能够联姻生命科学,实现跨越式发展。

许锦波:从AI的角度来说,ChatGPT的出现意义可以和AlphaGo、AlphaFold2相提并论。它们都是重大技术突破,激发的讨论突破了业界的范畴,外溢到公众层面,可见影响力巨大。但是从生命科学角度来讲,在蛋白质设计等方面,ChatGPT并不专精。实际上用AI进行蛋白质设计或预测蛋白质结构,两年前甚至三年前就发生了,只是模型比ChatGPT更小,当时的算力也比较小。

因此,如今AI领域面临的重要问题是,现在的算法跟两年前的AI算法,到底有没有本质上的区别?

至少目前来说,我没看到本质上的区别。当然,在蛋白质设计上,现在的算法相比于传统算法确实取得了进步,很多人也在讨论,我们是不是要研发出一个ProtGPT,大幅度提高蛋白质设计的成功率?但要明白一点,所有通过AI设计出来的蛋白质都要有湿实验验证。如果未来AI能够大幅度降低对湿实验的要求,降低实验成本和时间,甚至用计算验证来替代实验验证,那将是更大的进步。

技术不确定性,成为最大隐忧

当ChatGPT/AIGC大展拳脚,生命科学领域最明显的变化会是什么?另一方面,这种概念对于生命科学行业,是否有不确定性或者危机?

周耀旗:我觉得AI已经为生命科学带来了很大变化,特别是AlphaFold2对大部分蛋白质结构的预测,与真实结构只差一个原子的宽度,达到了人类利用冷冻电镜等复杂仪器观察预测的水平。这一重大成果虽然没有引起媒体和广大民众的关注,但生物领域的科学家反应强烈。

可以说,AlphaFold2对生物机制的理解,对药物设计都带来了正面影响。当然,未来AIGC一定为生命科学带来更大的变化,比如AI设计的蛋白质会越来越多,进一步补充PDB蛋白质结构数据库、功能库,推动人类对生命科学的理解进入到一个新的高度。

与此同时,ChatGPT对于生命科学行业也有很大的不确定性:

一、预测是否错误,错误率是多少,以及是否误导用户。因为AI是通过海量数据训练出来的,因此这一缺点也与大数据的问题一样:数据很精确但错得离谱。相比而言,AlphaFold2有一个plDDT打分函数,但是打分函数并不一定完全正确,有时候还是错的;

同时,我们也不可能对每个设计结果都做验证,所以有时候还是很受误导,得出一些错误的结论。但目前我觉得是可以忍受的,因为模型训练本身就是在纠错,除了蛋白质设计以外,其他生物高分子的应用也是会越来越多,不仅仅DNA、RNA、代谢组、糖等各方面都会大展宏图。

二、鉴于ChatGPT会把原来一篇文章重新编辑,那么我认为未来最大问题是出现假论文、编造假实验数据、甚至用这个技术做坏事,比如产生新病毒、新细菌,都是潜在风险。

所以长期来讲,AIGC会随着时间更加成熟,这种不确定性和危机也会更加隐蔽,可能十几年、三十年左右就会来临。我们需要在科学研究能力和风险管理上提前做好准备。

宋乐:我可以想象,随着数据量越来越多,算力越来越强,AIGC模型本身的生成能力,以及各种外挂功能(亲和力、稳定性、表达量)的加持,或许未来非常多的蛋白质设计工作都是在计算机里进行,后端的湿实验数量就会大大减少。

那么当ChatGPT/AIGC大展拳脚,生命科学领域最明显的变化,我认为有几点:

一、实验人员减少,要求也因此下降,未来或许也不需要那么多的人体临床实验;

二、实验工作者也要学习数据分析,朝AI的方向走,以及一些高校会将计算机课程设立为药物、生物等专业学生的基础课;

三、一些新的工作机会也会创造出来,比如如何更好地衔接外挂和AIGC模型,如何真正地推动AIGC模型加速药物设计。

但从我的感受来,生物的复杂程度各不相同,比如目前数据量最大的蛋白质序列,那么“AIx蛋白质设计”会最快落地,可能是未来3~5年。但是复杂度更高的领域,比如蛋白质相互作用、细胞设计及相互作用、器官设计以及相互作用,它们需要更多的数据,更大的算力、更长的时间打造AI模型。

总体来说,AI在朝着那个方向走,只不过是时间长短的问题。

薛贵荣:可能我们最快感受到的变化,是药物研发速度大大提高,比如以前研发一款新药究竟有多难?医药界有个“双十定律”:一款新药从研发到上市,平均需要10年时间和10亿美元的投入。

那么AIGC的发展,时间、资金可能都会缩短,准确度还会有比较大幅度的提升。

当然周教授也提到,或许不同目的的人会加速制造一些病毒细菌,那么未来监管局既要推动优势药物上市,也要防范生化危机,需要尽快建立系统性的管控制度和规范。

潘毅:刚才几位教授都讲得非常好,那么我认为,ChatGPT/AIGC这种技术应用在生命科学领域,第一大危机是什么?

一、数据污染。

因为生命信息领域有诸多基因数据库,假设有人放入一万个有攻击性的数据,并将某些基因数据跟疾病关联,最终预测结果失准。目前我们还没有看到这样的事情,因为ChatGPT刚刚出现,大家普遍想用它写出“好文章”,前后衔接、逻辑连贯、辞藻优美。但如果你的目的是生成有破坏力的内容,就会拿“烂文章”训练它,甚至ChatGPT也可能被引诱去做坏事。

二、巨大的算力和电力消耗量。

从技术原理来看,ChatGPT基于Transformer技术,随着模型不断迭代,层数也越来越多,对算力的需求也就越来越大。从运行条件来看,ChatGPT完美运行的三个条件:训练数据+模型算法+算力,需要在基础模型上进行大规模预训练,存储知识的能力来源于1750亿参数,需要大量算力。

要知道,一个参数要很多数据支撑,近2000亿的参数中需要多少数据,要消耗多少电?假如每个国家每个地区都这么做,能源可能就是一个问题。所以规模也不能这么扩大,我还是强调打造专业领域的BioGPT。

三、用户沉湎、数据隐私、版权伦理。

用户过分依赖于AI从事内容创作,可能导致内容非原创,缺乏创造力,引发版权问题,甚至隔绝物理世界,影响身心发展,社会整体运作效率反而降低。

许锦波:ChatGPT带来的好处,至少让AI蛋白质设计领域的从业者更有信心。最近一两年,由于AI的深入发展,蛋白质结构及功能研究取得了巨大的突破,从传统的物理和统计方法快速走向机器学习,乃至深度学习;分子生物学界的研究范式,也从基于序列的研究转向基于结构的研究,极大提高了蛋白质从头设计的效率。

而在产业界,AI蛋白质发现和设计也乘势而起,成为全球瞩目的热门赛道。

但目前来说,大家还无法确定:AI设计蛋白到底能做得多好?相比于传统方法效率能提高多少?实验要求能够降低多少?这些都还需要继续探索。

手握ChatGPT入场券,中国能否「弯道超车」?

龚新奇:黄民烈教授接受采访及近年的现象所示,美国在AI的基础研究上积累深厚,中国则是强于AI的场景应用。在ChatGPT之后,百度将于3月上线ChatGPT产品,名为文心一言。当AIGC用于生命科学领域,中国在技术落地、产业转化上,是否具备“弯道超车”的机会?

薛贵荣:最近AIGC和ChatGPT的讨论特别多,国内又兴起了一波AI热潮。但就像刚才潘毅教授讲到的一个关键问题:必须建设各领域的专业版GPT。

在各块专业领域,中国已经积累了大量知识库,或许我们有机会做到弯道超车。尤其是在生命科学领域,中国的蛋白质设计技术与国际基本上处于同一水平,已经实现了核心技术的原始创新,为工业酶、生物材料、生物医药等功能蛋白的设计奠定了基础。

举个例子,去年12月1日,华盛顿大学David Baker团队发布了RFDiffusion、同日波士顿蛋白质设计公司Generate Biomedicines发布了扩散蛋白生成模型Chroma、同月Meta发布基于150亿参数的ESM2语言模型,实现全新的非天然蛋白质设计。今年年初,加州伯克利的一家初创公司Profluent也称采用类似ChatGPT的蛋白质工程深度学习语言模型——Progen,首次实现了AI预测蛋白质的合成。目前我们也自研了一款扩散模型TRDiffusion,设计多种多样与天然蛋白质截然不同的全新单链蛋白质及复合体,目前已进入实验验证阶段。

实际上,无论是中国也好,美国也好,最大的优势是大家都能利用蛋白质设计技术,撬开生命科学的窗口。那么后续大家会更加重视生命科学的产业环境,无论是创新药环境、环保能源环境、食品安全环境等等,都会跟上技术研发的速度。所以我觉得,无论是科技研发、产业落地、还是风险投资,我们一定要对未来的产业环境有足够的信心和投入。

对于天壤而言,未来在算法升级,干湿实验室搭建、平台开发上都需要很大的投入;

其次,大家都知道,蛋白质被称为“生命的基石”,在已知的天然蛋白质的背后,蕴藏着一个隐密而巨大的“蛋白质矿山”。大家都想最先找到那块金矿,这方面特别考验团队的算力、算法、人才队伍,以及下游的产业合作。所以这是一个联动的工作,研发做快了,后面也得跟着快。

因此,回到刚才讲到的中国能否弯道超车的问题,我认为这是一个非常具有挑战性的事情,但最根本的一点,我们不能从一直follow别人的技术,而是要从中国本土的产业转化和人民需要上找问题,这才是我们弯道超车的机会。

周耀旗:我认为如今的ChatGPT有点像新一波AI热潮。

2020年AlphaFold2出来的时候,大家对AI的兴趣特别大,很多投资方出手,但很快发现AI公司并没有那么快出效果,所以去年AI热度又降了下来。如今ChatGPT让AI再次回热,但也有人发现它距离SOTA (state-of-the-art model,最先进的模型)还有一段距离,所以我估计大部人很快又会失望。

另一方面,从公司的角度来说,OpenAI公司成立于2015年,8年时间才产生了ChatGPT这样的轰动项目。但国内有多少家投资商和公司,有耐心等8年?

有人说,中国会发展出更好的ChatGPT,认为中文内容的广度、深度远远超过英文内容。实际上,如今即使是中国人所发表的前沿知识,大部分都是以英文的方式呈现。英文知识库扩大的速度很快,而中文很慢。因此,只有把中英知识全部结合起来,才能充分利用全人类的积累的知识。

举个例子,为什么谷歌搜索占据世界第一,国内搜索公司的回答准确性却很低,甚至它的应用市场只缩在中国?

这是非常现实的问题,主要原因是因为很多国内公司没有胸怀世界的前景观,认为专精于中国知识库就够了。那么,借助ChatGPT的热潮,我们到底能不能实现弯道超车?

从国内生物医药的政策环境来看,某种意义上我们还存在一些阻碍,特别是国内创新药市场的带量集采模式,类似于传统的统购统销模式,导致创新药价格被压得很低,上游科研、生产等环节都缺乏动力。

相比较而言,全球主要国家创新药市场销售额情况,美国占比在50%以上,其他发达国家中,欧洲五国占比约16%,日本韩国占比8%,中国仅占3%,与发达国家差距较大。

这也侧面反映了美国在研发,转化,市场方面具备更深厚的经验积累,中国还有很多的学习机会。

先不说超车,今后我们要多久才能跟上美国步伐,现在还是很大的挑战。另外,中国在芯片方面被限制,所以尽管最近很多开源方案可以复用,但大家如果想大幅度超过国际水平,我觉得还是有一点困难。

龚新奇:周教授给我们的建议,我们先能跟跑,再是超车。2021年5月,百图生科计划在苏州工业园区创意产业园建立苏州研发中心,百度创始人李彦宏到场,看来是想花很大心思想引领中国的“BT+IT”的发展。宋乐老师是百图生科在AI生命科学方面的的领导者,你觉得,你们有什么样的规划可以助力中国来弯路超车?

宋乐:我可以从行业现状分享一些看法。我观察一些美国大药企和美国AI公司在合作上释放了一个机会窗口给中国。

怎么说呢?美国很多传统大药企,更加聚焦于用一些生物手段、实验手段做药物筛选,研究大多以生物学家、医学家为主导。沿用这条旧有的的研发模式,他们非常成功,很赚钱,也花费了大量的实验成本、试验周期。但这些公司里的IT、AI团队都很小,只有3~5个人,很难做出大规模预训练模型,以及更复杂的结构预测模型。为了促进干湿实验结合,他们只好源源不断地引入外部公司研发的AI模型。

但这类公司囿于人力、组织结构,很多情况下他们都是处于观望和学习的阶段。而国外还有一类公司,却是强于AI,能够孵化出诸多世界级的前沿AI生物技术。比如Deepmind、Meta、它们强于算法迭代,频繁在蛋白质结构预测和生上吊打其他公司。

比如最近Meta基于大语言模型而推出的蛋白质设计工具,就被在Meta任职多年的首席AI科学家Yann LeCun直言:效果惊人。因此国外生命科学界的研发落地模式,属于“顶级AI公司+Biotech公司”强强联手,不断拟合两者之间的gap。

但实际上,跨公司之间的合作矛盾无可避免,成果落地也存在拉扯。截至目前,国外诸多公司只是在算法层面给了我们很多希望,离真实的实验验证、技术落地、产业转化,以及临床应用,还存在很远的距离。所以总体来说,美国两种不同的研发公司,都存在各式不一的先天性缺陷,反而给中国公司提供了一个“时间窗口”。

比如,中国走的路线是将多学科的学者集中起来,在发展之初就强调“AI+实验”的一体化模式。尽管这种模式在AI制药的研发、临床等前期阶段耗时长,但只要跨过死亡谷,在硬科技产品商业化、面向市场的阶段,或超速美国。

以AI制药为例,当一个创新药物进入临床1-3期的时候,就已经证明了自身市场价值。至于后端的临床、市场能否产生效益,实际上与资本和政策支持密不可分。换句话说,百图生科等公司的任务是,做好产业最前端的算法技术升级、药物发现和筛选,从而进一步缩短药物交付时间,如此才能真正惠及患者。

总体来说,我们是有一个时间窗口做到弯道超车,但不单是公司模式要革新,投资界也要树立一种新的视角,学习和借鉴国外“AI+Biotech”的投资理念,如此才能推动产学研生态繁荣。

潘毅:我们所谓的要弯道超车是什么意思?我们说基于GPT的算法做出上层应用,实现市场繁荣。但实际上,GPT是最底层的技术,如果我们做出适用于生物知识问答的BioGPT,蛋白质结构设计的ProGPT,那么我们毫无疑问将弯道超车。

但能否超越国外的算法模型,我们是没有底气的,如果GPT4,5...出来了,甚至算法封锁,国内所有应用层的东西都无法进行。

所以很重要的一点,国内多家互联网公司模式,尽管做到最大,钱赚得最多,但是底层技术却仍然落后和依赖“拿来”的东西。这种情况下,我们国家再怎么主导、地方再怎么支持、公司再怎么运作,都无法将底层技术沉淀下来。

问题出在哪里?是我们能不能沉下心来,花上几年时间,投入巨大的资金,做出一个震惊世界的成果。

相比较而言,做出ChatGPT的OpenAI是怎么是做到的?

2015年,OpenAI成立,核心宗旨在于“实现安全的通用人工智能”,使其有益于人类。创立3年半后,OpenAI建立了新的公司架构,现在的OpenAI由营利性公司OpenAI LP和非营利性母公司OpenAI Inc组成。不过,为了不与最初的使命冲突,OpenAI规定,参与首轮融资的投资者最高可获得100倍于初始投资的收益,超出的部分都将返还给非营利组织。

2019年7月22日,微软一掷千金,投资OpenAI 10亿美元,今年1月份,微软宣布向OpenAI追加投资数十亿美元,这也是人工智能领域史上规模最大的一笔投资。据说微软还计划向OpenAI投资高达100亿美元,同时正在讨论拿到OpenAI 75%的利润股份,直到收回投资,之后微软将获得OpenAI 49%的股份。

这说明,OpenAI做好了一家实验室的使命,投资公司也完成了自己最擅长的事情。

但遗憾的是,国内却没有一个公司,愿意花上千亿,组建百人团队,赌上自己的十年。这才是真正的问题。所以我们现在要做的,是变革“产学研+投”的发展模式,计划下我们怎么弯道超车。另外,还有一种方式做到弯道超车--做出专精某一领域的GPT。

现在我们在关注生物信息领域,可以做出与生物有关的GPT。等这一领域的的算力、算法模型、公司实力都愈发强大,就可以将其复用在其他领域。比如法律的LawGPT,经管的FintechGPT,以及方方面面的专有工GPT。

举个例子,当初我的一个硕士生用半年时间做了一个AI软件,打败了AlphaGo。很多人可能会觉得,“你竟然打败了AlphaGo ,太了不起了”。但这是我们是参照别人已有的AI模型做的改进,技术的复现并不难。难的是,我们不是第一个想到做这样模型的人。有时候,敢想才是创新的第一步。

许锦波:我觉得中国是有弯道超车的机会,因为“AIGCx生命科学”也不过两三年的时间,大家都处于发展初期。

其次,中国市场空间更大,对生命科学产业也愈发重视,未来随着数据、算法、算力的升级,将极大推动技术的发展以及产业转化。

但回归到一个核心问题,目前的生物数据能否足够训练出生物界的“ChatGPT”?

这当然要看你的要求有多高,好消息是现在蛋白质领域的数据已经非常多,比如蛋白质序列数据已经有几十亿条。我们也在通过湿实验收集针对特定任务的数据。有了蛋白质通用的序列数据、结构数据,加上特定任务的实验数据,我很期待未来能够训练出更好的AI蛋白质生成模型。

所以现在的关键问题在于大家怎么做出更好的AI蛋白质设计算法,如何把各种各样的数据整合在一起发挥更有效的价值。

随着高通量技术可以产生更多的实验数据,相信会促进AI算法越来越好。所以总体来说,我还是很看好中国市场。

圆桌策划人吴彤,长期关注生物信息学,AI制药,医疗机器人。近期ChatGPT爆火,欢迎添加作者微信(微信号:icedaguniang),互通有无。

]]>
医疗AI //m.drvow.com/category/healthai/LE3LwCBNm8OgGfnP.html#comments Mon, 13 Mar 2023 14:37:00 +0800
中国生信学科「铺路人」孙之荣:90年代群英传和一段艰辛的学科发展之路 //m.drvow.com/category/healthai/kxLs2tL85ucG4tQX.html 情不知所起,一往而深。孙之荣对清华生物系有着非同一般的感情。

1984年,孙之荣从清华自动系转入生物系,成为清华生物系的第一批复建教员。转眼之间,孙之荣从意气风发的青年变成头发花白的老者。

每当静下来的时候,他常常回忆起那年冬天只身前往生物系的场景。

清华大学的生物系始创于1926年,是我国历史上最早的生物系之一,在二十世纪三、四十年代曾经相当辉煌,仅中国科学院学部委员中就有三十多人曾在这里学习或工作过,其中包括钱崇澍、陈桢、李继侗、戴芳澜、汤佩松、吴征镒等。

然而流于炮火,清华生物系不断南迁,直到1945年后才重回北京。本以为这是一场久违的复建工作,1952年,一场全国院系调整,清华生物系所有教师、设备、以及图书资料和生物标本,尽数调至中科院、北大及其他兄弟院校,清华生物系又进入了长达32年的空白期。

光阴无情,至复系草创阶段,诺大的清华园几乎找不到一个生物专业的科班教师,仅剩西门旁一栋老生物学馆。孙之荣那年37岁,叹言:“一切都是白手起家、从头开始。”

时至今日,孙之荣仍自评“这一步子迈得极大”。如果当时没有下定决心转型,或许他一生顺遂,在自动化领域成绩斐然。然而命运却将他推向了另一条路,他便闯出了一条有数理及工程特色的生物学研究道路,与国际最前沿的生物信息学接轨,半生奔走于中国生信会议的组织宣传与学科发展。

一个人,一辈子,一条路,当如此。

奔赴清华、留校任教、投身系统工程

1965年赴清华大学读书后,孙之荣就很少再回家乡。

“父母都不在了。”孙之荣摆摆手,很小声地说完后面几个字,“忙,回不去了。”

孙之荣的老家在江苏泰州,自古有“水陆要津,咽喉据郡”之称。孙之荣形容“船多,到哪都是坐船”。1965年8月,他便是在那里收到了清华大学录取通知书。

那时去北京并不容易,需先乘船到南京,再摆渡到南京浦口,最后再转火车北上。一趟折腾下来,也要三天才能抵达。从未出过远门的孙之荣,误选了一趟慢车,从早上晃到晚上还没驶出江苏。眼看报到时间逼近,他又赶紧在徐州跳上了一列特快,终于在最后一刻赶到了北京。

大学是什么样子?

孙之荣记得,时任高等教育部部长兼清华大学校长的蒋南翔有一句重要口号:清华是培养红色工程师的摇篮,学生要为国家建设服务。孙之荣所在的自动化系,就曾到北京钢铁厂、炼油厂、江苏望亭电厂参加劳动实践。

而这段经历也让奉献祖国的想法在孙之荣心里扎下根。毕业时,绝大多数学生填写的分配志愿都是西部、基层,孙之荣也提出愿去四川航天部的研究所、及甘肃玉门油田参加国家建设。

令孙之荣没想到的是,等到他1970年毕业,中止了4年(1966-1969)的大学招生工作恢复,随着第一批工农兵学员进校,孙之荣等人被分配为留校任教。

“大好年华,年轻人都想去祖国偏远地区闯一闯。转念一想,留校也大有施展空间。”

七十年代,我国外交取得重要突破,顺势制定了“四三方案”,投资约200亿元人民币,建设了26个大型工业项目,包含化肥、化工、钢铁、石油等,而孙之荣所授的“过程控制”,就与这些项目息息相关。

打个比方,火力发电站需要用水蒸气推动汽轮机,汽轮机带动发电机转动发电,其中的关键是精准控制水和蒸气的界面,既不能水蒸气过多,导致锅炉烧干了,也不能全是水,导致动力不足,所以很多过程离不开控制,因此得名“过程控制”。

为适应国家工业建设和国防建设的需要,清华在70年代对自动化系进行了重新规划:以控制论为基础,培养能设计、运行自动控制系统的专门技术人才。此外,为培养适合中国工业化发展的高层次人才,试点“清华研究生班”的两个试点,其一就有自动化系。据孙之荣回忆,自动化系有很雄厚的师资,常迵、方崇智、郑维敏、童诗白、吴澄、李衍达等教授,都是其中的杰出代表。

常迵、方崇智、郑维敏、吴澄、李衍达

孙之荣二十岁出头,肩上的担子不轻,先后带领1970-1974年、1974-1978年两届工农兵学员,待1978年恢复全国性高考,他又投入到了更广泛的教学工作中。1979年,我国建成两弹一星、三线工程、潜艇飞机以及相应的工业体系后,清华自动化系因时制宜做出调整——将计算机系的部分教师纳入学科队伍。与此同时,已过而立之年的孙之荣也发生了重要转变,转向应用空间更大的系统工程。

实际上,孙之荣的这一决定已酝酿许久。

1978年9月27日,钱学森的一篇理论文章——《组织管理的技术:系统工程》引起巨大反响,由此创立系统工程中国学派。孙之荣对这篇文章深有感触,“很多生产过程控制大多在工厂开工之前就设计好了,但系统化的工程设计刚刚开始,它包罗万象。”

孙之荣印象最深的一回是在1981年。那年他在国家外贸礼堂召开系统工程的普及讲座,报告题目取为《系统工程与存储管理》。一小时的报告话音刚落,时任国家物资总局局长快步走上前,满含赞许地握着对孙之荣的手道,“你讲得真解渴啊!”

这位局长是为物资总局储存的事而来。对方提到,“物资局属于计划经济的产物,也是我国的重要战备力量,所以要妥善处理物资收储、调用、中转和日常管理。能不能把你的系统工程用在库存管理上?”

实际上,孙之荣最大的心愿就是把系统控制技术用在经济领域,两人一拍即合,竟有一种相见恨晚的感觉。后来在他的努力下,物资存储工作顺利进行。

有了这次经验,孙之荣的所学迎来了更大的施展机会——为山西平朔安太堡露天煤矿做公司投标的可行性论证。

这是当时世界最大的露天煤矿,因此选择哪个公司开采、怎么开采,都至关重要。得此机会,孙之荣认识了数位系统工程的专家:中科院系统科学研究所的刘源张、顾基发、甘兆熙,军事科学院的朱松春,社会科学院的周方等教授。

在孙之荣心中,他们都是中国的系统工程战略科学家。这也让他更加认可自己的价值——一切都是围绕国家发展大计。

那时,孙之荣只是清华一个科教工作者,无论是年龄还是项目经验都是一个晚辈,他就利用一切时间做调研。白天授课后的间隙,晚上回家后的几个小时,就连路上的时间也被他抓来用。回忆起那段时间的痴迷劲,孙之荣说,“脑袋好像一刻不停地琢磨事。”

或许可以用一句“福祸相依”来形容,山西平朔煤矿的项目很快被确定为中外合资“试验田”,直接由西方石油公司的董事长哈默接手,孙之荣等人的前期研究因此终止。

时隔四十年,孙之荣讲起此事,还是说“多亏了几位老大哥及时赶来为我指了出路”。

事实上,几位老大哥的交代很简单,只用了一句话,“小孙,你还年轻,还有发展的余地,试试将系统工程和生物学联系起来。”

往后孙之荣曾多次谈起此事,想来对他印象深刻。他说,许多事情是机遇。比如物资管理、煤矿开发,他事先不知道并不知道能参与到经济建设中,也不可能预先去做充分的准备。但就在整个过程中,他把应该做的事做了,还完成得非常好,这样建立起来的信任度,不是轻易能够动摇的。

复建生物系、骑行农科院,结识生化界一号人物  

从那以后,孙之荣便走进了另一条路。

孙之荣觉得,要对生物学问题进行控制、信息、系统工程的研究,一定要深入了解生物学这个研究对象。1984年8月,孙之荣转入清华生物系,成为该系复建后的第一批重要青年骨干。

生物系在清华早有根基,老生物系于1926年成立,经1952年全国高校院系调整,清华生物系分散并入北大、中科院生物研究所等,清华生物系就此中断。直到改革开放后,赵南明等一批学者(创立清华生物物理研究室并担任主任)公派出国访学,才意识到世界科学的重心正在向信息科学和生命科学转移,此后与校长等人开始筹划生物系的复建。

这就是清华校史上极其重要的“1984年生物系复建”一事。

孙之荣回忆道,复系之初,教学、科研条件十分艰苦,尤其场所是一个最难解决的问题。

当时仅有靠近西门的老生物馆,还被改用为校医院。而生物系想建一个细胞实验室,实在找不到地方,只能将一间多年未使用的女厕所改建而用。而当时生物系的两支队伍(生物物理和生物化学),所有教学和科研也都集中在一排面积很小的老旧平房,俗称“36所”,因为该房一度是抗日战争中侵华日军的兵营。

尽管复建之初物质条件不尽人意,但学者们都兴致高涨。

在这支复建队伍中,学者有三类:清华其他系转入、兄弟院校聘入、留洋学者引入,共计三十余人。其中与孙之荣同样从工物系、工程化学系、自动化系等转来的学者最多,奠定了清华生物系此后的理工科基础的特色。

起初转到生物系,孙之荣想事情简单直接,把系统工程的研究对象换成生物。但没过多久,他就发现不是那么一回事。

从北大聘来的张宗炳、戴灼华、郑昌学,以及中科院生物物理所的沈淑敏,整天都是和生化、分子生物学打交道,结果每次开会讨论问题,孙之荣都搭不上腔。

对他而言,生物问题更复杂,也没有建立可描述的物理模型,能不能走进生物学的大门还不是定数,何谈结合系统工程?

孙之荣忽然想起,1984年建系初赵南明曾在清华工字厅的一番讲话,“近亲繁殖必然为自然选择所淘汰,远缘杂交才具有顽强的生命力,人才培养和科学研究都是如此。”时隔数月,孙之荣对这句话深有体会,“要保持我过去的自动化特色,扩大研究领域,凡是能做量化研究的都去试一试。”

此时的生物学界,一场小麦优良育种研究正进行得轰轰烈烈。

北京农林科学院植物细胞工程学专家胡道芬,一度将优良小麦的育种期从8-10年缩短为2-4年。但这一做法也暴露出重大问题——育苗率太低,只有4%左右。

孙之荣察觉到,或许这正是系统工程技术的用武之地。

简单来说,如果将影响小麦育种的所有因素考虑在内,就能精确得知小麦育种数、小麦品种谱系图、亲缘关系图,从而推导出育种模型,提高育苗率。

1985年到1987年,孙之荣经常骑着一辆自行车去往北京当地的农科院。孙之荣把自己当做一名学生,凡是模棱两可的问题就去查清楚。当时小他几岁的中国农科院作物遗传育种专家李梅芳,就曾多次提供指导和合作。

从饥荒年代走过的人,粮食安全成为他们刻在骨子里的本能。功夫不负有心人,育苗率从最初的4%提高到23%,最终达到54%。这个数字出来之后,农科院现场瞬间喧哗起来,李梅芳当即鼓励孙之荣向《植物学报》发论文。

那时孙之荣38岁,正是需要文章的时候。但他怎么也没想到,两个月后,他等来的却是“未通过”的消息。他又骑上自行车,亲自去找编辑问个清楚,原因竟是“没法评审,老编辑不懂什么生物工程的新技术”。

但经此一事,孙之荣在生物系引起了不小的反响。

1987年,时任清华生化教研室主任的郑昌学找到孙之荣,他早就发现孙之荣数理思维灵活,这次带来了一本英文版的《现代生物学导论》,建议孙之荣将这本书中的生化选择题程序化,做成多媒体课件。

如此一来,不仅能给学生考试,还能用作教师们备课,尤其是能让生物系多学科背景的教师们走动起来。

八十年代末,中国还未流行多媒体辅助教学,孙之荣的这套教材十分抢手,甚至被清华之外的诸多高校所引用。清华生物系顺势召开了一个“教学软件鉴定会”,邀请了各大高校生物专家,一起讨论如何完善课件。

会议比想象中还要受欢迎,在场所有人甚至能就一个细节问题讨论得热火朝天。等到会议结束,一个人迟迟没走,这个人就是当时被视为“国内农业生化界的一号人物”——阎隆飞院士。

实际上,阎隆飞与清华生物系有着不解之缘。他是该系回迁北京的第一届研究生(1946年),也是当年植物生理学部招收的唯一一名学生,毕业后便在北京农业大学(现中国农业大学)的任教,清华生物系复系之初还做过一段时间的兼职教授。

阎隆飞

他把孙之荣叫到一边,“我看你计算机思维挺好的,现在国际上蛋白质结构模拟和预测大热,你在这里面大有可为。”

数年之后,孙之荣顺利加入科技部“863蛋白质工程”中,成为中国理论生物物理队伍中的重要一员。

如今回忆起三十多年的那一幕,孙之荣仍然动容,“我这一生遇到了很多贵人,阎先生是重要一位,不断促使我往生物学路上靠。完全凭自己摸索也可以,但是有个人点拨一下,就要快得多。”

时间一晃到了九十年代,此时的孙之荣望向中国学术阵地,早已不只是清华一脉,而是遍布全国各地,有:内蒙古大学罗辽复(物理出身)、中科院生物物理所陈润生(生物物理出身)、北京大学来鲁华(化学出身)、天津大学张春霆(物理出身)、中科大施蕴渝(生物物理出身)、上海生化所丁达夫(数学出身)、云南大学昆明动物所刘次全(生物物理出身)、军事医学科学院基础医学科院吴加金(生物物理出身)等。(下篇将推出《罗辽复篇》,欢迎添加作者微信抢鲜交流,微信号:icedaguniang)

这群当时平均年龄不到五十岁的学者,即将推动中国生命科学进入一个新的主题——生物信息学。

罗辽复、陈润生、来鲁华、张春霆、施蕴渝、刘次全、丁达夫

群贤毕至,生物信息学的“黄金岁月”

九十年代,波诡云谲,群贤毕至。

吴旻院士(曾经任国家自然科学基金委生物学部主任)积极宣传生物信息学,他缠着绷带答辩,启动中国人类基因组计划;陈润生等积极与国际生物学家联系,首次引入生物信息学课程;杨焕明等人创立华大公司,推动中国科研与国际 HGP 接轨。这段精彩故事,请查看《陈润生院士:中国生物信息学启蒙、传承的三十年「大江大河」》。欢迎添加作者微信(微信号:icedaguniang)

1997年,两位在数理科学领域成绩卓著的科学家转入生信,一位是郝柏林、另一位是李衍达,则直接将中国生物信息学研究推向高潮。

陈润生院士曾对雷峰网表示,他们的加入之所以被称为“重要”,“一是分别时任中科院理论物理所所长、清华自动化系主任(现信息学院),他们带来的大批学术骨干,壮大了生物信息研究队伍;二是彼时他们已当选中国科学院学部委员(院士),很大程度上代表了学术风向,激发学界对生信研究的兴趣。”

李衍达、郝柏林

与此同时,孙之荣已经有过一年的国外访问经历,师从著名的皇家学会院士,英国伦敦大学Birkbeck College的Tom Blundell教授,不仅对生物信息学有了更深入的了解,也开阔了国际视野。

1997年,借着这股东风,李衍达、孙之荣结合自动化系、生物系两系之长,成立了国内第一所跨院系的“生物信息学研究所”。

孙之荣与Tom Blundell教授

事实证明,研究所一经成立就如同树立了一面旗帜,附近高校乃至于全国的零散学术力量都,就像拥有了主心骨似的自动凝聚,为此后召开生信学术活动奠定了深厚基础。

1998年,国内首届以“生物信息学”命名的研讨会,就在清华图书馆的学术报告厅内召开。

孙之荣称,早期小范围办会只取了一个“华北地区生物信息学研究会”的名字,清北、中科院、天津、内蒙古多地共50名教授予以支持,诸如,天津大学张春霆院士、中科院生物物理所陈润生院士,王志新院士、中科院理论物理所郝柏林院士,郑伟谋研究员、内蒙古大学罗辽复教授、北京大学的来鲁华教授等人。

而这次会议现场,还有一位特别的人,他就是时任清华科技处处长的龚克。

龚克世家治学,其父龚育之是中央党校的哲学工作者,是我国科学技术哲学和相关学科的奠基人之一,其母孙小礼更是书香门第,上至祖父都与北大有着不解的缘分。龚克的出现,无疑代表了清华整体以及中国学术圈对生信这一新兴交叉学科的支持。

孙之荣等人踌躇满志,筹备全国生信大会的心愿变成一种迫切。

时下放眼全球,生命科学领域的火热程度可以用“新大陆”形容。几乎所有的全球大型制药公司做出重点部署,摩托罗拉、日立、佳能、惠普、IBM等科技公司多有涉足。就我国而言,彼时也有近30家科研机构涉及基因芯片。新世纪之初,基因组学一越成为“世界十大科技”榜首。

时局促动,孙之荣敏锐察觉,“此时正是召开全国生信大会的最佳时机。”

等办会公文正式下发,北京多家相关企业和机构纷纷前来报名承办,时任北京市生物医药中心主任的雷霆亲自找到孙之荣,不仅愿意出面组织会议,还要提供经费支持。2000年8月,第一届全国生物信息学大会在军事医学科学院召开。

与1998年的华北会议相比,孙之荣明显感觉到生信的发展更通畅了,会议现场也异于火爆。

“军事医学院校可容纳四百多人的大厅座无虚席,连过道和前后四个门口全都站满了人,说连落脚的地方都没有都不夸张。”

没办法,孙之荣和负责举办的贺福初、吴加金决定中途清场,以便让那些有“合法身份”(提前报名)的人得以入座,其他慕名而来者“见缝插足”。

值得一提的是,为了筹办这次会议,孙之荣还特意邀请了两位上海学者--丁达夫、赵国屏。他们在“863”项目中就与孙之荣结识,彼时都发展为上海生物信息学中心的中坚力量。

因此,对于他们的到来,孙之荣明显还有一层深意,借机促进北京上海两地的生信交流。

2001年9月,北京大学理论生物学中心(现为“北京大学定量生物学中心”)正式成立,重要成员有来鲁华、佘振苏、汤超、欧阳颀等人。

2002年,第二届全国生信会议便在北大举办。李衍达与孙之荣所建的“清华生物信息研究所”,也在2002年6月发展为国内首家部属“生物信息学教育部重点实验室”,吸引了来自生物系、自动化系、计算机系,物理系等学者的加入。而这也意味着,生物信息学正式从高校走向更大领域。


孙之荣自1996年开始指导博士生,博士毕业答辩合影

孙之荣称,自己的学术研究也正是从那时丰富起来。

他将机器学习用于蛋白质结构预测、亚细胞定位、AK-STAT的计算系统动力学模拟、计算机网络、复杂疾病系统生物学等方面,仅十篇论文共被引近5000次,其中一篇发表在《生物信息学杂志》的论文,单篇引用达1000多次。

蔡禄(现任内蒙古科技大学生命科学与技术学院院长)是孙之荣的博士后,曾在80年代师从内蒙古大学物理系罗辽复教授,2000年后来到清华,与孙之荣朝夕相处了整整两年。说起自己走上生信道路的缘由,他直言,自己正是被孙之荣的论文吸引而来,“他身上有一种多学科结合起来的秩序感。”

非典爆发、小人作怪,学会申请路难竞   

眼看生信发展逐步走上正轨,2002年11月初,非典爆发。

2003年5月北京成为疫情重灾区,第三届全国生信大会也因此泡汤,这一停就是六年。

实际上,这一时期国内外生信发展正如火如荼,四个HGP姊妹项目和Sc2.0项目于2003年启动,美国高校也普遍开设生物信息学系,国内团队不仅积极参与了这些项目,还斥巨资建立了基因组测序的基础设施,在水稻、蚕和熊猫等多个领域和物种上取得了许多发现。

毋庸置疑,有了这些项目实践,中国已是基因组测序领域的全球公认参与者,也更迫切与国外学者进行生信交流。

2003年11月,在中科院数学所陆汝钤院士的盛邀下,徐鹰回国举办“国际生物信息学研讨会”(IBW)总算补上了缺口。这段故事请看《90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生》。欢迎添加作者微信(微信号:icedaguniang)

徐鹰曾言,为了首届国际会议,各邀请了国内外十位教授,但几天会议下来大家都有点意犹未尽的感觉,孙之荣见状提议,“不如办成系列会议,下届会议就由清华举办。”由此,每两年一届的高校轮办传统沿袭开来。

此后,我国从事生物信息学的个人和团队迅速增加,例如哈尔滨医科大学,2004年3月正式批准成立了国内首个生物信息学系,李霞为系主任,郭政为副主任,2007年又在该系的基础上率先成立国内首家“生物信息科学与技术学院”。

陈润生曾评价,“没想到在中国的东北角竟有隐藏着如此进展。”

2008年,孙之荣、陈润生、郝柏林三人一致决定:重启全国生信大会,成立中国生信一级学会,两件事要同时进行,刻不容缓。

然而时过境迁,六年里不少产企头目偷梁换柱,巧借生信招牌盈私利,等到孙之荣等人想要重启大会时,竟无端生出诸多枝节。

无奈之下,孙之荣找到中国细胞生物学学会,只好将“中国生信学会”挂靠于该组织之下。有了这块“牌子”,孙之荣总算舒了一口气,至少不耽误办会。但他没想到的是,这个问题仅仅只是冰山一角。

2014年10月,第六届生信大会在江苏举办,孙之荣对这届会议印象深刻,因为此次会上建成“一级学会”的呼声很高。为此,孙之荣逐一拜访了九位院士(张春霆、李衍达、陈润生、郝柏林、强伯勤、沈岩、杨焕民、欧阳中灿、欧阳颀),希望争取他们的联名支持。

两个月后,孙之荣举着半臂高的材料去往科协,本以为能在新年到来前办成此事,却在科协向外征询意见时受阻,听口风得知,有好事者在背后说了坏话,声称生物信息学缺乏自身理论体系。

争执在所难免,但这一污名太过牵强。反复拉扯了两年后,2016年,中国科协终于写下“同意成立”四个字。

但此事远没有结束,民政部登记注册环节又被再度搁浅。时至今日,民政部以《社会组织登记管理条例》修订、领导班子更换为由,导致学会申请成为公认的“遗留问题”。

2015年清华生物计算30周年,生物信息20周年,孙之荣(居中)与实验室部分毕业研究生留影

当然也并非没有好消息。

2016年,中国科协审批通过后,为了能够开展各种学术活动,科协领导指示:同意中国生信学会采取“筹建”形式,保证正常的学术交流。而孙之荣也多了一个头衔--“候任”理事长。

如今,尽管中国生信学会仍顶着筹建的帽子,却已经有了实质性进展,16个专业委员会相继成立,全国16个省市也成立了地方生信一级学会。

在前不久的第11届生信大会上,有人问孙之荣,为何一定要坚持举办中国生物信息学大会,甚至可能牺牲个人学术和事业。

孙之荣百感交集,实际上这个问题他已经问过自己无数次。

他缓缓答道:“个性化的自由探索很重要,但在新的形势下,各种高维数据的产生、学科深度交叉、科学和技术的协同演变,迫切需要我们大家一起有组织的科研和攻关,系统解决国家和人民关心的重大问题。”

换句话说,这是属于孙之荣的人生命题。

半生奔波,不虚此行

回望七十余载岁月,孙之荣给自己评了个“不虚此行”。

2020年9月27日,第九届全国生物信息学与系统生物学学术大会,孙之荣从主持人手中接过了“中国生物信息学终身成就奖”的奖杯和荣誉证书。

很多人不清楚,孙之荣的一生没有院士头衔,因此,“终生成就奖”几个字的分量已经相当重。

实际上,这一荣誉是中国生物信息学学会(筹)颁发的首批中国生物信息学终身成就奖,获奖者均为我国生物信息学研究领域的开创者,表彰他们取得的重要学术成就和为我国生物信息学发展作出的巨大贡献。其他五位获奖人为陈润生院士、郝柏林院士、李衍达院士、罗辽复教授、张春霆院士。

作为几人中最年轻的学者,孙之荣也已经年过七旬。在他看来,这是同行对自己以往教学、科研工作的肯定,也是对自己多年来组织生信会议的认可。

在与雷峰网的对话结束之时,孙之荣教授似乎在回望自己的人生以及并肩前行的伙伴。

他说,“罗辽复远在内蒙,张春霆、李衍达先生也年事已高,郝柏林已经走了,但我和润生站在那,为的就是要把生物信息学的脉络延续下去。”

作者注:

自中国参与人类基因组计划以来,生物信息学科迎来大爆发。

在近三十年的时间里,一大批生物、化学、物理、计算等专业的学者,前仆后继加入到学科的产研建设,那是一个灵感迸发、情谊绵长的年代,也是一个走出质疑、迷茫的年代。

目前,雷峰网启动《生物信息学的三十年往事》专题,将陆续推出 陈润生、孙之荣、罗辽复、张春霆 等老一辈学者的人物故事,记录光辉岁月,以照后人之路。

本文作者吴彤关注生物信息学、AI制药、医疗机器人,欢迎添加作者微信(微信号:icedaguniang)交流。

]]>
医疗AI //m.drvow.com/category/healthai/kxLs2tL85ucG4tQX.html#comments Mon, 13 Mar 2023 14:18:00 +0800
第11届中国生物信息学大会圆满落幕,超1600人参加,老中青学者齐聚,师生全员出动亮眼 //m.drvow.com/category/healthai/t2b4J04D1TZXL0Cf.html “学生不仅要站着开会,为了能跟上诸位特邀嘉宾的报告进度,更是直接坐在地上记笔记,就连会场放水的桌子上都坐满了‘杰青’。”

这就是前不久在广州召开的第11届全国生物信息学与系统生物学大会(下称“全国生信大会”)的现场。

本届大会由中国生物信息学会(筹)主办,广东省生物信息学会及中山大学承办,主题为《生物信息学与系统生物学及其应用的最新前沿研究》,共设3个特邀主会场和16个分会场,参会人数达1600多人,创造历史新高。

实际上,如今的全国生信大会已经走过二十五载岁月,已成功举办十届,但每届会议都无一例外地吸引到各地生信专家和学者。不少人交口称赞,“这一大会已发展为中国生信领域学术水平最高、影响最大的全国盛会,是当之无愧的品牌会议。”

孙之荣教授

谈起本届大会的盛况,大会主席孙之荣教授颇有感慨,“举办一场生信会议的念头由来已久,大概要追溯到1998年之前。早期小范围办会只取了一个“华北地区生物信息学研究会”的名字,清北、中科院、天津、内蒙古多地教授予以支持。新世纪后生信大会因为非典原因停办六年,后来有了各地高校教授的帮助,会议愈发成熟,成了一个大团队,感谢同道的帮助。”

老中青学者齐聚,“全员出动”成为一道风景线

事实上,本届会议原定于去年10月,因疫情爆发两次延后,直到今年年初管控放开,各地高校教授的的参会热情已经非常高涨。

作为组织者和参会者之一,本届大会执行秘书长为中山大学数学学院的张家军教授。他对雷峰网表示,“这会更加考验团队凝聚力和执行力问题。从决定举办并确定日期算起,留给我们的实际筹备时间仅有3个月,而往届会议会有一年的筹备时间。”

在人手有限、疫情干扰以及时间压缩的情况下,本届大会在会议嘉宾和内容以及节奏的把控上,都获得了极高的评价。

张家军教授(居中)与本届大会志愿学生

其一,分会场覆盖面更广,农林畜牧等学科人才面孔增多,一线医生参会热情高涨。

该届大会覆盖了基因组学信息学、转化信息学与数据安全、生物医学数据挖掘与计算、人工智能与生命科学、非编码RNA与RNA信息学、重大疾病组学信息学、生物信息学算法研究、农林信息学、生物分子结构预测与模拟、网络生物学、多组学与整合生物学、计算合成生物学等生物信息学与系统生物学的多个前沿方向,共3个特邀主会场和16个分会场。

张家军教授表示,“诸如各地农林畜牧方向高校、研究所学者积极应邀。此外,大会还专设了重大疾病组学信息学分会,来自各地附属医院、医学研究所、高校医学院的一线医生都赶到了现场。”

而这也意味着,随着科学研究深入发展,组学研究才是最大化研究价值的出路。

墙报展区

其二,老中青学者齐聚,“全员出动”成为一道风景线。

本届大会聚集了来自全国各地1600多名专家、学者和行业从业者,覆盖了生命科学、物理学、信息学、医学等学科,包括南方医科大学侯凡凡院士、北京大学汤超院士、北京大学张泽民教授、哈佛大学刘小乐教授(线上)、中科大刘海燕教授、中科院生化所陈洛南、清华大学张强锋等7位学者,从各自的研究方向出发进行了40分钟的特邀报告。

侯凡凡、汤超、张泽民、刘小乐、刘海燕、陈洛南、张强锋

孙之荣教授表示,本届大会也在主会场专设了国家杰出青年学者的25分钟报告环节。

如,山东大学数学与交叉科学研究中心杨建益、清华自动化系汪小我、北京北京国际数学研究中心张磊、上海交通大学数学科学学院周栋焯、中南大学计算机学院李敏、复旦大学类脑人工智能科学与技术研究院赵兴明、中山大学生命科学学院杨建华、北大公共卫生学院葛颢、中山大学数学学院张家军等9位学者。

值得一提的是,雷峰网在会场观察到,不少教授携实验室学生全体出动。

浙江工业大学信息工程学院的张贵军教授表示,“尽管是第三次参会,但这次参会人数最多,师生十人同行。”

华中农业大学信息学院则直接是由院长张红雨、副院长李国亮带队,龚静、牛晓辉、全源、周强伟、王云龙、朱志贤、王振吉等多名师生参加会议。据该学院相关负责人介绍,“这次会议对促进与同行和行业从业者的交流和合作建立了可能。”

张贵军教授(中间戴胸牌)与实验室学生

其三,热闹的不止于大会参会人员,本次大会的展商区也云集了十多家相关公司。

如,位列“明星展位”的中科曙光、火山引擎、亚马逊科技,以及“标准展位”的毅硕科技、深圳国家基因库、曼迪匹艾(北京)、万乘科技、上海序祯达生物、安诺优达、北京并行科技、深圳华大智造。

据其中一家展商介绍,“线下参展的好处是,能直观感受到产学研各界的热情,不再是一头热一头冷。现在我们最大的挑战是时不我待,只争朝夕。”

这句话也诠释了如今的生信大会正在从“小而美”走向“大而强”。而在这场变革中,小到前沿学科建设、中端技术转化、后端产业承载,都在尝试作出最有力的回应。

蛋白质预测&设计成为主看点,功能性蛋白质设计仍是技术难题

本届大会如此火爆,很大程度上证明了生命科学产业风云变幻,机遇丛生。

正如全国人大常委会副委员长陈竺在贺信中所言,“当前新一轮科技革命和产业革命加速发展,生命科学创新突破方兴未艾,生物产业与信息产业深度融合,对全球生命健康事业发展和世界经济复苏具有十分重大的意义。”

其中,考虑到技术转化的难易程度,蛋白质预测与设计成为本届会议的两大看点,山东大学杨建益教授、中科大刘海燕教授的两场报告广受关注。

杨建益教授

山东大学数学与交叉科学研究中心的杨建益教授,以《AI在蛋白质结构预测中的应用》为题进行报告。

据悉,杨建益教授研究方向包括蛋白质结构与功能预测、RNA结构预测等,并与密歇根是大学张阳、华盛顿大学David Baker等学者合作,成功开发I-TASSER 和trRosetta等著名结构预测算法。在去年的CASP15比赛中,杨建益教授带队获蛋白质单体结构预测组第一名。

会上,杨建益教授首先详细介绍了蛋白质结构预测的基本原理与应用。

他表示,蛋白质结构预测的目标是从蛋白质的氨基酸序列出发,通过算法设计和开发,构建准确的三维结构模型。随着深度学习的发展,如今蛋白质结构预测方法主要分为三种:基于模版的同源建模、基于蛋白质分子电子结构的第一性原理的从头预测、基于深度学习的蛋白质结构预测。

而后者又可以分为两部分,其一是从二维图到三维结构的“两步走”法,代表性方法有AlphaFold1(DeepMind)、trRosetta(杨建益)、ProFold(卜东波)、RaptorX(许锦波);其二从神经网络到三维结构的端到端预测方法,涵盖AlphaFold2(DeepMind)、RoseTTAFold(David Baker)。

随后,杨建益教授结合CASP15的比赛表现,进一步介绍了两种方法的融合方式。

他表示,trRosetta的方法主要包括两部分,一是通过深度学习算法预测蛋白质残基间的几何信息、二是把这些信息转化为Rosetta的能量项,通过能量最小化方法快速从头预测蛋白质结构。而参赛的trRosettaX2,是在以前trRosettaX的基础上,改进了氨基酸距离和角度的预测,并用trRosetta的能量函数进行折叠。而对于trRosetta预测不好的结构,则直接使用了AlphaFold2的预测结果。

刘海燕教授

此外,在本次会议中,刘海燕教授以《基于AI的蛋白质从头设计》为题进行了特邀报告。

刘海燕教授于1990年毕业于中科大生物系,1996年1月获中科大博士学位。1998年11月-2000年11月先后在美国杜克大学化学系、北卡罗来纳大学生物化学与生物物理系作访问研究。2001年起在中国科学技术大学生命科学学院担任教授,博士生导师。主要研究方向为蛋白质设计、蛋白质分子动力学模拟方法及应用,在相关领域发表学术论文90余篇。

近年来,刘海燕教授主要开展数据驱动蛋白质设计方法研究,提出并实验验证了统计能量模型SCUBA和ABACUS,可分别用于主链结构和氨基酸序列的从头设计。

会上,他详细介绍了以上两种模型。他表示,近年来,国际上蛋白质从头设计的代表性工作主要采用RosettaDesign——使用天然结构片段作为构建模块来拼接产生人工结构。然而,这种方法存在设计结果单一、对主链结构细节过于敏感等不足,显著限制了设计主链结构的多样性和可变性。

因此,刘海燕教授,陈泉副教授及团队,基于数据驱动原理,开辟出一条全新的蛋白质从头设计路线,在蛋白质设计这一前沿科技领域实现了关键核心技术的原始创新,为工业酶、生物材料、生物医药蛋白等功能蛋白的设计奠定了坚实的基础。

据悉,该团队首先建立了给定主链结构设计氨基酸序列的ABACUS模型,进而发展了能在氨基酸序列待定时从头设计全新主链结构的SCUBA模型。理论计算和实验证明,用SCUBA设计主链结构,能够突破只能用天然片段来拼接产生新主链结构的限制,从而显著扩展从头设计蛋白的结构多样性,甚至设计出不同于已知天然蛋白的新颖结构。

刘海燕教授表示:“SCUBA模型+ABACUS模型,构成了能够从头设计具有全新结构和序列的人工蛋白完整工具链,是RosettaDesign之外目前唯一经充分实验验证的蛋白质从头设计方法,并与之互为补充。”

值得注意的是,相关成果已于2022年2月10日发表于《Nature》,目前论文展示了9种从头设计的蛋白质分子的高分辨晶体结构,其中5种蛋白质具有不同于已知天然蛋白的新颖结构。

但从另一方面而言,尽管上述两项技术研发已经有了明显的进展,但生信学者还需要着眼于未来。

“预测和设计的技术实现是一回事,但设计出适合下游工业生产的特定功能蛋白,又是一回事。”张贵军教授分两方面指出,

“就预测而言,最大的问题是无法做到冷冻电镜一样的动态预测,AI模型拟合出来的是静态的蛋白质结构;就设计而言,脱离实验室条件,人工设计的蛋白质安全性、稳定性、耐药性如何都不得而知,而能否适合工业生产又有很多不确定性。”

龚新奇教授进一步补充道,“可以理解为,高校学者和业界学者,对于技术转化的周期估计并不相同,业界认为转化成果将很快出现。”

他举了两个例子,比如,西湖欧米创始人郭天南教授,与医院合作研究新冠病毒感染者多器官的蛋白组表达差异,将推动药物和治疗方法等产品转化;清华丘成桐教授也与北京政府合作,在雁栖湖建立应用数学研究院,希望招聘300个世界最好的数学家,专门做“AI+生物医学”的事情。此前丘成桐建立的清华三亚国际数学论坛,目前也在向生物育种领域靠拢。

周耀旗教授形容道,“数学家也想要做技术转化,看来生命科学是块‘大油田’。”

周耀旗教授、龚新奇教授

总体来看,作为一门交叉学科,生信整合数学、物理、计算机等理工学科,以及生命科学、医学、药学等医农学科。但直到今天,生信的学科价值愈发体现在转化应用。

换句话说,当数学家、生信学者以及各行各业都在考虑技术转化时,或许生命科学的帷幕才被徐徐拉开。

这些年来,全国生信大会在各地高校留下根基,先后在哈尔滨医科大学、东南大学、电子科技大学、澳门大学、同济与复旦、四川大学举办。时至今日,大会主席孙之荣仍能清晰记得每届承办单位的主要负责人:

华中科技大学肖翌、浙江大学钟伯雄,陈铭、哈尔滨医科大学李霞、东南大学孙啸、成都电子科技大学郭锋彪,黄健、澳门大学张晓华、上海同济大学张勇,复旦大学赵兴明,田卫东、四川大学沈百荣、以及本届会议负责人,中山大学周天寿,张家军。

最后,孙之荣教授对所有生信同道作出寄语,“在各位同行的努力下,生物信息学在中国蓬勃发展,已经产生了大量重要研究成果,其在生物医药等研究领域的引领作用日益凸显;生物信息学的发展前景非常好,希望领域内的研究人员能够不断创新,坚持初心,传承精神。我们也要更加紧密团结在中国生物信息学学会(筹)的旗帜下,为祖国的强盛和人民的幸福做贡献。”

]]>
医疗AI //m.drvow.com/category/healthai/t2b4J04D1TZXL0Cf.html#comments Sat, 04 Mar 2023 10:49:00 +0800
继AI绘画、AI聊天后,没学过生物的「门外汉」也能「一键生成」蛋白质 //m.drvow.com/category/healthai/cSjOyP1rbNlxUBzM.html

过去,一个博士生直到毕业,恐怕并未见过蛋白质设计出来的样子--需要一段一段敲掉某些天然蛋白质片段,再人工设计、拼补上去。现在科研人员通过AI模型一次性提交几十个蛋白质设计需求,几个小时后便马上收到一份设计结果和分析报告。生命科学的下一个时代,似乎来了。

ChatGPT引发的新一轮AI浪潮,正在席卷生命科学界。

2023年初,ChatGPT大火。继去年11月30日上线第5天用户获增100万,如今短短两个月时间,ChatGPT日活用户已超1亿,成为历史上增长最快的消费级应用程序。直到今天,与之相关的讨论仍层出不穷。

伴随着ChatGPT的火热,国内市场也很难平静。

百度、阿里、腾讯、网易、京东、360、字节等耳熟能详的大厂接连入局,一度将“AI大模型”推向主流;不少小型企业借助这一概念抬高股价,就连求职榜上的算法、NLP、AIGC等相关岗位,也涌入了一波又一波的年轻人。

ChatGPT再次将AI技术推向幕前,最令人惊喜的莫过于生成式AI与生命科学的深度融合。

近日,国内AI公司天壤智能发布了基于扩散的生成模型TRDiffusion,这是一种蛋白质设计的新方法。

TRDiffusion从零开始创造,生成全新的蛋白质结构,而非自然界中已经存在的天然蛋白质。在相同计算资源配置和时间内,TRDiffusion完成的设计数量提升了2倍以上,设计结果与之前方法的结果表现出更强的多样性。

实际上,早在2022年9月,天壤就上线了蛋白质工作台xCREATOR,实现“一键设计满足描述的蛋白质”等需求。

“相比较而言,新模型将蛋白质设计周期从两天缩减为几小时,改变了过去‘延迟满足’的设计模式。”

天壤创始人,CEO薛贵荣对雷峰网&《医健AI掘金志》表示,“换句话说,一个分秒必争的蛋白质设计时代正在悄悄拉开帷幕。

基于扩散的蛋白质生成模型,或成第四代蛋白质设计新方向

蛋白质是一种含有特定氨基酸序列的分子,因其空间结构的不同,决定了生物学功能的差异。

因此,当天然蛋白结构功能,不能满足工业或医疗应用需求时,想要得到特定的功能蛋白,就需要对其结构进行设计。

然而,自20世纪80年代以来,蛋白质设计却一直受限于人类对蛋白质折叠的理解不足而停滞不前。

苗洪江来自天壤XLab,是该实验室的负责人。

他表示,蛋白质设计最早出现在20世纪80年代,共经历三个阶段:

第一代蛋白质设计通过简单化学原理指导二级结构片段的组装。

第二代蛋白质设计加入了专家经验,通过序列-结构关系指导结构片段组装。

第三代有了明显突破,一方面借助更大的天然蛋白质数据库增加结构片段多样性,同时借助从已知结构中终结的物理及知识能量函数,寻找能量最小的目标蛋白质。

苗洪江

但总体来说,前三代设计方法都存在极大限制,比如过度依赖专家经验或者天然蛋白质。直到21世纪,随着蛋白质三维结构数据的快速增长,尤其是2020年底,AlphaFold2在高精度蛋白质结构预测上取得了革命性进展,获得了蛋白质序列与结构之间的高纬关联,以AI主导的蛋白质设计也随之爆发。

正如深圳湾实验室周耀旗教授所言,“在后AlphaFold时代,大家自然而然地想要解决一个实用的反问题:根据某个功能的结构,设计出相应的、能够折叠成这样结构的蛋白质序列。现在,几乎每隔一小段时间就有一篇AI蛋白质设计的预印论文出现。”

2022年,AIGC绘画爆火,普通人只要用语言给出描述、或者几个关键词,就可以用AI程序生成一张媲美专业画师的作品。

与此同时,AIGC背后的关键技术--“扩散模型”也成功出圈,一度启发了计算生物学家。

2022年12月1日,蛋白质设计领域的领军人物David Baker、波士顿的蛋白质设计公司Generate Biomedicines,同天宣布“将AI绘画领域的扩散模型融入蛋白质设计中”。

然而问题随之而来,“基于扩散的蛋白质生成模型”究竟有何优势?

据苗洪江介绍,“相比其它模型,基于扩散的生成模型更接近人的思维模式,也是AIGC拥有开放性创造力的原因之一。其工作原理是通过连续添加高斯噪声来破坏训练数据,然后通过反转噪声过程来学习恢复数据。”

通俗来讲,在环境中,气体分子会高浓度区域扩散到低浓度区域。这一过程也类似噪声逐步扩散,最终导致声场充满噪音。如果这一原理逆用,则是不断“去噪”,露出事物“真面目”的过程:

首先,生成一张充满大量噪声的图片;

再基于 AI 能力,一边猜测哪些对于最终的图像而言是“噪点”,将其去除,那么剩下的便是所需的“信息”;

通过迭代,在噪声中反复提取出“信息”,最终生成被指定的图片。

事实上,天壤此次带来的TRDiffusion模型,正是采用的扩散模型。

苗洪江进一步介绍,“当TRDiffusion模型生成蛋白质时,是将蛋白质中每个残基的主链结构,看成可以自由移动的刚体,生成结构的初始坐标为随机噪声。再通过‘去噪模型’,逐步地将随机分布的残基,移动及组装成合理的蛋白质三维结构。”

天壤TRDiffusion的原理图示:不断去噪,设计出新的蛋白质

值得一提的是,蛋白质设计是结构预测的逆向问题。有人形容道,“两者像是「序列——结构」这道题的正反求解。已知序列、求解三维结构,是结构预测;设定某个三维结构、求解序列,便是蛋白质设计。”

因此,此前天壤自研的蛋白质结构预测模型TRFold,也顺势被TRDiffusion二次利用。

苗洪江解释道,“TRDiffusion中的‘去噪模型’,继承了结构预测模型TRFold的主体网络结构,并利用TRFold权重作为初始化,满足空间旋转平移等不变性。”

目前测试结果显示,在相同计算资源配置和时间内,TRDiffusion完成的设计数量较之前模型提升了2倍以上,设计结果与之前方法的结果表现出很强的多样性,比如自由设计、复合体设计、对称性设计、局部多样性优化、功能蛋白质设计、结合配体设计等设计需求,更能针对用户设定的目标蛋白质局部或整体结构、蛋白质分类、种属及功能标注等进行调控和设计。

天壤 TRDiffusion 生成的全新的蛋白质结构

据苗洪江介绍,该模型将在2023年2月下旬上线蛋白质工作台xCREATOR。届时,用户只需在平台输入目标蛋白质的简单描述,如序列长度、结构对称性、目标功能motif、结合配体结构、化学计量等,即可“一键生成”满足描述的蛋白质。

蛋白质设计风口已来,业界比拼大模型热情不减

实际上,在2023年当下这个时间点,蛋白质设计领域早已暗潮汹涌。

早在去年年底,国外就有三家公司竞相发布了蛋白质设计的新模型。

如前文所述,2022年12月初,华盛顿大学David Baker团队发布了RFDiffusion,用扩散模型设计出多种与天然蛋白质截然不同的全新单链蛋白质及复合体,目前已制造出一种可以与甲状旁腺激素结合的全新蛋白质。

据悉,RFDiffusion也可向多个方向扩展应用,比如该技术最近已扩展到核酸和蛋白质-核酸复合体,后续也将也扩展到设计小分子结合蛋白。

同日,由生命科学顶级风投Flagship Pioneering孵化的蛋白质设计公司Generate Biomedicines,发布扩散蛋白生成模型Chroma,可根据预设要求设计蛋白质序列和结构。

2022年1月,该公司曾一举拿下自Amgen(安进)的5个订单,预付款约5千万美元,潜在合约价值超19亿美元。公开资料显示,5个靶标全部用于开发蛋白疗法,预计生产达百万量级,并透露安进将参与Generate的新一轮融资。

更为重要的是,波士顿拥有全球闻名的医疗机构,从综合性医院、肿瘤专科医院到儿童医院,以及世界Top20制药公司,在医疗集聚方面有着巨大成就。而这层背景,或将助推Generate抢占市场先机。

在蛋白质设计领域,也不乏众多后起之秀。

其中Meta公司的ESM2、加州伯克利的一家初创公司Profluent的ProGen,则是仿造“ChatGPT”背后的大型语言模型(LLM),相继推出了蛋白质序列预训练大模型,实现可编程的蛋白质从头设计。对此,业内众说纷纭,乐观派称,“这项新技术可能会‘超越诺奖’--比2018年的定向进化蛋白设计技术更加强大。”

薛贵荣

天壤创始人,CEO薛贵荣对此颇有感触,“尽管这些公司的技术路径不尽相同,但这些模型和算法的集中爆发,意味着我们已经迈入了一个可编程的生物学新时代,最快年底会有一大波蛋白质设计被验证。

同时他也认为,如今蛋白质设计浪潮兴起,至少指出了三个可能:

一、沿用天然蛋白质设计的老路已经没有太大兴奋感,从头生成人工蛋白的AI系统已将蛋白质设计变得“可控化”、“批量化”、“广泛化”;


二、以蛋白质设计来讲,不管是在医疗应用、食品生产、工业应用、环境保护、可再生资源还是其他领域,都具备有非常广阔的应用场景,背后的商业价值正在被更多人看到;


三、ChatGPT作为第一个消费级AI爆款,是公众第一次亲身体验现代人工智能的强大功能,随着ChatGPT应用的增长、甚至“BioGPT”、“ProtGPT”的出现,人们会对AI产生越来越多的信任。

以上观点不难看出,对于国内从业者而言,借助风口深扎技术,为迎接未来工业需求做准备,显然已经成为自身发展过程中的重要命题。

与此同时,生成式AI技术的科研和工程实施还处于发展初期,除基座模型的角逐外,能否有更多公司参与到应用级创新,同样是决定生态繁荣的重要因素。

实际上,天壤并非初涉生命科学领域。早在2019年,旗下天壤XLab成立,专注于IT+BT融合发展,旨在将蛋白质开发从“机会性游戏”,转变为高确定性的、可预测的“工业化流程”,满足医疗、材料、能源和食品等领域对功能蛋白质的需求。

2022年,公司技术数项成果并出,陆续建成TRFold(单链结构预测,有MSA)、TRFold-Single(单链结构预测,无MSA)、TRComplex(复合体结构预测)、TRDesign(蛋白质设计)四大核心能力,并在去年9月推出国内首个蛋白质设计工作台xCREATOR。

至此,一条兼具“蛋白质结构预测+设计+开放平台”技术闭环搭建完成。

一定程度上说,在天壤此次技术升级之后,国内蛋白质设计市场的红利将进一步放大,后续将涌现出更多的“鲶鱼”,引发全社会对生命科学产业的关注。 

产学研合作已是大势所趋,大规模设计成为时代主流

人类发现蛋白质的时间不过两百年,大自然却花了上亿年形成蛋白质进化规律。直到今天,人们不能完全翻译这些规律,但仍然期待有一天可以通过发明强大AI工具,并对它发出设计蛋白质的指令。

这种期待是美好的,蛋白质设计前景也是广阔的,但当前,这一赛道尚处于孕育探索阶段。

就技术研发和应用角度考量,如何从模型生成的大量符合需求的蛋白质中筛选出最优的结构、如何评价这些蛋白质的功能和性质、是否有可能从模型的角度自动化进行筛选,仍然值得进一步讨论。

正如苗洪江所说,“和AI绘画、AI聊天不同,蛋白质设计的本质是科学创新,比如要对设计蛋白的稳定性、亲和力、寡聚性等特性进行预测及优化,否则就是‘伪蛋白’。”

实际上,针对这一问题,天壤的一大解决思路是与高校合作,“在实际项目过程中发现模型和平台存在的问题”。

去年9月,天壤公布蛋白质设计工作台——xCREATOR,其设计初衷,即解决跨领域技术门槛高、工作流程碎片化的问题,目标是在同个工作台上一站式地完成全部蛋白质设计项目。

目前,xCREATOR工作台已集成了市面上优秀的算法,包括天壤XLab自研的算法与所有外部开源和合作伙伴的算法。尤为重要的是,这款平台供高国内外高校师生免费使用,一方面能够提供更开放的学术环境,为前沿项目提供技术支撑;另一方面,对于尚未建设湿实验室的天壤来说,来自各大高校的真实实验数据反馈,也成为天壤升级蛋白质设计算法的重要基础。

薛贵荣举了个例子,“过去博士生做蛋白质设计,需要一段一段敲掉某些片段,再人工设计拼补上去,等到毕业了还没有见过蛋白质设计出来的样子。相比较而言,现在学生可以一次性提交几十个蛋白质设计需求,几个小时后马上收到一份蛋白质设计结果和分析报告。”

站在平台的角度上,天壤越来越明确提供工具的角色定位,追求开放化的思路。

薛贵荣提到,未来天壤要两条腿走路,重点打造干湿一体化实验室,从计算平台走进实验平台,真正从产业端的角度推动前端的蛋白质设计工作。

据悉,目前天壤XLab团队从头设计了适用于多种疾病的人工蛋白质候选药物,如新冠刺突蛋白结合剂,能够有效阻止刺突蛋白和人体ACE2蛋白结合;以及IL-2类似物,能够激活特定淋巴细胞,同时避免当前IL-2类药物毒性;可用于捕捉和封存二氧化碳的碳酸酐酶,相比于天然碳酸酐酶,其长度仅为天然碳酸酐酶的1/3左右,稳定性更高,成本低廉便于工业应用。目前,这些蛋白的计算设计工作都已完成,正在推进实验检验。

这似乎又开始了让人熟悉的剧情。场景的吸引力、模式的吸引力,本质上,都是内容和技术的原始创新。

当实现蛋白质设计日吞吐量达到上千上万,甚至更多时,蛋白质设计将彻底告别‘束手束脚’的日子,一个真正的生命科学时代才算到来。

GAIR LIVE|讲座预约

| 生物计算“奥赛”冠军论道:当生命科学遇上史诗级AI,何去何从?

日前结束的第41届JP摩根医疗健康大会上,科技公司Nvidia的报告指出,“或许很快,基于AlphaFold2精准解析蛋白质三维结构,再加上能从头生成人工蛋白质设计技术,就会给生物学领域带来一场新的变革。”

为了更加深入、系统地讨论生命科学技术的落地,2月23日(本周四20:00),我们邀请了CASP15四支冠军团队,论道:《当生命科学遇上史诗级AI,何去何从?》

智峪生科董事长,CEO王晟担任主持、密歇根大学计算医学及生物信息学系郑伟、浙江工业大学信息工程学院张贵军教授、江苏理工学院生物信息与医药工程研究所常珊教授、智峪生科CTO熊鹏共同参与讨论。

读者可扫描文章底部海报的二维码,添加策划人吴彤微信(微信号:icedagunaing),备注“姓名+职位”,后续我们会邀请您进入专家社群,并将您的问题收集、汇总,反馈给参会嘉宾,在讨论环节进行解答。

关于GAIR Live

“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网与中国计算机学会(CCF)合作创立的CCF-GAIR大会,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。

经过几年发展,GAIR大会已成为行业标杆,是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。

GAIR Live作为雷峰网旗下视频直播品牌,旨在输出新鲜、深度、原创的大咖访谈与对话内容,打造辐射产、学、研、投的特色线上平台。

 雷峰网雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/cSjOyP1rbNlxUBzM.html#comments Thu, 23 Feb 2023 11:55:00 +0800
讲座预约丨生物计算“奥赛”四大冠军团队:当生命科学遇上史诗级AI,何去何从? //m.drvow.com/category/healthai/iHFvLUbLgpF47ehX.html 人们普遍认为,人工智能曾经历过两次热潮,现在迎来了第三次热潮。

1956年8月,在美国汉诺斯小镇的一所学府中,十位来自数学系、计算机系、物理系的学者和凑在一起,讨论着一个完全不食人间烟火的主题:用机器来模仿人类智能。

会议足足开了两个月的时间,虽然大家没有达成普遍的共识,却为会议讨论的内容起了一个名字:人工智能。

因此,1956年也就成为了人工智能元年。

此后的十几年里,关于这项创新技术的讨论不止不休,科学家们却窘然发现,这一技术最终只能解决拼图以及一些简单的游戏。甚至不少人戏谑人工智能的命名者John McCarthy,“他只能聊,没干货。”

20世纪70年代,人工智能陷入低潮。如今半个世纪过去,人工智能技术在1980年代和2010年代两度掀起热浪,又两度遇冷渐熄。不少学者直言:“坐上了学术冷板凳,就要耐得住寂寞。”

实际上,如果仔细比对这段历史会发现,几乎每一次浪潮兴衰都关乎同一命题:“人工智能”能否带来实用性成果。

在决定人类前途命运的生命科学领域,这一问题尤为迫切。

幸运的是,这两年来,这一领域终于有了实质性突破:

2020年11月,DeepMind开发的AlphaFold2,预测出了2亿多蛋白质的结构宇宙,生物计算技术达到了人类利用传统实验技术的预测水平。

2021年10月,DeepMind又推出AlphaFold-Multimer,用于蛋白质复合物的预测,特别是对结合界面结构的预测,可以预测多达几千个残基的复合物。

2022年11月,在素有生物计算领域“奥运会”之称的CASP15赛上,首设蛋白质复合体预测、RNA结构预测两大赛道,华人团队表现亮眼。

诸如:

成立于2021年4月的智峪生科,熊鹏、王晟带队获RNA结构预测第一名;


江苏理工学院生物信息与医药工程研究所所长常珊,带队获蛋白质-小分子配体复合物结构预测组第一名;


浙江工业大学信息工程学院教授张贵军教授,带队获准确性赛道复合物接触残基精度评估第一名;


山东大学数学与交叉科学研究中心杨建益教授,带队获蛋白质单体结构预测组第一名;


密歇根大学计算医学和生物信息学系博士后研究员郑伟,获蛋白质单体单结构域、蛋白质单体多结构域、蛋白质复合体结构预测类别等赛项第一名。

如果说以上战绩还仅仅停留在“发现”层面,那么近期蛋白质设计技术“狂飙”,则直接进入到“发明”阶段。

去年12月1日,华盛顿大学David Baker团队发布了RFDiffusion、同日波士顿蛋白质设计公司Generate Biomedicines发布了扩散蛋白生成模型Chroma、同月Meta发布基于150亿参数的ESM2语言模型。今年年初,加州伯克利一家初创公司Profluent采用类似ChatGPT的蛋白质工程深度学习语言模型——Progen,最近国内天壤团队也自研了一款扩散模型TRDiffusion,多种人工设计的非天然蛋白质已进入实验验证阶段。

这不难让人想到,日前结束的第41届JP摩根医疗健康大会上,科技公司Nvidia的报告指出,“或许很快,基于AlphaFold2精准解析蛋白质三维结构,再加上能从头生成人工蛋白质设计技术,就会给生物学领域带来一场新的变革。”

回顾往昔,人工智能再不是“阳春白雪”的代名词,科学技术要“接地气”,而不久的将来,每个人都将成为这场产业变革的见证者。

为了更加深入、系统地讨论生命科学技术的落地,2月23日(本周四20:00),我们将举办主题为《生物计算“奥赛”四大冠军团队:当生命科学遇上史诗级AI,何去何从?》的线上圆桌论坛。

智峪生科董事长,CEO王晟担任主持、密歇根大学计算医学及生物信息学系郑伟、浙江工业大学信息工程学院张贵军教授、江苏理工学院生物信息与医药工程研究所常珊教授、智峪生科CTO熊鹏共同参与讨论。

读者可扫描文章底部海报的二维码,添加策划人吴彤微信(微信号:icedagunaing),备注“姓名+职位”,后续我们会邀请您进入专家社群,并将您的问题收集、汇总,反馈给参会嘉宾,在讨论环节进行解答。

嘉宾介绍

主持人:上海智峪生科CEO,王晟

现任上海智峪生科CEO。

王晟博士拥有近20年蛋白质结构研究及算法开发经验,本科毕业于上海交通大学生命科学院,并在中科院理论物理所获得博士学位,博士后研究师从芝加哥丰田计算技术研究所教授许锦波,作为核心开发者开发出RaptorX-Contact方法。该方法的蛋白质预测精度最高达到80%。2022年5月,王晟正式加入智峪生科担任CEO,此前他是腾讯AILab的高级研究专家,主导开发了tFold工具。

王晟博士在国际知名期刊上发表论文60 多篇,会议论文近30篇,包括计算生物的知名会议ISMB、RECOMB、ECCB等,以及计算机视觉/机器学习领域知名会议CVPR、AAAI等 。Google Scholar引用接近5000次,H-index为28。凭借在生物信息技术与合成生物学领域的成就,入选美国斯坦福大学发布2021年度“全球前2%顶尖科学家榜单”。

江苏理工学院生物信息与医药工程研究所,常珊

江苏理工学院生物信息与医药工程研究所所长,教授,硕导、江苏省生物信息学专业委员会委员、美国密苏里大学哥伦比亚分校博士后、江苏省生物医学工程学会教育与科普专委会委员、《数据采集与处理》第七届编委会委员、CASP15中获蛋白质-小分子配体复合物结构预测组第一名。

常珊教授主要研究方向为人工智能辅助药物设计、机器学习、高性能计算和分子识别、脑机接口和穿戴式智能设备等。

曾多次参加由欧洲分子生物学实验室和欧洲生物信息研究所发起的国际生物大分子相互作用预测竞赛(CAPRI),排名位居国际前列。在国内外期刊及会议上发表学术论文120余篇,被SCI检索90篇,EI检索30篇,Googlescholar引用超过1400次,H指数为21,获得软件著作权15项,申请发明专利33项(授权9项),参与出版专著3部,译著1部。主持国家自然科学基金等各类项目十余项。

密歇根大学计算医学和生物信息学系博士后研究员,郑伟

密歇根大学计算医学和生物信息学系博士后研究员,CASP15中获蛋白质结构预测等赛项第一名。

郑伟博士本硕博毕业于南开大学,先后师从胡刚教授,阮吉寿教授,学习蛋白质结构生物信息学基础。2015年后,博士最后两年,在密西根大学张阳教授实验室进行访问交流,2017年博士毕业后在密西根大学张阳教授实验室,继续从事AI辅助蛋白质结构预测等相关研究。

郑伟博士主要研究兴趣涉及蛋白质结构预测、蛋白质功能注释。其主导开发的C-I-TASSER、C-QUARK、D-I-TASSER、DMFold-Multimer等算法相继在第13、14、15届世界蛋白质结构预测大赛(既CASP)中多次获得多项赛事第一名。基于这些算法构建的在线服务器,已为世界100多个国家6万多用户提供过关于蛋白质结构方面的服务。

郑伟博士在Nature Communications、PNAS、Science Advances、Nucleic Acids Research、Bioinformatics,Briefings in Bioinformatics等SCI期刊发表论文50多篇。Google Scholar引用接近1700次,H-index为21。

浙江工业大学信息工程学院,张贵军教授

浙江工业大学信息工程学院教授,博士生导师,浙江省高等学校中青年学科带头人,浙江省生物信息学学会秘书长、理事,浙江省生物信息学学会人工智能专委会主任,CASP15中获准确性赛道复合物接触残基精度评估第一名。

张贵军教授本硕毕业于太原理工大学,2004年获上海交通大学获博士学位,2004年至今在浙江工业大学信息工程学院任教。目前主要研究方向为结构生物信息学、人工智能与计算智能。

近5年来,主持科技部科技创新2030-“新一代人工智能”重大项目课题2项、国家重点研发项目子课题1项、国家自然科学基金项目2项、浙江省自然科学基金重点项目1项;第一作者(含通讯作者)在PNAS、Communications Biology、Nucleic Acids Research、Bioinformatics、BIB、JCIM等生物信息学期刊,TEVC、TCYB、TCBB、TNB等IEEE汇刊上发表研究论文50多篇;授权发明专利近100项,其中专利转化10项;获得中国自动化学会自然科学二等奖1项;带领课题组开发了SADA系列、PAthreader、DeepUMQA系列、MMPred、SNfold、DomBPred、MPDB等服务器、数据库及工具软件20余项。

智峪生科技CTO,熊鹏

智峪生科技联合创始人,CASP15中获RNA结构预测组第一名。

熊鹏博士2009年本科毕业于中国科大,并于2015年取得中国科大博士学位,之后分别在美国密歇根大学,中国科大以及澳大利亚格里菲斯大学从事博士后和研究员工作,目前任职于上海智峪生物科技有限公司。

熊鹏博士主要从事计算生物学研究,其开发的基于统计能量的蛋白质设计方法ABACUS,经广泛实验验证,可用于蛋白质从头设计以及稳定性改造;其建立的RNA统计力场BRiQ,在RNA高精度结构优化领域达到国际先进水平。

讲座信息

主题:当生命科学遇上史诗级AI,何去何从?

时间:2月23日(周四),北京时间20:00-22:00

主办单位:雷峰网 GAIR Live &《医健AI掘金志》

观看方式&加入专家群:

读者可扫描文章底部海报的二维码,添加策划人吴彤微信(微信号:icedagunaing),备注“姓名+职位”,即可加入专家群,观看此次线上论坛,实时交流与提问。

关于GAIR Live

“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网与中国计算机学会(CCF)合作创立的CCF-GAIR大会,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。

经过几年发展,GAIR大会已成为行业标杆,是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。

GAIR Live作为雷峰网旗下视频直播品牌,旨在输出新鲜、深度、原创的大咖访谈与对话内容,打造辐射产、学、研、投的特色线上平台。

]]>
医疗AI //m.drvow.com/category/healthai/iHFvLUbLgpF47ehX.html#comments Wed, 22 Feb 2023 16:05:00 +0800
讲座预约丨六位权威专家谈ChatGPT:生成式AI,是否会带来生命科学界的“小型革命”? //m.drvow.com/category/healthai/HU8sh4R0VAzlMDTN.html

ChatGPT的热度,不亚于2016年横空出世的AlphaGo和2020年的AlphaFold2:前者曾带动了计算机视觉在医疗的落地,后者则逼近了在生命科学特定领域的技术极限。如今,以ChatGPT为代表的生成式AI技术,能否成为生命科学进一步突破的技术引擎?

最近,ChatGPT在各行各业引起了不小的轰动。

微软“加仓”,美版头条BuzzFeed“押注”,就连国内科技巨头,百度、阿里、腾讯、网易、京东、360、字节……这些耳熟能详的中国互联网公司,也相继传出入局的消息。

沉寂已久的AI圈,似乎又回到了7年前AlphaGo时代的热情。

ChatGPT,不仅仅被看作是简单的新一代聊天机器人,它甚至代表着人工智能革命性的转折点。

此前曾给ChatGPT站台的比尔·盖茨也表示,ChatGPT等人工智能可以为阅读和写作提供优化,并在医疗保健和教育等领域切实提高工作效率,“阅读和写作现在已经在人工智能的能力范围内,这将产生非常广泛的影响。”

ChatGPT这把火,也迅速蔓延至AI生命科学圈。

最近,加州伯克利的一家初创公司Profluent传出消息,称采用类似ChatGPT的蛋白质工程深度学习语言模型——Progen,首次实现了AI预测蛋白质的合成。

对此,业内众说纷纭,乐观派称,“这项新技术可能会‘超越诺奖’--比2018年的定向进化蛋白设计技术更加强大。”

实际上,早在2022年底,国外就有三家公司竞相发布了AIGC×蛋白质设计的新模型。

华盛顿大学David Baker团队发布了RFdiffusion,用扩散模型设计多种多样与天然蛋白质截然不同的全新单链蛋白质及复合体;

Generate Biomedicines公司发布扩散蛋白生成模型Chroma,可根据预设要求设计蛋白质序列和结构;

Meta公司的ESM2,则用基于150亿参数的蛋白质序列预训练大模型实现可编程的蛋白质从头设计。

前不久,国内AI公司天壤也宣布进展,对外公开了升级版的蛋白质设计模型——TRDiffusion。结果显示,该款模型不仅适用于已支持的“一键生成满足描述的蛋白质”,而且在相同计算资源配置和时间内,蛋白质设计数量提升至2倍以上。

天壤创始人薛贵荣对雷峰网&《医健AI掘金志》表示,“尽管这些公司的技术路径不尽相同,但这些模型和算法的集中爆发,意味着我们已经迈入了一个可编程的生物学新时代。换句话说,与蛋白质设计相关的药物开发、疫苗开发、生物合成和清洁能源等产业,即将迎来产业大爆发的关键点。

一位业内人士更是直言,“今天ChatGPT的热度,不亚于2016年横空出世的AlphaGo和2020年的AlphaFold2:前者曾带动了计算机视觉在医疗的落地,后者则催生了生命科学的讨论热度。如今,以ChatGPT为代表的生成式AI技术,或将成为生命科学技术落地的一道‘催化剂’。”

不过,从前几年的实践经验来看,以计算机视觉为特征的AI,在医疗领域并未出现“革命性”的颠覆效应。

以ChatGPT为代表的AIGC,能否比肩AlphaGo或是AlphaFold2的出现?

AI生命科学的哪些成果,可以称之为AIGC?哪些可能只是蹭热点?

当AIGC大展拳脚,生命科学领域最明显的变化会是什么?对于生命科学而言,AIGC是否有不确定性或者危机?

这些问题的出现,对于生命科学领域以及计算机的从业者而言,都有着不同寻常的探讨空间。

为此,雷峰网将于2月15日(本周三20:00),举办《ChatGPT的一把火,能否烧到AI生命科学界?》的线上圆桌论坛。

本次论坛,将由中国人民大学数学学院龚新奇担任主持,中国科学院深圳理工大学(筹)计算机科学与控制工程学院院长潘毅、百图生科首席AI科学家宋乐、深圳湾实验室系统与物理生物学研究所资深研究员周耀旗、分子之心创始人许锦波,天壤创始人薛贵荣参与讨论。

读者可扫描文章底部海报的二维码,进入专家社群,我们会将您的问题收集、汇总,反馈给参会嘉宾,并在讨论环节进行解答。

嘉宾简介

主持人:龚新奇,中国人民大学数学学院教授

中国人民大学数学科学研究院教授,数学智能应用实验室负责人,中国生物信息学会(筹)理事,运筹学会计算系统生物学分会理事,中国计算机学会高级会员。清华大学北京结构生物学高精尖中心合作研究员,北京智源人工智能研究院特聘研究员,哈佛大学访问学者。

龚新奇教授主要研究兴趣是蛋白质相互作用复合物计算,目前已经发表SCI学术论文70多篇,包括理论模型、计算方法和生物应用三部分,发表的杂志包括Nature、Science、Nature Communications、Proteins和Science in China等学术刊物,论文被引用次数已超过2900多次,H指数26。

潘毅,中国科学院深圳理工大学(筹),计算机科学与控制工程学院,院长

中国科学院深圳理工大学计算机科学与控制工程学院院长,讲席教授、美国医学与生物工程院院士、乌克兰国家工程院外籍院士、欧洲科学与艺术院院士、中民协元宇宙工委会长。

潘毅院士在清华大学计算机科学与工程系获得本硕学位,1987年留美,1991年获匹兹堡大学计算机科学博士学位。此后主要任职为美国佐治亚州立大学,过去十几年间,潘毅教授该校陆续担任计算机系和生物系系主任、文理学院副院长等职位。

潘毅院士主要研究领域是以云计算、大数据分析、人工智能、深度学习等为工具,进行生物信息和医疗信息的研究。在此领域已发表250多篇SCI期刊学术论文,其中100多篇发表在顶尖的IEEE/ACM Transactions/Journals学术期刊上;另在国际学术会议录上发表150多篇学术论文,出版编著了40多本书。他的学术成果已被引用超过了20000,目前H指数90。

宋乐,百图生科首席AI科学家

世界知名的机器学习专家,现为百图生科首席技术官及首席 AI 科学家,负责干湿闭环高通量生物计算引擎的研发和相关战略工作。

宋乐博士是著名的机器学习和图深度学习专家,曾任美国佐治亚理工学院计算机学院终身教授、机器学习中心副主任,阿联酋 MBZUAI 机器学习系主任,蚂蚁金服深度学习团队负责人(P10)、阿里巴巴达摩院研究员,国际机器学习大会董事会成员,具有丰富的 AI 算法和工程经验。

2008年起,宋乐博士在卡内基梅隆大学从事生物计算相关的研究,利用机器学习技术对靶点挖掘、药物设计取得了一系列突破性成果,获得 NeurIPS、ICML、AISTATS 等主要机器学习会议的最佳论文奖。社区服务方面,他曾担任 NeurIPS、ICML、ICLR、AAAI、IJCAI 等 AI 顶会的领域主席,出任 ICML 2022 的大会主席,他还是同行评议期刊 JMLR、IEEE TPAMI 的副主编。

周耀旗,深圳湾实验室系统与物理生物学研究所资深研究员

深圳湾实验室系统与物理生物学研究所资深研究员。目前,周耀旗课题组通过计算和实验的结合,从事蛋白质/RNA的序列、结构与功能关系方面的基础研究和生物分子检测、药物开发方面的应用研究。

周耀旗教授从2021年3月起全职加入了深圳湾实验室,他是1984年中国科技大学近代化学系的学士,1990年美国纽约州立石溪大学化学物理的博士,1994-2000年北卡州立大学、哈佛大学的博士后,2000年任纽约州立布法罗大学助理教授,2004年升为终身副教授,2006年成为印第安纳大学信息学院和医学院终身正教授,2013-2021年任澳大利亚格里菲斯大学糖组学研究所正教授。

周耀旗教授长期在结构生物信息学方面工作,曾经多次在国际蛋白质结构预测和功能预测比赛中名列前茅。到目前为止共发表论文250余篇,引用1万6千多次,H因子68。

许锦波,分子之心创始人,美国芝加哥丰田计算技术研究所终身教授

分子之心创始人,美国芝加哥丰田计算技术研究所教授、《Bioinformatics》编委、清华大学智能产业研究院(AIR)访问学者,专注人工智能和计算生物学等研究方向的课题。

许锦波教授本科毕业于中国科学技术大学计算机系,硕士毕业于中国科学院计算技术研究所,2003获得加拿大滑铁卢大学博士学位,而后进入美国麻省理工学院数学系和人工智能实验室进行博士后工作,2022年回国创立公司分子之心。

许锦波教授的研究兴趣包括人工智能和机器学习、优化算法和计算生物学。他于2016年首次证明了深度学习可以大幅度提高蛋白质结构预测的性能,引领了人工智能在蛋白质结构预测领域的突破。

许锦波教授曾获美国斯隆研究奖、美国自然科学基金早期职业奖、《PLoS Computational Biology》创新突破奖、国际计算生物学顶级会议RECOMB最佳论文奖和时间检验奖 (Test-of-Time Award)。

薛贵荣,天壤创始人,CEO

天壤创始人、CEO,人工智能与大数据领域科学家、国家科技部云计算专家组成员、北航软件学院大数据专业的特聘教授、KDD中国分会、CCF人工智能专委会、CCF大数据专委会委员、ACM WWW Internet Monetization领域主席。

薛贵荣博士于2006年获得上海交通大学计算机博士学位,是首批全国优秀博士论文奖获得者。2006年至2009年,在上海交通大学计算机系担任副教授、特别研究员。2009年加入阿里,担任阿里妈妈大数据中心负责人和首席数据科学家。2016年创立天壤,带领团队先后在AI围棋、交通、金融、生物等领域取得重要突破。

薛贵荣博士的研究方向,主要为机器学习、信息检索、互联网营销、大规模数据分析和分布式计算,是国内第一位在全球搜索领域顶级会议ACM SIGIR上发表论文的学者,曾在世界顶级会议NIPS、ICML、SIGKDD、SIGIR、WWW与世界顶尖刊物ACM TOIS、ACM TIST等发表论文70余篇,拥有专利十余项,论文引用达9000+。

讲座信息

主题:ChatGPT的一把火,能否烧到AI生命科学界?

时间:2月15日,北京时间20:00-22:00

主办单位:雷峰网 GAIR Live &《医健AI掘金志》

观看方式&加入专家群:

扫码关注《医健AI掘金志》,对话框回复关键词“参会”,即可加入专家群,观看此次线上论坛,实时交流与提问。


关于GAIR Live

“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网与中国计算机学会(CCF)合作创立的CCF-GAIR大会,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。

经过几年发展,GAIR大会已成为行业标杆,是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。

GAIR Live作为雷峰网旗下视频直播品牌,旨在输出新鲜、深度、原创的大咖访谈与对话内容,打造辐射产、学、研、投的特色线上平台。

]]>
医疗AI //m.drvow.com/category/healthai/HU8sh4R0VAzlMDTN.html#comments Tue, 14 Feb 2023 16:00:00 +0800
医疗AI与数字化的时代机遇,谁能做好行业的“领航员”? | 2022雷峰网「飞天入地出海 」年度科技榜 //m.drvow.com/category/healthai/xi5d4BOBmIzuXWSp.html 过去数年间,AI技术深入到医疗行业的方方面面,近千亿资金在短短五年内注入医疗AI赛道,催生出一批又一批的新企业。

对这些企业而言,如今最重要的命题是,医疗行业的特殊性与严格的法规监管之下,如何在激烈的竞争中脱颖而出,摆脱只流血、无输血、不回血的“商业断链”窘境?

而这个问题的核心在于,触达医疗行业数字化转型深处的难与痛,提升产品的可用性、可行性和可复制性。

以医学影像AI产品为例,上海长征医院放射诊断科主任刘士远教授曾坦言,当前的AI影像产品存在三大问题:一是实际可用的产品比较少;二是产品性能不可靠;三是不能很好地嵌入现有的工作流程,以及临床实用性不强。

医疗行业的AI和数字化应用,从来不是坦途。所幸的是,仍有一些优秀企业潜心打磨产品方案,打造了一个个标杆案例,为医疗机构提质增效,为医生和患者提升工作与就诊体验,提供了最前沿和最落地的科技武器。

为此,雷峰网启动2022《飞天入地出海》年度科技榜评选工作,在过去数月时间里,从技术飞天、应用入地、商业出海三个最佳维度,人工智能、城市物联AIoT、工业智造、汽车技术、企业服务、商用机器人、未来交互、消费电子、芯片、医疗AI与数字化、云与数据基建等12个垂直领域中,筛选出49家标杆企业。

其中,在医疗AI与数字化领域,中国平安、推想医疗、深透医疗、联影智能、分子之心成功入选入地榜单,并分别获得该领域的寿险数字化转型赋能标杆奖、肺部AI方案落地标杆奖、脑部AI方案落地标杆奖、心血管CTA创新产品标杆奖、AI制药技术标杆奖。

寿险数字化转型赋能标杆奖:中国平安

作为科技赋能金融的重要实践,数字化是当前行业发展进步的一大趋势。

自2019年起,平安人寿率先探索数字化转型,希望运用科技赋能,打造数字寿险新模式。目前,借助覆盖渠道、产品、经营、管理、运营等模块的数字化改革,完成了渠道管理数字化、产品开发管理数字化、服务运营数字化、经营管理数字化等方面的改革,取得了改善体验、提升效率、预防风险、降低成本等成果。

平安人寿以数字化为核心手段,通过梳理寿险经营管理的神经网络全景图,帮助了解经营全貌、定位问题、预测趋势,打造“聪明经营”模式。

此外,防范风险是金融业的永恒主题。平安人寿充分依托数字化能力,打造数字化的风险防范体系,将数字化技术运用到风险的监测、识别、预警和处置的全流程中,增强风险防控能力。

人才是科技创新与运用的基础。平安人寿目前已配备兼具科技和金融经验人员百余人、科技专业人员一千余人,包括数据治理、架构设计、模型算法、大数据、人工智能、网络安全等领域专家人才三百余人。科技队伍多次在国内外技术赛事中斩获佳绩;多个数字化项目获得市场认可,获得深圳市“金融创新奖”、21世纪经济报道“年度优秀数字化转型”案例奖等大奖。

寿险业的数字化转型之路“道阻且长”,但一定“行则将至”。

肺部AI方案落地标杆奖:推想医疗

推想医疗成立于2016年,专注于AI医疗领域,致力于打造全院级AI国际领军品牌,是一家全球领先的人工智能医疗科技企业。

作为全球首家且唯一一家产品获得美国FDA、欧盟CE、日本PMDA及中国NMPA四大市场准入的AI医疗科技公司,推想医疗已覆盖全球近20个国家的900多家医疗机构。

推想医疗采取“一横一纵”和“国际化”的战略布局,打造出丰富的立体化产品管线。公司产品管线横向全面覆盖癌症、感染性疾病、心脑血管疾病及创伤等多个疾病领域;纵向沿着患者诊疗流程,提供“筛、诊、治、管、研”全流程智慧解决方案。

推想医疗的一系列胸部AI解决方案,覆盖胸部多种疾病的辅助筛查、检测,相关产品(包含InferRead® CT Lung 肺部疾病智能解决方案、InferRead® CT Pneumonia 肺炎疾病智能解决方案及InferRead® CT Bone胸部骨折智能解决方案)均已取得国家药品监督管理局的三类医疗器械认证,简称“胸肺全三类”。通过一次CT扫描,就可以满足对多种胸部疾病的一站式精准高效诊断。在不增加医疗费用的前提下实现更多疾病的筛查,提高了检查的效能和产出,利于医生精准和全面的诊断,同时不增加患者的辐射风险。

不仅是在胸肺领域,推想医疗脑卒中AI产品也获得了美国FDA认证和中国NMPA三类证,成为“中美双认证”产品,得到国内外药监机构的一致肯定。

脑部AI方案落地标杆奖:深透医疗

深透医疗(Subtle Medical )是一家深耕AI驱动医学影像服务的创新公司。从 AI+医学成像流程出发,结合深度学习和图像重建增强技术,优化医学影像质量、流程与效率,为客户真正实现节本增效。

深透医疗旗下拥有业界唯一通过中国NMPA、美国FDA和欧洲CE等全球批准的AI医学成像产品。将AI技术应用到成像,可以从源头解决影像质量和效率问题,优化数据重建成图像过程,加速MRI和PET检查至少4-10倍。

2022年,深透医疗保持高效发展,商业化步伐明显加速。2021年,在疫情背景下深透医疗仍实现400%的营收增长。而相比2021年Q4,深透医疗全球临床服务业务量已实现了超过五倍的增长,商业版图持续扩大。

迄今为止,深透医疗获得美国、欧洲、中国、南美、加拿大、澳大利亚、新西兰、新加坡等多地认证,全球部署近500家顶尖医院及影像中心,并与西门子、拜耳相继达成了价值千万美元落地合作。

目前,多项监管、行业背书及广泛落地确立了深透医疗在基于AI的医学影像采集及流程优化领域的全球领跑者地位。

心血管CTA创新产品标杆奖:联影智能

联影智能2017年底成立于上海,是联影集团在人工智能领域中的重要战略布局。依托联影集团高性能的软硬件技术平台与资源优势,联影智能已成为一家能够提供多场景、多疾病、全流程、一体化智能解决方案的医疗 AI 企业,赋能设备、临床及科研,覆盖院级管理、医疗创新生态、工作流优化、精准诊疗、个人健康管理等多个AI应用场景。

作为医疗 AI 领先企业,联影智能汇聚了一批海内外顶尖医疗 AI 人才。截至目前,联影智能已完成几十款 AI 应用研发,落地全国千余家医院,贯穿诊疗全流程,同时联影智能已获得五张 NMPA 三类证,涵盖呼吸、神经、骨科、放疗四大领域。2022年,联影智能已先后在心、脑领域斩获国家级重大项目。

联影智能 CTA 冠脉智能分析系统聚焦临床痛点,助力医生实现冠脉重建与诊断一气呵成。系统可精准重建冠脉并支持血管360°旋转观察,针对完全阻塞、起源异常、术后搭桥、冠状动脉瘘等特殊复杂病例亦适用。同时,系统支持血管及中心线编辑。提供斑块分析与狭窄评估,智能识别支架、心肌桥,智能分析钙化积分、斑块成分、冠周脂肪 FAI 值、 FFR 分数、 TAG 值,一键完成胶片排版与归档、生成自定义结构化报告,整体工作流时长约为 5 min,相较于传统工作流节省约 70 %时间。

创造不同,为健康大同。未来,联影智能将继续为医生、医疗设备赋能提效,与用户、合作伙伴携手共赢,让 AI 成为用户的最佳伙伴。

AI制药技术标杆奖:分子之心

分子之心是业界领先的AI蛋白质设计平台公司,致力于通过顶级人工智能算法为蛋白质的发现、优化与设计带来革命性的变化,以加速药物研发全流程,促进工农业生产、材料设计和环境改善等全领域创新。

分子之心创始人许锦波教授20多年前便开始从事蛋白质研究,他于2016年研发的RaptorX-Contact方法,世界范围内首次证明深度学习可以大幅度提高蛋白质结构预测。这一方法后来被谷歌旗下DeepMind借鉴,用于开发AlphaFold系列算法。

成立不到一年,分子之心已经推出自主研发的业界首个功能完整的AI蛋白质预测和设计平台“MoleculeOS”,填补了我国尚无功能完整的AI蛋白质设计和优化平台的空白。MoleculeOS运用数据驱动的深度学习方法,快速识别和产生最合适的蛋白质,将实验室研究成果规模化投射到工业级应用。这一平台对蛋白质领域的技术研发和产业应用都至关重要,是生物经济时代的“基础设施”。

基于Molecule平台,分子之心已经取得了十余项领先全球的技术突破,蛋白质从头设计、蛋白质优化、抗体重设计、蛋白质以及复合物结构预测、蛋白-蛋白对接、蛋白质侧链预测、蛋白质功能预测、蛋白质语言模型等多个关键算法和模块的计算结果远超AlphaFold2等全球玩家,并首创CDR区域精准重构、无需模板的蛋白质配体生成等全新的蛋白优化与设计方案,实现“按需改造”,甚至“从头设计”蛋白质,用AI技术让蛋白质设计变成按需、可预测、可编程。

]]>
医疗AI //m.drvow.com/category/healthai/xi5d4BOBmIzuXWSp.html#comments Tue, 17 Jan 2023 15:03:00 +0800
影响因子高达29的《Radiology》,为何收录了这篇AI冠脉CTO重建论文? //m.drvow.com/category/healthai/0XvSPFJp6NAglfjX.html

近日,由联影智能与上海市第一人民医院合作完成的冠脉CTO AI自动重建研究论文——《Deep Learning Segmentation and Reconstruction for CT of Chronic Total Coronary Occlusion》,在《Radiology》期刊上发表。

《Radiology》是医学影像领域的顶级期刊,2022年其影响因子达到29.1,研究成果能被《Radiology》收录,意味着该成果得到了放射学界的高度认可。

参与此次合作研究的上海市第一人民医院(简称“上海市一”)是国内最早成立医学影像科的医院之一,于1946年单独开设了放射科。人工智能+心胸影像是上海市一放射科科研的重点方向,由该院放射科主任张佳胤带领,关于冠脉CTO AI自动重建的研究就是该院在心血管领域进行的科研项目之一。

心血管向来是医学影像AI布局的重要领域,但冠脉CTO重建难度大,尚未有成功率较高的AI产品出现。据介绍,此次由联影智能与上海市一合作研究的算法,对冠脉CTO的自动重建成功率可达95%。

这项研究中使用的算法有何特别之处?如何破解冠脉CTO自动重建的难题?心血管AI领域还有哪些值得投入的研究方向?围绕这些问题,雷峰网《医健AI掘金志》与上海市一放射科主任张佳胤进行了一次对话。

上海市第一人民医院放射科主任张佳胤

冠脉CTO重建成功率高的“秘诀”

冠脉CTO(Chronic Total Occlusion),即冠状动脉慢性完全闭塞性病变,是冠心病介入治疗的最大难题之一。

据《中国心血管健康与疾病报告 2021》,我国冠心病患者已超 1139 万人,且冠心病患病率、死亡率逐年上升。而在接受有创性冠脉造影(Invasive Coronary Angiography, ICA)的患者中,约 20%-25% 的病例被诊断为冠脉CTO病变。

在临床中,目前多采用冠脉CT血管成像(冠脉CTA)作为评估冠脉疾病的无创性方法,但对于冠脉CTO的识别和重建,仍需要依赖医生后续凭经验手动绘制。

早在2013年~2014年,张佳胤便已经密切关注到了冠脉CTO这一复杂病变,在《Radiology》期刊共发布了3篇与冠脉CTO病变相关的论文,阐释了冠脉CTO的影像学鉴别诊断、指导治疗和评价侧枝解剖等问题。

张佳胤介绍,在不使用ICA的情况下,CTO病变在CT成像上时常无法被很好地识别。医生只能通过后处理工作站,模拟血管的生长,把闭塞段以及闭塞远端的侧支血管手动描绘出来,这之后再进行必要的测量,包括长度、钙化负荷,以及负性重构等等。

“传统对冠脉CTO的辨别需要消耗临床巨大的人力和时间成本。”张佳胤表示,一般情况下,医生需花费十多分钟才能完成一例冠脉CTO重建。

基于这一痛点,张佳胤与联影智能团队于去年上半年合作开展基于深度学习算法的冠脉CTO AI 自动重建。从立项到投稿,虽仅历经不到一年半的时间,但实际上这项研究颇有挑战性。

由于冠脉全闭塞段的显影微弱或者不佳,在重建过程中很容易造成血管分割、断裂不全,对算法的要求很高。

为此,研发人员在算法中融入了冠脉与心脏的解剖结构,为冠脉分割提供了上下文信息,同时将冠脉的局部特征和整体特征相结合,保证了冠脉分割尤其是显影不清晰的 CTO 位置分割的完整性、准确性以及连续性。

最终,双方团队对 211 名患者共 240 例 CTO 病变血管进行重建实验。实验结果显示,算法的自动分割和重建成功率为 95%,而传统工作站成功率仅为48% 。而在后处理时间方面,借助该算法能最多缩短 80% 的重建时长,2至3分钟即可出结果。

目前,这项研究成果已经投入到上海市一放射科的临床中使用。张佳胤表示,在实际应用中,发现AI对冠脉 CTO远端末梢1mm以及1mm以下的细小分支都有着良好的重建效果,几乎可以自动识别、分割并标注整个闭塞段,还有闭塞远端的侧支血管,“做出来的图像效果甚至比人手动的要更好。”

张佳胤认为,这项研究后续能够对临床冠脉CTO的术前影像精准评价起到很大的推动作用。他希望,未来能够将这套冠脉重建算法从放射科推广到心导管室,从而帮助心内科更好地做疾病分析与决策。

AI在心血管领域仍大有可为

张佳胤是一位兼具临床诊断能力与科研能力的优秀的放射科医生,他的求学、从业的道路也是一路紧紧跟随着心血管影像学的发展,希望能够把自己在临床经验进行归纳、总结并转化为循证医学证据,用实际行动在心血管影像诊断领域注入自己的力量,从而为更多的病人谋取福音。

2006年,张佳胤从上海交通大学医学院获得硕士学位。毕业后,张佳胤在上海交通大学附属第六人民医院(简称“上海六院”)放射科开启自己的职业生涯,博士时期师从当时的放射科主任李明华教授。

李明华教授是介入影像科的学科带头人,专攻神经影像诊断和神经介入治疗技术,是国内脑动脉瘤无创成像和微创介入治疗的先驱者。

从业不久后,张佳胤就遇到了医学界的一个重要技术转折点。2007年,正值64排CT在国内普及,心血管领域的CT成像技术得到突破,使得CT用于常规冠心病临床诊断成为可能。

而在64排CT普及以前,受限于检查设备的限制,虽然冠心病发病率高、危害性大,但用CT诊断冠心病在放射科几乎是一个无人问津的领域。

张佳胤对心血管方向十分感兴趣,他向导师李明华教授申请从事这个方向的研究。尽管这并非李明华教授的专攻领域,面对学生的热情,他选择全力支持张佳胤的选择。

作为较早进入这个方向的学者,张佳胤从业至今见证了心血管领域的崛起。截至目前,他已经在《Radiology》上发表了6篇心血管相关的研究论文。

2017年前后,随着国内各大医学影像AI厂商相继成立,从那时起,关于AI的引入已经成为各大医院放射科着重考虑的话题。

张佳胤与医学影像AI的结缘也始于这个阶段。在上海六院时,张佳胤从联影智能的一款肋骨骨折AI产品中感受到了AI所具有的效用,从此对AI持开放、拥抱的态度。

2021年1月,张佳胤加入上海市第一人民医院,担任该院放射科主任,他正式主导基于心脏疾病影像诊断和AI新技术研发的国家级项目,与联影智能展开合作研究。

张佳胤认为,在心血管、头颈血管、肋骨骨折的检出等一系列需要医生手工大量干预的领域,AI都是刚需。

而国内第一张AI医疗三类证,正是落在了心血管领域。到目前为止,在心血管领域,尤其是冠脉方向,已有不少医学影像AI企业入局。

根据《中国医学影像人工智能发展报告(2021-2022)》,截至2022年5月31日,在已获NMPA三类证的产品中,心血管产品的数量仅次于肺结节。

入局者众多,但在张佳胤看来,心血管AI研发仍有许多需要攻坚的方向。

首先是解剖学方向。此次与联影智能合作的冠脉CTO AI自动重建研究,已经有效解决完全闭塞性血管的辨别和重建问题,但是对于 AI在冠脉支架、桥血管以及起源异常这类特殊的、复杂的解剖结构的识别上,技术上还存在较大的挑战性,许多AI产品都无法适用于这类结构。

张佳胤透露,这些更具挑战性的研究方面,上海市一与联影智能也已取得了较好的识别和分割结果,不久后将披露最新的研究成果。

其次是功能学成像方向。由于冠脉斑块非常微小,不易进行自动分割,手动后处理难度大,因此冠脉斑块成分的自动分析也有待突破;另外冠脉CT血流储备分数模拟计算(CT-FFR)对功能学的研究也很关键,目前上海市一正基于联影智能的产品进行大样本的、多中心的临床验证。

除了以上提及的关于血管水平的功能评价,还有心肌水平的评价。

张佳胤表示,在临床中,心肌血流灌注成像流程十分繁琐,涉及多个步骤,完成一位患者的检查和成像分析,需要花费20~30分钟,临床痛点十分突出。上海市一与联影智能的合作研究也覆盖这一环节,目前由双方研发的CT心肌灌注全自动定量分析软件已经投入到临床中,可以一站式自动完成诊断流程。

综上所述,上海市一与联影智能从解剖学到功能学等环节上都开展了合作项目,多方位地覆盖心脏CT影像检查的难点领域。而这样全栈全谱的医疗AI,正是未来的发展趋势。

正如中华医学会放射学分会主任委员、上海长征医院放射诊断科主任刘士远教授在第三届中国医学影像AI大会中提到的那样,AI医学影像企业应加快建设一纵一横业务布局,基于临床场景解决多任务、多维度的问题,并基于部位和器官输出整体检查的结果。

从行业整体趋势来看,医学影像AI正在往全流程、多任务、多维度方向发展,横、纵向的布局都会越来越深入。雷峰网 雷峰网

]]>
医疗AI //m.drvow.com/category/healthai/0XvSPFJp6NAglfjX.html#comments Sat, 31 Dec 2022 16:11:00 +0800