导管原位癌 (DCIS) 是一种癌前肿瘤,有时会发展为高度致命的乳腺癌。它占所有乳腺癌诊断的 25% 左右。
由于临床医生很难确定 DCIS 的类型和阶段,DCIS 患者经常接受过度治疗。为了解决这个问题,麻省理工学院和苏黎世联邦理工学院的跨学科研究团队开发了一种 AI 模型,可以从廉价且易于获取的乳腺组织图像中识别 DCIS 的不同阶段。他们的模型表明,组织样本中细胞的状态和排列对于确定 DCIS 的阶段都很重要。
由于此类组织图像非常容易获得,研究人员能够构建同类中最大的数据集之一,并用它来训练和测试他们的模型。当他们将其预测与病理学家的结论进行比较时,他们发现在许多情况下存在明显的一致性。
将来,该模型可以作为一种工具,帮助临床医生简化简单病例的诊断,而无需进行劳动密集型测试,从而让他们有更多时间评估那些不太清楚 DCIS 是否会变得具有侵袭性的病例。
“我们迈出了第一步,认识到在诊断 DCIS 时应该关注细胞的空间组织,现在我们已经开发出一种可扩展的技术。从这里开始,我们确实需要进行前瞻性研究。与医院合作并将这项技术应用于临床将是向前迈出的重要一步,”电气工程与计算机科学系 (EECS) 和数据、系统和社会研究所 (IDSS) 教授 Caroline Uhler 表示,她还是麻省理工学院和哈佛大学布罗德研究所 Eric and Wendy Schmidt 中心主任,麻省理工学院信息与决策系统实验室 (LIDS) 研究员。
Uhler 是这项研究论文的共同通讯作者,与他一起参与研究的还有第一作者、EECS 和 Eric and Wendy Schmidt 中心的研究生 Xinyi Zhang、苏黎世联邦理工学院与 Paul Scherrer 研究所联合教授 GV Shivashankar,以及麻省理工学院、苏黎世联邦理工学院和意大利巴勒莫大学的其他研究人员。这项开放获取研究于7 月 20 日发表在《自然通讯》上。
将成像与人工智能相结合
30% 到 50% 的 DCIS 患者会发展为高度侵袭性癌症阶段,但研究人员并不知道哪些生物标志物可以告诉临床医生哪些肿瘤会进展。
研究人员可以使用多重染色或单细胞 RNA 测序等技术来确定组织样本中的 DCIS 阶段。然而,这些测试过于昂贵,无法广泛开展,Shivashankar 解释道。
在之前的研究中,这些研究人员表明,一种被称为染色质染色的廉价成像技术可以像昂贵的单细胞 RNA 测序一样提供信息。
在这项研究中,他们假设将这种单一染色与精心设计的机器学习模型相结合可以提供与更昂贵的技术相同的癌症分期信息。
首先,他们创建了一个数据集,其中包含 122 名处于三个不同疾病阶段的患者的 560 张组织样本图像。他们利用这个数据集训练了一个 AI 模型,该模型可以学习组织样本图像中每个细胞状态的表示,并据此推断患者癌症的分期。
然而,并非每个细胞都预示着癌症,因此研究人员必须以有意义的方式将它们聚合在一起。
他们设计了该模型来创建处于类似状态的细胞簇,并确定了八种作为 DCIS 重要标志的状态。有些细胞状态比其他细胞状态更能表明存在侵袭性癌症。该模型确定了组织样本中每种状态的细胞比例。
组织事宜
“但在癌症中,细胞的组织也会发生变化。我们发现,仅仅了解每种状态下细胞的比例是不够的。你还需要了解细胞是如何组织的,”Shivashankar 说。
利用这一见解,他们设计了模型来考虑细胞状态的比例和排列,从而大大提高了模型的准确性。
“对我们来说,有趣的是看到空间组织有多重要。先前的研究表明,靠近乳腺导管的细胞很重要。但考虑哪些细胞靠近哪些其他细胞也很重要,”张说。
当他们将模型结果与病理学家评估的样本进行比较时,发现在许多情况下,模型的结果明显一致。在结果不那么明确的情况下,该模型可以提供有关组织样本特征的信息,例如细胞组织,病理学家可以利用这些信息进行决策。
这种多功能模型还可以适用于其他类型的癌症,甚至神经退行性疾病,这也是研究人员目前正在探索的一个领域。
“我们已经证明,使用正确的人工智能技术,这种简单的染色可以发挥很大的作用。还有很多研究要做,但我们需要在更多的研究中考虑细胞的组织,”Uhler 说。
这项研究的部分资金来自布罗德研究所的埃里克和温迪施密特中心、苏黎世联邦理工学院、保罗谢尔研究所、瑞士国家科学基金会、美国国立卫生研究院、美国海军研究办公室、麻省理工学院贾米尔机器学习和健康诊所、麻省理工学院-IBM 沃森人工智能实验室和西蒙斯研究员奖。