Win10 2004下载 win10 2009下载 win10激活 xp系统下载 win7旗舰版 win7纯净版 win8纯净版 win8专业版 Windows10X

您当前所在位置:首页 > IT资讯 > 囧科技

研究人员使用深度学习探索RNA来开发用于COVID-19诊断的传感器

时间:2020-10-08     来源:系统堂     游览量:

  研究人员使用深度学习探索RNA来开发用于COVID-19诊断的传感器

  基因组是决定生物体特征的遗传蓝图。脱氧核糖核酸(DNA),通常在病毒的情况下,核糖核酸(RNA)是基因组序列的组成部分。直接操作这些核酸可导致生物体发生明显变化。

  因此,基因工程的发展集中在我们操纵基因组序列的能力上。但这是一项艰巨的任务。例如,精确控制一类特定的工程RNA分子(称为“鞋头开关”)可为细胞环境和潜在疾病提供重要的见识。但是,先前的实验表明,脚尖开关不易处理,即使基于已知的RNA折叠规则,它们已被设计为响应给定的输入而产生所需的输出,但许多开关也不响应修改。

  考虑到这一点,哈佛大学怀斯研究所和麻省理工学院的两个研究人员团队开发了一套可以改善这一过程的机器学习算法。具体来说,他们使用深度学习来分析大量的脚趾开关序列,以准确预测哪些脚趾可靠地执行了预期的任务,从而使研究人员能够为他们的实验确定高质量的脚趾。他们的发现已经发表在《自然》杂志的两篇独立论文中。

  对于任何机器学习问题,第一步都是收集特定领域的数据以训练模型。研究人员收集了一个由脚趾开关序列组成的大型数据集。亚历克斯•加鲁斯(Alex Garruss)是第一位作者,也是Wyss的一名研究生,他说:

研究人员使用深度学习探索RNA来开发用于COVID-19诊断的传感器

  “我们通过系统采样23种病毒和906种人类转录因子的整个基因组中的短触发区域,设计并合成了一个庞大的脚趾开关库,总数接近100,000。”

  由于有两个独立的团队,研究人员尝试了两种不同的方法来解决问题。第一篇论文的作者决定分析脚趾开关不是作为碱基序列,而是作为碱基对可能性的二维图像。这种称为可视化二级结构显着性图或VIS4Map的方法成功地识别了影响其性能的脚趾开关的物理元素,从而提供了对使用传统分析技术尚未发现的RNA折叠机制的见解。

  第二篇论文的作者创建了两种不同的深度学习架构,以应对使用正交技术识别“敏感”脚趾开关的挑战。第一个模型基于卷积神经网络(CNN)和多层感知器(MLP),将脚趾序列视为一维图像或核苷酸碱基行。使用称为基于序列的脚趾优化和重新设计模型(STORM)的优化技术,它可以识别碱基的模式以及这些碱基之间的潜在相互作用,以标记出感兴趣的脚趾。

  第二种体系结构将问题建模为自然语言处理(NLP)领域,将每个脚趾序列视为由单词模式组成的短语。然后的任务是训练一个模型,以组合这些词或核苷酸碱基,以构成一个连贯的短语。该模型与基于CNN的模型集成在一起,创建了核酸语音(NuSpeak)。这项优化技术重新设计了给定脚趾开关的最后9个核苷酸,同时使其余21个核苷酸保持完整。这允许创建检测特定病原性RNA序列的存在的专门立足点,并可用于开发新的诊断测试。

研究人员使用深度学习探索RNA来开发用于COVID-19诊断的传感器

  为了测试这两种模型,研究人员使用其优化的鞋头开关,从SARS-CoV-2(引起COVID-19的病毒基因组)中检测了片段。NuSpeak将传感器的性能平均提高了160%。另一方面,STORM创建了四个SARS-CoV-2病毒RNA传感器的更好版本,将其性能提高了多达28倍。对于这些令人印象深刻的结果,第二篇论文的第一作者,怀斯学院的麻省理工学院的学生凯蒂•柯林斯说:

  “ STORM和NuSpeak平台的真正优势在于,它们使您能够快速设计和优化合成生物学组件,正如我们在开发用于COVID-19诊断的额头传感器中所展示的那样。”

  Wyss Institute的第二篇论文的通讯作者,资深生物信息学科学家,Predictive BioAnalytics Initiative的共同负责人Diogo Camacho表示:

  “也许我们在这些论文中开发的工具最重要的方面是,它们可以推广到其他类型的基于RNA的序列,例如诱导型启动子和天然存在的核糖开关,因此可以应用于广泛的问题和机遇。生物技术和医学。”

  正如卡马乔(Camacho)所预见的那样,研究小组正在寻求推广其算法以将其映射到合成生物学的其他问题上,从而有可能加速生物技术工具的开发。

上一篇:诺基亚将加强其ReefShark芯片组的开发
下一篇:OnePlus 8和OnePlus 8 Pro:将分发基于Android 11的OxygenOS 11升级