精准前沿丨一种去除环境DNA污染的宏基因组DNA测序方法

作者:开云链接入口 来源:开云棋牌app 发布时间:2024-07-09 07:38:10

  总的来说,SIFT-seq给出了一种新的方法,明显提高了宏基因组cfDNA分析的特异性,当然也存在一些局限性,例如SIFT-seq仅对标记步骤后引入的DNA污染去除,另外标记策略改变了DNA序列,进而影响了SNP或其他碱基分析,但不影响微生物cfDNA的检测,对于这一点也能更加进一步考虑不进行序列改变的优化方案。

  本期《精准前沿》栏目分享由美国康奈尔大学Omary Mzava等人发表在Nature Communications(IF=12.12)上的一篇研究[1],该研究提出了一个通过标记样本中DNA,去除样品制备过程中引入环境DNA污染的方法—SIFT-seq。SIFT-seq的核心是:在DNA提取和文库制备之间,对样本中的DNA进行标记。在标记后引入到样品中的任何DNA都能够最终靠生物信息学办法来进行识别和去除。本文应用SIFT-seq检测血液和尿液中低丰度微生物的感染,识别COVID-19合并感染,表征尿液微生物组,并识别血液中脓毒症和炎症性肠病的微生物DNA特征。

  宏基因组DNA测序是一种常用的检测微生物群落基因组成和物种组成的工具。此外,临床样本的宏基因组DNA测序慢慢的变多地被用于微生物感染的检测。但是在DNA测序样品制备过程中,DNA污染不可避免地发生,对于微生物DNA含量很低,非常容易被环境污染DNA干扰的样品,尤其成问题。

  目前虽然已经提出了多种解决方案来克服DNA污染对低丰度宏基因组测序的影响。但仍存在一些问题,例如没办法避免试剂中的污染物,可能会错误地判断样本内微生物为污染物种。本文描述了一种通过标记样本内在微生物DNA,去除环境DNA污染的宏基因组测序方法。

  SIFT-seq直接在血浆和尿液中标记样本内在DNA,其化学标记能够最终靠DNA测序检测。在这个标记步骤后被引入到样品中的污染DNA可以被直接识别和去除。

  本文通过亚硫酸氢盐处理DNA实现未甲基化胞嘧啶的脱氨基,这种化学方法不需要用酶或DNA寡核苷酸,可以直接应用于临床相关的样本,如血液和尿液。

  本文对SIFT-seq的技术性能进行了分析,并描述了SIFT-seq的六种应用:(i)从血液中识别病毒和细菌COVID-19合并感染;(ii)分析尿路感染(UTI);(iii)确定尿液微生物组的特征;(iv)分析在乌干达出现呼吸道症状的患者血液;(v)识别脓毒症和(vi)炎症性肠病(IBD)患者血液中的微生物DNA特征。

  通过亚硫酸氢盐诱导未甲基化胞嘧啶转化为尿嘧啶来标记DNA (图1a),由亚硫酸氢盐处理产生的尿嘧啶在随后的DNA合成步骤中转化为胸腺嘧啶,这是DNA测序文库制备的一部分。DNA测序后,标记后引入的污染DNA能够准确的通过胞嘧啶直接识别。亚硫酸氢盐转化可以直接应用于原始样本。同时开发了一套生物信息学流程来区分样本内在微生物DNA、污染微生物DNA和宿主特异性DNA (图1b)。

  本文设计了两种检测的新方法来测试SIFT-seq性能。首先,将SIFT-seq和常规DNA测序应用于不同含量的DNA ΦX174样本。研究者基于此分析了痤疮皮肤杆菌的丰度,它是正常皮肤菌群的常见成员,在DNA测序中通常被确定为污染物。研究者观察到痤疮杆菌的丰度随着核酸浓度的减少而增加,正如预期的那样,核酸浓度低的样品更容易受到环境污染(图1d)。尽管SIFT-seq在文库制备开始时加入的样本DNA含量比正常DNA测序降低了30%,但SIFTseq过滤后痤疮的数量依旧要少得多(图1d)。

  其次,研究者对不同浓度的ΦX174 DNA样本做了SIFT-seq实验(图1e),在SIFT-seq标记后,加入1ng标准品菌DNA模拟微生物DNA污染。在使用SIFT-seq生信流程过滤之前,研究者观察到DNA样本量与标准品菌reads数之间有负相关,在应用SIFT-seq生信流程过滤后,标准菌平均下降了99.8% (图1f)。过滤后,大肠杆菌序列丰度最高。考虑到ΦX174基因组DNA是在大肠杆菌培养中噬菌体繁殖后分离出来的,研究者推断这些剩余的reads很可能是原始样本固有的。

  总之,这些实验证明了SIFTseq在检测和去除DNA污染物方面的有效性,并且不去除样品中最初存在的物种。

  血液和尿液中的宏基因组cfDNA测序可以识别广泛的潜在病原体。然而,由于血液和尿液中微生物来源的cfDNA的含量较低,宏基因组cfDNA测序受到环境污染的高度影响,限制了宏基因组cfDNA测序用于病原体鉴定的特异性。为了评估SIFT-seq在宏基因组cfDNA测序中的表现,研究者共检测了从受试者中收集的196份cfDNA样本(154个血浆,42个尿液):(1)14名COVID-19住院患者的30份血浆样本。(2)53份来自44名IBD治疗患者的血浆样本。(3)56份血浆样本来自乌干达的44例呼吸道症状患者。(4)15例血浆样本来自15例患者(10例脓毒症患者,5例在ICU的无脓毒症患者)。(5)26例尿液样本来自有尿培养和无尿培养证实的肾移植患者(16例尿培养阳性,10例尿培养阴性)。(6)16例尿液来自10例接受输尿管支架的肾移植患者移植后早期尿样(10例患者中有5例采集了支架植入前和支架摘除后的尿样)。

  研究者对所有样本做了SIFT-seq,检测并评估了68个属的丰度,这些属已在多个独立的研究中被报道为常见的DNA污染物。经过SIFT-seq过滤,77%的属从所有样本中完全去除(图2a,图中只展示丰度最高的前25属)。研究者计算了所有污染物属的reads,观察到经过SIFT-seq过滤后减少了三个数量级(图2b)。同时比较了SIFT-seq过滤对痤疮的影响(图2c)。在所有样本中均检测到痤疮,通过SIFT-seq过滤从62个样本中完全去除。在剩下的样本中,痤疮的reads减少了两个数量级。

  接下来,研究者评估了SIFT-seq校正批次效应的作用,并揭示了在不同病人中微生物谱的差异。研究者计算了本研究中所有临床样本的Bray-Curtis差异指数。在SIFT-seq过滤之前,在同一实验批次中检测的样品具有高度相似性 (图2d)。SIFT-seq过滤去除了这些批次效应,并揭示了不同患者特异性微生物组谱。最有必要注意一下的是,在来自乌干达患者的血浆样本中观察到了与其他患者不同的血浆微生物谱((图2e)。这些根据结果得出,将SIFT-seq直接应用于临床液体样本中,可使由于DNA污染而导致的实验干扰和偏差显著降低。

  目前仍然缺乏对尿液微生物定植物种的全面和准确的特征分析,研究者推断,SIFT-seq可以基于高灵敏度和特异性来分析尿液微生物的组成。

  首先将SIFT-seq应用于23例肾移植患者的尿路培养(16例阳性尿培养[粪肠球菌:3;屎肠球:1;大肠杆菌:10;肺炎克雷伯:1;铜绿假单胞菌:1;以及10例阴性尿培养)。SIFT-seq可从尿液培养报告的物种中一致鉴定出微生物cfDNA(图3a),并且,尿液培养阳性患者的样本总微生物DNA丰度明显高于尿液培养阴性患者的样本(图3b)。

  SIFT-seq应用于在输尿管支架移除前后收集的5例肾移植患者的对应尿液样本中,研究者比较了来自同一患者的样本和不同患者样本之间微生物组成的相似性。观察到同一患者的微生物谱比不同患者(图3c)之间更相似。

  为了评估SIFT-seq与现有生物信息学技术在去除环境DNA污染方面的性能,对SIFT-seq与LBBC软件进行了对比,研究者比较了肾移植患者(n=26)SIFT-seq过滤和LBBC过滤的数据。平均而言,LBBC过滤使来自污染物属的reads减少了1.4倍,而SIFT-seq减少了7.5倍。SIFT-seq检测出了常规尿液培养中检测到的所有物种(16/16),而LBBC仅检测到了培养阳性中的10/16个物种。LBBC过滤后假阳性率的下降是以真阳性率的降低为代价的。

  研究者推断SIFT-seq能够给大家提供对COVID-19患者的细菌和病毒合并感染的检测,比传统的宏基因组测序方法具有更加好的特异性。

  对14例COVID-19患者的30份血浆样本做SIFT-seq。SIFT-seq在3/3的血流感染病例和8/8的呼吸道感染病例中发现了病原体(图4a、b)。传统的宏基因组测序(不进行SIFT-seq过滤)对这些病原体同样敏感,但受到特异性的限制。

  对15份血浆样本(10例脓毒症患者,5例非脓毒症患者。9/15例患者血培养结果呈阳性(9/10例为脓毒症患者),3/15例患者血培养结果呈阴性,3/15例患者未进行血培养)进行SIFT-seq。在9份血培养阳性样本中,共鉴定出10种病原体。血培养鉴定的病原体与SIFT-seq鉴定的病原体之间有很强的一致性:SIFT-seq检测到血培养报告的10种病原体。并且只有2/9的血培养阳性患者,在血培养阳性时采集血浆样本(通过血培养和SIFT-seq鉴定的粪肠杆菌,图4c)。7/9的患者为开始抗生素治疗后采集血浆样本做SIFT-seq。这7/9个样本的血浆样本开始抗生素治疗后再次进行血培养均为阴性。该实验证明了SIFT-seq对脓毒症患者检测血液病原的实用性,即使在开始抗生素治疗后也是如此。

  SIFT-seq用来检测乌干达的44名出现呼吸道疾病症状患者的56份血浆样本。其中9人在收集样本时呈艾滋病毒阳性。研究者进一步分析数据,以确定乌干达临床相关细菌和病毒的流行率,并与生活在北美的患者血浆样本的结果进行了比较。SIFT-seq过滤后(图4d),与北美患者相比在乌干达患者样本中发现特有的病原比例为:疟疾(3/44)、EB病毒(1/44)、志贺氏菌病(19/44)和细环病毒(1/44)。

  在炎症性肠病 IBD患者中,肠道血管屏障的破坏与肠道通透性的增加和随后的微生物跨粘膜的转移有关。肠道细菌及其产物转移到肠外部位可导致全身性炎症,因此导致自身免疫性疾病或其他非感染性疾病。转移的微生物DNA在血液中含量较低,检测是重要但困难的。

  研究者对44例患者的粪便样本全基因组测序结果与对应的SIFTseq检测的血浆cfDNA样本做了比较。首先统计了在对应的粪便和血浆样本中鉴定出的细菌种类(图4e)。所有患者样本中都鉴定出了来自肠道特异性微生物的cfDNA。为了研究治疗对细菌转移的影响,研究者收集了9例患者的粪便和血浆样本,治疗开始后,对粪便进行全基因组测序并对血浆cfDNA进行SIFT-seq测序(图4f)。比较治疗前后肠道特异性细菌的相对丰度,发现治疗后大多数细菌的cfDNA丰度都降低了(28/36),这原因是治疗后细菌转移程度降低了(图4g)。

  总的来说,SIFT-seq给出了一种新的方法,明显提高了宏基因组cfDNA分析的特异性,当然也存在一些局限性,例如SIFT-seq仅对标记步骤后引入的DNA污染去除,另外标记策略改变了DNA序列,进而影响了SNP或其他碱基分析,但不影响微生物cfDNA的检测,对于这一点也能更加进一步考虑不进行序列改变的优化方案。END