当前位置 :首页>研究报道

ARGs OAP v2.0具有一个扩展的SARG数据库和隐马尔可夫模型,用于增强环境基因组中抗生素抗性基因的特性和量化

发布者:抗性基因网 时间:2020-03-24 浏览量:5953

      摘要

      动机:在监测抗生素耐药性的产生、积累和传播过程中,抗生素耐药性受到了全球的广泛关注。为了快速鉴定和量化宏基因组数据集中的抗生素耐药基因(ARGs),我们开发了一个在线分析管道ARGs-OAP,该管道由一个名为结构化抗生素耐药基因(SARG)的具有层次结构的数据库(ARGs型亚型参考序列)组成。
      结果:新版本的数据库称为SARG版本2.0,它不仅包含来自CARD和ARDB数据库的序列,还包含来自NCBI-NR数据库最新蛋白质集合的精心挑选和整理的序列,以跟上ARG沉积序列数量的增加。SARG v2.0已经将第一个版本的序列增加了两倍,并证明了在不同环境样本的亚基因组中ARGs检测的覆盖率有所提高。除了使用相似性搜索策略对高吞吐量原始读取进行注释外,ARGs OAP v2.0现在还使用SARGfam(一种高质量的轮廓隐马尔可夫模型(HMM))提供基于模型的装配序列识别,该模型包含ARG子类型的轮廓。此外,ARGs OAP v2.0通过使用基本单拷贝标记基因的平均覆盖率来改进细胞数量量化,作为对基于16srrna基因的先前方法的补充。
      可用性和实施:ARGs OAP可以通过http://smile.hku.hk/SARGs访问。数据库可以从同一站点下载。本研究的源代码可从https://github.com/xiaole99/ARGs-OAP-v2.0下载。

       https://academic.oup.com/bioinformatics/article/34/13/2263/4835082