泰勒A2利特曼,托马斯奥威廉姆斯,菲利普H。AU-Eyles,Rod AU-Weiller,Georg PY-2012 DA-2012/11/07 TI-使用C5.0决策树SP-652979 VL-2012 AB-MicroRNA(miRNAs)通过有监督机器学习预测植物的MicroRNA是长度在20到22个核苷酸之间的非蛋白编码RNAs,会减弱蛋白质的产生。不同类型的序列数据正在研究新的mirna,包括基因组和转录组序列。各种机器学习方法已经成功地预测了miRNA前体、成熟miRNA和其他非蛋白编码序列。MirTools、mirDeep2和miRanalyzer要求在输入序列中包含“读取计数”,这就限制了它们对深度测序数据的使用。我们的目的是利用不同物种的横截面来训练一个预测因子,以便在训练集之外准确地预测miRNAs。我们想要一个系统,不需要读取计数的预测,因此可以应用于短序列提取基因组,EST,或RNA序列的来源。利用有监督机器学习建立了miRNA预测决策树模型。它只需要在包含前体候选体的序列窗口中提供相应的基因组或转录组,以便收集所需的序列特征。训练预测因子的一些最关键的特征是miRNA:miRNA 双工能量和双工中不匹配的数量。我们提出了一个跨物种植物miRNA预测因子,其敏感性和特异性分别为84.08%和98.53%。编号:2090-0201https://doi.org/10.1155/2012/652979 DO-10.1155/2012/652979 JF-核酸杂志PB-Hindawi Publishing Corporation KW-ER-