TY -的A2 - Pena,安东尼奥·j·王盟——Bingming盟——应施盟-杨,哲PY - 2020 DA - 2020/06/02 TI -一个基于异常检测方法和高效的邻居搜索和自动K邻居选择SP - 4365356六世- 2020 AB -使用
k最近的邻居(资讯)算法在监督学习方法来检测异常可以得到更准确的结果。然而,当使用资讯算法来检测异常,它在发现是低效的
k邻居从大规模日志数据;同时,日志数据在数量上是不平衡的,所以这是一个挑战,选择适当的
k邻居为不同的数据分布。在本文中,我们提出一个基于异常检测方法的有效选择的邻居和自动选择
k邻居。首先,我们提出一个基于minhash和MVP-tree邻居搜索方法。minhash算法组类似的日志到相同的桶,和MVP-tree模型是建立在每个桶样品。通过这种方式,我们可以减少距离计算的努力和邻居相比,样品需要的数量,以提高发现邻居的效率。在选择的过程中
k邻居,我们提出一个自动方法基于轮廓系数,从而选择适当的
k邻居来提高异常检测的准确性。验证我们的方法对6个不同类型的日志数据来证明其普遍性和可行性。SN - 1058 - 9244 UR - https://doi.org/10.1155/2020/4365356 - 10.1155 / 2020/4365356摩根富林明科学编程PB - Hindawi KW - ER