最短路径问题是一个经典的问题。困难仍然涉及大数据环境下更是如此。当前对最短路径问题的研究主要集中在寻求从出发点到目的地的最短路径,与顶点已经给出;但最短路径的研究在一个有限的时间和有限的节点通过很少,然而,这样的问题不可能在现实生活中更常见。在本文中,我们提出几个这个问题的时间优化算法。关于传统的回溯和不同的节点压缩方法,我们首先提出一个条件的改进回溯算法在大数据环境下,三种类型的基于节点的优化算法压缩涉及大数据,以实现的路径选择起点通过一个给定的一组节点达到在有限的时间内结束。因此,问题涉及不同的数据量和网络结构的复杂性和采用适当的算法可以解决。gydF4y2Ba
图论的单源最短路径问题是非常典型的问题,享受广泛应用在现实生活中,如网络路由路径选择、车辆导航、和旅游路线。经典的算法来解决此类问题是迪杰斯特拉算法gydF4y2Ba
这些问题可以概括为一个图论问题;在加权有向图,路线从一个起点,通过指定的中间节点,到达目的地。应在指定的时间内寻找有效路径,这些路径的重量计算,并选择一条最低的重量作为最终结果。gydF4y2Ba
解决这类问题,我们可以遍历整个图并找到最短路径,尽管理论上这遍历的算法最终将解决最优解;然而,时间复杂度仍然很高。针对这一点,本文提出一种节点压缩路由算法,考虑时间限制。这项研究关注节点压缩和有用的信息获得的路径找到适用于搜索条件,调整子节点的顺序和其他方法。此外,传统算法时间复杂度高,为这类问题提供一个有效的解决方案。gydF4y2Ba
给定一个加权图gydF4y2Ba
条件下的gydF4y2Ba
公式定义了一条边,从起始节点应该出现在路径的结果,和起始节点优势不能结束节点。gydF4y2Ba
这个公式的起始节点的限制gydF4y2Ba
公式限制,结果路径结束,结束节点必须有一个优势gydF4y2Ba
公式限制,由此产生的路径不能包含边缘开始和结束节点gydF4y2Ba
这个公式定义的边缘产生的路径可以- 1的节点数量;与无关,由此产生的路径不能出现边缘和循环。gydF4y2Ba
为方便后续的描述,下列两个定义。gydF4y2Ba
的节点gydF4y2Ba
除了所有其他节点的关键节点。gydF4y2Ba
在加权图gydF4y2Ba
问题的一个简单的例子。gydF4y2Ba
如果使用回溯法来解决这个问题,从理论上说,我们可以有最优解,当然其他的解决方案。然而,回溯方法不能有效地使用信息构建在搜索过程或最优解,为项目下一步的优化条件奠定基础搜索。在本节中,提出一种改进的回溯法(OPT-Backtrack算法)基于传统回溯的方法。新IBA从先前的搜索中检索已知信息和有效的结果并将它们添加到下一个搜索规则之前从其他节点搜索。通过这种方式,可以提高搜索方法和算法,因为现有的信息和可能的结果是考虑更高的搜索效率。gydF4y2Ba
改进回溯算法的加法规则如下所示。gydF4y2Ba
如果下一个节点是目的,然而当前路径没有附着在那些经历了每一个节点的节点集,这条路将追溯并开始寻找下一个节点。这条规则可以避免许多无效的解决方案从而提高算法的生成效率。gydF4y2Ba
如果当前路径的重量和到下一个节点的边的权值大于或等于最低重量可用的解决方案,将跟踪的路径返回,继续寻找下一个节点。如果当前路径被发现的当前重量和边缘到下一个节点的重量不超过现有的重量,然后不需要寻找下一个节点,因为最初的问题是找到的最小重量的道路。gydF4y2Ba
对于那些nondestination节点没有子节点,我们应该避免进入搜索。如果不是目的地和一个节点没有子节点,路径不得继续;因此,没有必要这样的搜索在节点或,而他们可以简单地从图中删除。gydF4y2Ba
的关键改进回溯算法的伪代码所示算法gydF4y2Ba
Improved-Backtrack (gydF4y2Ba
(节点!=end&& !
路线和weigthsgydF4y2Ba
虽然可以提高搜索效率改进回溯算法在一定程度上,负面的复杂性提高回溯方法也将增加作为图的规模和解决方案领域扩张。降低算法复杂度,提出了一种新的算法,基于节点压缩搜索算法:机子。gydF4y2Ba
随着图的规模增加,相应的路径将扩大。同样的问题是找到一条从起始点,达到一个中间节点中间和最终的目的地。降低算法复杂性,我们可能图进行预处理。方法是压缩的总数节点,删除无用的节点和低价值路径片段,然后保存的唯一路径是必要的简化整个图;我们的目标是压缩解决方案域并最终提高搜索效率。gydF4y2Ba
该算法适用于以下情况:如果一个节点是相对偏远,只有到达另一个节点,也就是说,一个节点后只有一个孩子节点,在这种情况下,唯一的子节点路由搜索会下来,将重复这个哪里有这种节点在搜索过程中。我们要做的是避免这种情况的简单和重复计算。gydF4y2Ba
解决这个问题是节点压缩算法(NCA)。NCA记录的路径通过上述节点算法时第一次申请,并将删除节点但保留路径信息;因此,当下一次搜索仍在这个节点,只存储路径信息将被用来避免重复计算。因此,节点的总数是压缩和减少,使其更容易寻找更好的解决方案。gydF4y2Ba
流程如图gydF4y2Ba
压缩搜索算法的基本思想。gydF4y2Ba
在图gydF4y2Ba
由于节点压缩算法(NCA)主要用于解决自由节点只有一个子节点,如果这些节点是许多图,算法效率会显著提高。然而,如果此类节点的规模有限,基本压缩算法将少或没有影响,这限制了压缩搜索算法的有效性。gydF4y2Ba
鉴于NCA的问题,提出了一种更高效的压缩策略,压缩所有自由节点图中减少图像的复杂性,提高了搜索效率。gydF4y2Ba
问题是找到一个noncircle从开始节点到目标节点的路径,通过中间节点集的权重的边缘路径尽可能小。当节点的可达性很复杂,将会有更多的可能的路径到达节点的一个,另一个。因为这个问题需要中间节点集gydF4y2Ba
就像图gydF4y2Ba
为了进一步提高压缩效率,本节继续调整和完善节点压缩的三个步骤。gydF4y2Ba
在搜索过程中,算法可以基于可行的解决方案(见规则的重量gydF4y2Ba
从概率的角度来看,当一个新节点插入到图,节点的路径传递越多,越有可能重复路径将生成。因此,重量相同的情况下,用更少的子节点的节点将优先从下面路径会让更少的重复尝试,使其更容易找到解决路径。gydF4y2Ba
这个策略只适用于高复杂性的图表。压缩后,剩余的节点将连接一个和另一个形成路径;图的复杂性可能仍然很高。会有一条路径的情况可能是一个有效的解决方案,但节点通过携带过多的重量,所以道路不会被认为是最终的解决方案。在这种情况下,节点删除重会降低图像的复杂性和提高搜索效率。此外,它将节省时间和找出一种更好的解决方案权重较低的路径。gydF4y2Ba
通过分析,IBA的空间复杂性gydF4y2Ba
不失一般性,实验数据的情况下gydF4y2Ba
给定一个加权图gydF4y2Ba
LinkID定向边缘指数,SourceID是指数的起始顶点定向边缘,DestinationID指数的目标定向边的顶点,成本是定向边缘的重量。定向边的顶点的索引,编号从0(不一定连续,但确保索引不重复)。gydF4y2Ba
SourceID路径的起点,DestinationID目的地的路径,和IncludingSet代表附着在顶点集吗gydF4y2Ba
64位操作系统Windows 7,英特尔酷睿i5处理器,jre1.6, 32位的java虚拟机,4 G内存,使用。gydF4y2Ba
验证回溯法和IBA, NCA, CCA算法,四组实验将进行解决方案的时间限制为10秒。从实验中gydF4y2Ba
总节点10;附着在节点3;边是39。gydF4y2Ba
图gydF4y2Ba
实验结果的实验gydF4y2Ba
总节点20;附着在节点5;边是55。gydF4y2Ba
图gydF4y2Ba
实验结果的实验gydF4y2Ba
总节点30;附着在节点10;边是135卡路里。gydF4y2Ba
图gydF4y2Ba
实验结果的实验gydF4y2Ba
总节点40;附着在节点10;边是229卡路里。gydF4y2Ba
图gydF4y2Ba
实验结果的实验gydF4y2Ba
实验结果表明,IBA效率高于回溯法评判权重或搜索时间。NCA只显示略有优势IBA因为远程节点图中是非常有限的。特别是,从所有维度来看,CCA证明重要的搜索结果质量效率优越其他算法,表明CCA在解决此类问题的有效性。gydF4y2Ba
从之前的四个实验观察,回溯法的各自的效率,IBA, NCA大大降低节点增加的总和。因此,没有研究价值添加更多的节点图。本节继续CCA和ICCA之间进行比较。gydF4y2Ba
实验环境仍将是相同的实验gydF4y2Ba
总节点是60,附着在节点和边是285卡路里。gydF4y2Ba
总节点100,附着在节点是15,边缘是516。gydF4y2Ba
总节点200,附着在节点20日和边是997卡路里。gydF4y2Ba
总节点400,附着在节点是28岁,而边缘是2178。gydF4y2Ba
总节点600,附着在节点是50,和边是3418卡路里。gydF4y2Ba
图gydF4y2Ba
实验结果的实验gydF4y2Ba
像邮递员问题,旅行问题,总线设计、网络路由问题,和其他类似的情况下可以抽象为路径找到图模型作为本研究中讨论。IBA和NCA适用于中等规模的问题。NCA建议解决图表包含许多远程节点,而CCA和ICCA更高效地处理大规模问题的算法的复杂性。此外,ICCA能够提高搜索效率时,子节点调整。gydF4y2Ba
当问题的规模变得更大,CCA, ICCA可能无法搜索整个解空间完全在给定时间内的最优解。在这种情况下,压缩的想法将被纳入启发式算法如遗传算法、蚁群算法期待一个更高效的搜索算法,以解决路由问题规模。gydF4y2Ba
作者宣称没有利益冲突有关的出版。gydF4y2Ba