融合強化學習和模糊邏輯的DTN路由算法
【摘要】:在延遲容忍網絡中,網絡拓撲結構動態變化,節點間通信受限,如何選擇優秀的中繼節點進行消息轉發以提高消息投遞成功的機率是容遲網絡領域重要的研究課題。本文提出了融合強化學習和模糊邏輯的DTN路由算法(A routing algorithm combining reinforcement learning and fuzzy logic in delay-tolerant network)。該算法將DTN中消息傳輸的路徑問題映射為有限的馬爾可夫決策過程,針對傳統算法對中繼節點選擇的盲目性、對節點和消息的評價缺乏全面性等問題進行改進。首先使用Q-Learning強化學習算法指導消息選取最佳的中繼節點,其次通過模糊邏輯系統對節點和消息進行綜合評價,并將評價值應用于路由轉發。實驗結果表明,與PROPHET,CARA,Epidemic,RLFGRP算法相比,RARF算法在低延時、低耗能的條件下有效提高了消息的投遞概率。
【相似文獻】 | ||
|
|||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||
|