論文閱讀|Network Traffic Prediction Model Considering Road Traffic Parameters Using Artificial Intelligence Methods in VANET

寫給自己看的中文整理版,使用很多的 chatgpt + google 翻譯。

沒有完全照翻,沒有全翻。

圖片表格數學公式等都對照 paper,沒有放。

有些沒放可能是因為我看不懂。

簡單講:

本文提出的模型透過可能造成道路流量 (事故、塞車等)的參數,搭配機器學習 (machine learning, ML) 跟深度學習 (deep learning, DL) 來預測網路流量。

paper: https://ieeexplore.ieee.org/document/9684398

 

複習一下 ML DL 間的關係跟差別。

什麼是人工智慧、機器學習和深度學習?

 

ABSTRACT

Vehicular Ad hoc Networks (VANETs) 是建立在智慧車輛上的網路,可以進行車對車 (V2V) 和車對路邊單元 (Vehicle-to-Road Side Units, V2R) 通訊 (communication)。

在本文中,我們提出了一個透過可能導致塞車狀況 (road traffic) 的參數來預測網路流量的模型,整合 RF-GRU-NTP (Random Forest - Gated Recurrent Unit - Network Traffic Prediction) 演算法,以同時基於道路和網路的交通情況來預測網路流量

此模型包括三個階段,分別是

基於 V2R 通訊的網路流量預測、

基於 V2V 通訊的道路交通預測,

以及基於 V2R 和 V2V 通訊的道路情況的網路流量預測。

在第三階段,混合模型從合併 V2R 與 V2V 的資料集中透過 ML 的 RF 選擇重要特徵,然後應用 DL 的 GRU (Gated Recurrent Unit) 來預測網路流量。

模擬結果表明,所提出的 RF-GRU-NTP 模型在執行時間和預測誤差方面表現優於其他用於網路流量預測的演算法。

 

1. Introduction

有一種新的觀點認為,道路上的交通可能會影響網路流量。根據 VANET 中的 V2V 通訊,車輛可以相互發送封包以預測道路交通情況。隨著車輛和道路交通量的增加,發送的封包數量也會增加,從而導致網路流量增加。

以前的研究通常分別關注道路交通和網路流量,而本文旨在道路和網路流量參數之間的關係,進行網路流量預測。

通過 ML 可以實現最佳的流量預測,ML 技術分為三類:無監督學習 (unsupervised learning: 基於未標記資料進行培訓) 、監督學習 (supervised learning: 基於標記資料進行培訓) 和強化學習 (reinforcement learning: 從學習代理 (learning agent) 的性能中學習)。其中,遷移學習 (Transfer Learning) 和線上學習,是這三種 ML 方案的子類別[4]。

在處理大規模和複雜資料集的情況下,也可使用 DL 演算法預測問題。其中RNN (Recurrent Neural Network) [5],[6]和 CNN (Convolutional Neural Network) [7]是許多研究中使用的兩個著名演算法。

通常,RNN 具有兩個模組,稱為 LSTM (Long Short-Term Memory) [8]和 GRU (Gated Recurrent Unit) [9],[10],其中 LSTM 旨在解決消失問題。這些演算法最關鍵的特點之一是它們可以學習長時間內的依賴關係,以進行時間序列資料集的預測,而 GRU 演算法由於門 (gate) 數量較少,因此更快[11]。

此外,為了提取更多特徵和雙向依賴關係,可以使用 Bi-LSTM (Bi-directional Long Short-Term Memory) 演算法。在這種演算法中,可以使用兩個不同的隱藏層 (正向和反向) 來執行過程的序列[12]。

本文提出了一種考慮道路流量參數的網路流量預測方法

我們嘗試了不同的 ML 和 DL 演算法,旨在進行網路流量預測,並將我們的工作分為三個階段。

第一階段涉及網路流量預測。

第二階段涉及道路交通預測。

第三階段是前兩個階段的結合,在進行網路流量預測時,同時考慮可能影響網路流量的道路交通參數。

我們使用了來自全球定位系統 (Global Positioning System, GPS) 的兩個資料集:V2R 資料集用於網路流量預測,V2V 資料集用於道路交通預測。

本文的重要貢獻如下:

我們使用 ML 演算法對從 V2R 通訊導出的真實資料集進行網路流量預測,該資料集是基於車輛發送給路邊單元 (RSUs) 的封包。此外,我們實現了各種 ML 演算法,如 RF (Random Forest) 、KNN (K-Nearest Neighbors) 、SVM (Support Vector Machine) 和 NB (Naive Bayes) 演算法,其中 RF 表現最佳

我們選擇發送者速度作為道路參數來預測道路交通流。我們利用一個基於 V2V 通訊的真實資料集,旨在使用 DL 來預測發送者的速度以進行道路交通預測。我們嘗試了不同的 DL 演算法,如 LSTM (Long Short-Term Memory)、Bi-LSTM (Bi-directional Long Short-Term Memory) 和 GRU (Gated Recurrent Unit),其中 GRU 演算法表現最佳

我們研究了前兩個步驟對網路流量的影響,這兩個步驟基於道路和網路參數,旨在使用 ML 和 DL 演算法進行網路流量預測。

在這一步驟中,我們結合了兩個資料集 (V2V 和 V2R),然後使用 RF 演算法進行特徵選擇,以找出影響網路流量的最有影響力的參數。之後,透過 GRU 演算法,我們基於道路和網路中的參數來預測網路流量。結果表明,新提出的 RF-GRU-NTP 模型可以更準確地預測 VANET 環境中的在道路狀況影響下的網路流量,比純演算法更準確。

這篇論文的獨創性在於它將 ML 和 DL 技術結合到一個單一的網路流量預測模型中,同時考慮了道路參數和網路參數

 

2. BACKGROUND AND RELATED WORK

智慧交通預測的領域中已經有幾種不同的模型被提出,從某種角度來看,我們可以將以前的工作分為兩部分:道路交通預測和網路交通預測,在其中大多數使用不同的 ML 和 DL 演算法。

A. NETWORK TRAFFIC PREDICTION

在[15]中,作者提出了一個透過部署 LSTM (Long Short-Term Memory) 改善網路範圍內鏈路級交通預測的框架。通過 SDN 或 SNMP (Simple Network Management Protocol)
測量收集了網路未來吞吐量的統計資料。與基於 ARIMA (Auto Regressive Integrated Moving Average) 的模型相比,所有 LSTM 的變體都具有更好的網路流量建模性能。但是,他們也可以嘗試其他比 ARIMA 基線更準確的 DL 演算法來進行比較。

在[16]中,採用 DL 優化網路資源配置和網路流量預測。在第一部分中,他們使用基於 GRU (Gated Recurrent Unit) 演算法的人工神經網路 (Artificial Neural Network, ANN)
來訓練預測模型;在第二部分中,他們在學習過程中的每個反覆運算中使用 EAM 演算法進行模型評估。

[17]中提出一種改進網路流量預測的新方法。他們嘗試智慧地使用序列挖掘 (sequence mining) 來預測網路流量,為此實施了 LSTM 和 ANFIS (Adaptive Neuro-Fuzzy Inference
System) 作為時間序列模型。他們將對象分成了五個簇 (cluster),作為 LSTM 和 ANFIS 演算法的輸入,用於網路流量預測。

在[18]中,使用不同類型的 CNN 在真實資料上尋找網路流量預測的最佳參數。結果顯示,CNN 及它的不同類型表現優於其他傳統 ML 演算法。

在[3]中 (?),作者試圖通過使用 Taguchi 方法,通過使用無監督演算法對逐層特徵進行分類,來開發和優化交通學習 (traffic learning)。他們提出了一種優化的交通流預測結構,該結構通過堆疊自動編碼器 (stacked autoencoder, SAE) 和 Levenberg-Marquardt (LM) 演算法進行訓練,以實現短期交通預測。他們的方法旨在提高交通流量預測的精確度。由於不可預測的情況,交通流資料可能不規律,而所提出的模型在處理這個問題時非常實用。

在[19]中提出了一種 LTE 網路流量預測的新方法。他們使用了三種不同的 ML 演算法,包括 RF (Random Forest) 、Bagging 和 SVM (Support Vector Machine),用公共蜂窩流量資料集來進行網路流量預測。Bagging 在數值和分類特徵的組合中表現出良好的結果,但需要 116 秒學習時間,RF 需要 112 秒,而 SVM 只需要 6 秒。

B. ROAD TRAFFIC PREDICTION

深度神經網路 (Deep Neural Network, DNNs) 可以用大數據來預測交通流量。然而,空間和時間問題存在一些挑戰。在[2]中,作者提出了一個預測模型,旨在解決這些問題並分析基於深度神經網路的交通流量預測 (DNN-based traffic flow prediction, DNN-BTF) 在可靠精度下的交通流量資料上的內部機制,以提高預測的準確性。

在[23]中,作者提出了一種使用 GRU (Gated Recurrent Unit) 的空間-時間特徵選擇算法 (spatial-temporal feature selection algorithm using GRU, GRU + STFSA),用於短期交通流量的預測,它是使用 GRU 進行空間和時間分析的組合。

在[24]提出了一種用於 GPS (Global Positioning System) 資料的交通流量預測的混合 CNN-LSTM 模型。他們採用了一種貪婪策略方法來訓練 CNN-LSTM 模型,以解決混合模型的複雜性和耗時的訓練過程。

[25]中的作者提出了一個基於 SVR (Support Vector Regression) 的短期交通流量預測的混合框架。他們應用了 RF 來找出具有影響力的特徵,並改進了 GA (GeneticAlgorithm) 演算法以找到最優特徵。

還有一些研究考慮了使用不同 DL 演算法的天氣條件來預測交通情況[26]–[30]。

人工智慧 (AI) 方法可以是網路交通預測的最佳解決方案。然而,以往的研究主要集中在網路交通預測或道路交通預測方面,因此缺乏考慮這兩個問題的研究,這促使我們提出了一種基於道路交通流的新型網路交通預測方法。

表1顯示了先前在道路交通預測、網路交通預測以及它們的提出方法方面的研究摘要。

 

3. METHODOLOGY

在這一節中,我們提出了一種新的 RF-GRU-NTP (Random Forest- Gated Recurrent Unit- Network Traffic Prediction) 模型,使用 ML 和 DL 演算法,旨在預測 VANET 中的網路流量。圖1顯示了 VANET 環境的架構。

許多參數可以影響網路流量,因此所提出的模型分為三個階段,旨在考慮不同的有效參數進行網路流量預測。圖2顯示了所提出模型的架構,包括三個階段。

A. PHASE 1 - NETWORK TRAFFIC FLOW

在第一階段,我們僅關注了 V2R 通信,並根據車輛發送給 RSUs 的封包來預測網路流量。在這一步中,我們實施了分類方法,然後嘗試了不同的 ML 算法以獲得最佳性能和預測結果的準確性。

1) RANDOM FOREST ALGORITHM

RF 是一種監督式學習演算法,由多個決策樹組成,這些決策樹結合在一起以獲得更準確的預測結果。因此,我們可以在回歸和分類問題中使用 RF 演算法,克服 ML 過度擬合 (over fitting) 的問題。[36]。

2) CLASSIFICATION METRICS

我們使用了四個指標來評估我們的分類模型[38]:精確度、召回率 (recall) 、F1 分數和準確性。

1. 精確度顯示了所有被預測為正例的觀察中,真正為正例的觀察數量,表示為

Precision = TP / (TP + FP) (1)

2. 召回率代表了在實際類別中被正確預測為正例的觀察數量占所有實際類別中觀察總數的比率,表示為

Recall = TP / (TP + FN) (2)

3. F1 分數受精確度和召回率的影響,表示為

F1 = 2 × [(精確度 × 召回率) / (精確度 + 召回率)] (3)

4. 準確性顯示了所有樣本中真陽性和真陰性觀察的數量,表示為

Accuracy = [(TP + TN) / (TP + TN + FP + FN)] × 100 (4)

其中,TP:真陽性;FP:假陽性;TN:真陰性;FN:假陰性。

圖 3 顯示了我們提出的模型的第一階段工作流程,其中包括我們使用的算法、庫 (library) 、工具和指標。

我們將資料標記為兩個類別:類別 1 表示封包已接收,我們假設這是一種非塞車情況;而類別 0 表示未接收到封包,我們假設這是塞車情況。

然後,我們將資料集分成 75% 的訓練集和 25% 的測試集。基於我們用來評估模型的各種指標,我們發現當使用封包接收作為網路參數的網路流量預測時,RF 演算法取得了最佳結果

B. PHASE 2 - ROAD TRAFFIC PREDICTION

第二階段側重於 V2V 通信,考慮車輛的速度 (發送方)作為道路參數發送封包,以預測道路流量。在這個階段,我們嘗試了回歸方法 (regression method),並部署了三種不同的 DL 演算法,包括 GRU (Gated Recurrent Unit)
、Bi-LSTM 和 LSTM (Long Short-Term Memory)。我們使用一些用於深度回歸演算法的評估指標來評估它們的性能,結果發現在道路交通預測方面,GRU 演算法表現最佳

1) GRU ALGORITHM

RNN (Recurrent Neural Network) 演算法有不同的類型,GRU (Gated Recurrent Unit) 是從 LSTM (Long Short-Term Memory) 衍生出的高效演算法之一。GRU 繼承了 RNN 可以自動學習特徵的主要優勢,也可以像 LSTM 一樣以更快的方式長期記憶預測性能。LSTM 有三個門 (gates),包括輸入門、遺忘 (forget) 門和輸出門,而 GRU 演算法只有兩個門,包括更新門和重置門,這使得 GRU 更簡單、更高效[23]。重置門的作用是確定需要忘記多少以前的資訊,更新門定義了需要保留並傳遞到未來資訊的記憶體量[11]。圖4顯示了 GRU 演算法的內部結構。

更新門確定了需要傳遞到未來的先前資訊的數量。重置門在 (7) 中計算,與更新門類似。但是,不同之處在於重置門將決定需要忘記哪些過去資訊

當發送者速度下降到 60公里/小時以下時,我們將認為道路上存在交通壅堵的情況。

2) REGRESSION EVALUATION METRICS

我們使用了四種評估指標,包括平均絕對誤差 (Mean absolute error, MAE)、均方誤差 (Mean Squared Error, MSE)、均方根誤差 (Root Mean Squared Error, RMSE) 和 R^2 分數,來評估我們的回歸模型[46]。

根據評估結果,使用 GRU (Gated Recurrent Unit) 演算法,並使用“發送者速度”作為道路參數,來預測道路交通,獲得了最佳性能

C. PHASE 3 - NETWORK TRAFFIC PREDICTION CONSIDERING ROAD PARAMETERS

最後,在第三階段,我們打算考慮影響道路交通的參數來預測網路交通流量。我們提出了一個 RF-GRU-NTP (Random Forest-Gated Recurrent Unit- Network Traffic Prediction) 模型來預測網路流量。所提出的模型結構如圖6所示。

這一階段包括

一個用於特徵選擇的 ML 演算法、

一個考慮道路網路參數來進行網路流量預測的 DL 演算法。

在這個過程中,首先,我們合併了 V2V 和 V2R 資料集。我們研究了包括“接收速度”、“封包接收”、“時間”、“信號強度”和“雜訊強度”在內的參數,通過 RF 演算法,採用“發送者速度”作為道路參數判斷是否有塞車的狀況,並找到了對此具有影響的特徵。隨後,我們將此結果遞給 GRU,作為輸入來預測網路交通流量

1) EFFECTIVE PARAMETERS DETECTION BY THE RANDOM FOREST

RF 演算法的作用是檢測影響網路流量的有效參數。

2) NETWORK TRAFFIC PREDICTIONBY THE GRU

在這個階段,我們根據“發送者速度”定義:當發送者速度小於 60 Km/h 就是塞車使用 RF,我們確定了對“發送者速度”最重要的參數是“接收者速度”和“封包接收”。然後基於以上,應用 GRU 演算法預測網路流量。根據評估結果,所提出的模型可以比其他嘗試過的演算法如 LSTM 和 Bi-LSTM 更準確地預測網路流量。

 

4. DATA PREPARATION AND PERFORMANCE EVALUATION

A. DATASET

我們使用了一個車輛網路資料集 (網路類型為 802.11 ad-hoc) [37],以測量V2V 和 V2R 在高速公路上的短程通信性能。為了進行資料收集,在車輛的車頂上安裝了外部天線。GPS 每兩秒報告一次車輛的經度、緯度、速度和行駛方向。

在 V2R 通信中,發送方以約 150 個封包/秒的平均速率廣播了 1,470 bytes 的封包。在 V2V 通信中,發送方和接收方都安裝在車輛上[48]。我們的工作中使用了基於 V2V 和 V2R 通信的兩個資料集。

對於第一階段,我們的重點是網路流量預測。

我們使用了基於 V2R 通信的資料集,並根據 RSUs 接收的封包來預測網路流量。

對於第二階段,我們使用了基於 V2V 通信的資料集;

我們針對“寄件者速度”來預測道路流量,而發送方和接收方車輛都在同一條車道上 (靠路右側的第二條車道),但它們的距離不同。

最後,對於第三階段,由於我們的目標是考慮道路流量對網路流量的影響來預測網路流量,我們結合了 V2V 和 V2R 資料集。在資料收集後,我們進行了預處理、資料清洗和使用 StandardScaler 方法進行了縮放和規範化的操作,以從中提取有效的參數。

為了實施這些演算法,我們使用了 Python 3.6 版本[49],每個階段使用了不同的庫 (library)。對於第一階段,我們實現了不同的 ML 演算法。我們使用了 Scikit-learn、Pandas、NumPy、Matplotlib、Mlxtend 以及其他一些庫。在這些演算法中 RF 的性能最好。對於實施 DL 演算法的第二和第三階段,我們使用了 Keras 庫和 TensorFlow [41]
來實現 LSTM、Bi-LSTM和 RF-GRU-NTP 模型。

B. PERFORMANCE EVALUATION OF THE NETWORK TRAFFIC FLOW PREDICTION

對於 DL 部分 (第二和第三階段),我們使用了 MSE (Mean Squared Error)、MAE (Mean Absolute Error)、RMSE (Root Mean Square Error) 和 R^2-SCORE 來評估效能。

在我們的性能評估中,KNN 和 RF 的結果幾乎是最好的。然而,當資料量很大時,用於找到最佳網路流量預測演算法的執行時間也需要考慮。表3根據結果列出了每個演算法的執行時間。基於我們得到的所有結果,RF 是最適合網路流量預測模型的選擇。

對於第二階段,我們的目標是基於“發送速度”來預測道路交通。我們使用了三種不同的 DL 演算法評估性能,其中,GRU 是最適合的:所需時間最短,誤差最低,R^2-SCORE最高。

最後,在第三階段,我們通過實施 ML 和 DL 演算法來考慮道路交通流量,從而預測網路流量。通過使用 RF 演算法,我們檢測了對“發送者速度”最有效的特徵。圖13顯示,對“發送者速度”影響最大的參數是“接收者速度”和“封包接收”,我們將其視為網路流量參數。

接下來的步驟是將對網路流量產生最大影響的參數作為輸入變數傳遞給 GRU 演算法,以進行網路流量的預測,並實施提出的 RF-GRU-NTP (Random Forest- Gated Recurrent Unit- Network Traffic Prediction) 模型。

我們使用 MAE、MSE、RMSE (Root Mean Square Error, RMSE) 和 R^2-SCORE 來評估我們模型的性能。

圖15描述了考慮了道路參數進行網路流量預測的結果。藍線表示測試資料,模型進行的預測顯示為橙色線。如圖所示,提出的 RF-GRU-NTP 模型優於我們實施的其他純演算法。

每個演算法擬合模型所花費的時間如表7所示,RF-GRU-NTP 演算法可以在不到 34 秒的時間內擬合模型,而 Bi-LSTM 和 LSTM 需要分別約 2 分鐘和 4 分鐘。

圖16顯示了提出的 RF-GRU-NTP 模型與我們實施的純演算法之間在擬合時間上的差異。考慮到道路參數,在網路流量預測方面,提出的 RF-GRU-NTP 模型表現出色。

 

5. CONCLUSION

在本文中,我們提出了一個 RF-GRU-NTP 模型,旨在基於道路和網路中的交通情況同時預測網路流量。我們將研究分為三個階段。在第一階段,我們專注於網路流量預測。我們使用了 V2R 資料集,並將車輛發送給 RSUs 的接收封包視為預測網路流量的網路參數。然後,我們嘗試了不同的 ML 演算法並進行效能評估,如 RF、NB (Naive Bayes)、KNN 和 SVM (Support Vector Machine, SVM) 演算法。在所有評估之後,當我們的目標是“封包接收”時,RF 在預測網路流量流方面表現更好

在第二階段,我們嘗試使用 V2V 資料集來預測道路交通流量,選擇“發送者速度”,定義塞車的狀況。我們假設如果發送者的速度低於 60公里/小時就是塞車。因此,我們實施了不同的 DL 演算法,包括 LSTM、GRU 和 Bi-LSTM。最後,我們使用一些回歸評估指標對結果進行評估,基於我們得到的結果,GRU 是最適合道路交通預測的演算法

然後,在第三階段,我們通過結合 ML 和 DL 演算法,考慮道路交通情況來預測網路流量

為此,我們合併了 V2V 和 V2R 資料集,並使用 RF 演算法進行特徵選擇。我們找到了最重要的特徵,即“封包接收”和“接收速度”,它們可以影響“發送速度”和網路流量。然後,通過實施提出的 RF-GRU-NTP 模型,我們預測了網路流量。因此,我們將結果與純演算法如 LSTM 和 Bi-LSTM 進行比較,以確保提出的模型在網路流量預測方面具有良好的結果。提出模型的主要複雜性在於合併兩個資料集實施 ML 和 DL 演算法,以實現考慮不同類型參數的網路流量預測。據我們所知,這是第一項基於道路交通流量預測網路流量的研究。然而,隨著車輛數量的增加,它們產生的資料量將形成大數據,因此在未來的工作中,我們將在大數據環境中實施我們提出的模型。