<kbd id="ia2e8"><input id="ia2e8"></input></kbd><u id="ia2e8"></u>
  • <blockquote id="ia2e8"></blockquote>
  • <blockquote id="ia2e8"></blockquote>
  • <samp id="ia2e8"><label id="ia2e8"></label></samp>
  • 多維度的用戶駕駛行為分析方法與流程

    文檔序號:26100088發布日期:2021-07-30 18:10
    多維度的用戶駕駛行為分析方法與流程
    本發明涉及駕駛行為分析領域,具體為一種多維度的用戶駕駛行為分析方法。
    背景技術
    :目前,對駕駛員還沒有結合時間段和路網中道路的各種屬性信息,統計分析的結果只考慮行駛里程和時間,分析的維度單一,具有片面性,不能全面顯示用戶的駕駛行為特征。沒有對用戶的出行數據進行挖掘分析,進一步提煉用戶的個性化數據,從而產生商業價值。技術實現要素:為了克服現有技術的缺陷,提供一種分析精確、適配性高的分析方法,本發明公開了一種多維度的用戶駕駛行為分析方法。本發明通過如下技術方案達到發明目的:一種多維度的用戶駕駛行為分析方法,其特征是:按如下步驟依次實施:接收用戶軌跡數據:從數據源接入服務中實時獲取用戶軌跡數據,轉換成程序內部的自定義格式并進行數據攢存,以備后面的處理所用。地圖匹配:將用戶軌跡的gps點通過地圖匹配處理算法,匹配到道路上,還原用戶的真實行駛路線,獲取用戶行駛的每條道路的屬性,并且獲得用戶在每條道路上的進入時間、行駛時間和行駛距離等信息。單次軌跡計算:經過地圖匹配后,用戶在每條道路上的行駛信息和道路的屬性信息就都得到了,同時實時接入每個城市的日出/日落時間,就可以計算出用戶在該次行駛軌跡中的里程、時間、市區/郊區/高速/非高速等的行駛里程和行駛時間、早晚高峰/白天/晚上不同時間段的行駛里程和行駛時間等信息。同時將該信息寫入數據庫,以便后面的查詢和統計分析。統計分析:按照天、月、年的時間周期,定時對用戶的每次行駛軌跡的數據進行累加,就可以得到不同時間周期的用戶駕駛行為統計結果,用于用戶駕駛行為特征判斷、用戶常用行駛路線分析、用戶出行地點的分析和保險數據的建模分析等等。車輛的車載終端通過包括gps模塊在內的感應裝置讀取車輛的位置和狀態信息,并定時向服務中心的網絡層上傳至少包括車輛id、駕駛員身份識別碼、時間、里程、速度、gps有效性、怠速狀態、急剎狀態、acc狀態、每分鐘平均速度等狀態信息的行駛數據等,后臺的數據處理中心接收終端上傳的數據,解析后存儲在數據庫中,數據庫的統計模塊根據行駛數據分別統計出最高速度、平均速度、急剎次數、行駛時長、超速次數、超速時長、疲勞駕駛次數、最長連續駕駛時間等用戶的駕駛行為分析結果。本發明可通過地圖匹配后獲取用戶行駛道路的路網屬性及限速值,同時實時接入各城市的日出/日落時間,從多個維度進行用戶出行特征的統計和分析,使得用戶駕駛行為特征分析更細化更全面化。本發明可通過用戶出行數據的挖掘分析,獲取用戶常用行駛路線,進而統計分析用戶在常用行駛路線/陌生行駛路線下的行駛時間和里程。本發明可通過用戶每次出行軌跡的起點、終點和在起點/終點的poi位置的停留時間長短的統計分析,生成用戶標簽,為用戶個性化服務提供數據基礎。本發明結合時間段和基礎地圖數據提供的道路屬性,對用戶的行駛里程和行駛時間進行分類統計,同時結合用戶自己的行駛速度,計算其超速行駛的里程和時間,從而全面地判斷用戶的駕駛行為特征。同時對用戶的海量出行數據進行挖掘分析,進一步提煉用戶的個性化數據。綜合用戶駕駛行為數據和個性化數據,為保險建模分析和用戶個性化服務提供數據基礎,同時通過生成的用戶標簽,向用戶推送其感興趣的廣告、新品上市等信息,充分挖掘大數據的商用價值。本發明具有如下有益效果:1.由于采用了地圖匹配的處理功能,使得用戶駕駛行為分析不受終端設備數據采集缺陷的影響,只要有gps位置信息,就可以通過地圖匹配,獲得車輛的行駛軌跡,從而計算用戶的行駛里程、行駛時間和速度、平均速度、最大速度等,從而大大增加了采集用戶軌跡數據的來源,同時由于終端采集設備的功能簡單,也減少了數據采集終端的硬件成本和軟件開發成本,大大增加了設備的普適性。2.由于從多個維度(空間、時間等)對用戶的出行特征進行統計分析,使得用戶駕駛行為特征分析更細化更全面化,為用戶保險建模分析和用戶個性化服務提供了堅實的數據基礎,從而帶來了更大的商用價值和應用。3.通過用戶每次出行軌跡的起點、終點和在起點/終點的poi位置的停留時間長短的統計分析,進而可以分析出用戶是什么類型的人群,生成用戶標簽。根據用戶標簽類型,就可以向用戶推送其感興趣的廣告、新品上市等信息,從而帶來巨大的商用價值。附圖說明圖1是本發明的流程示意圖,圖2是本發明運行時用戶保險和駕駛行為分析數據的計算模型圖。具體實施方式以下通過具體實施例進一步說明本發明。實施例1一種多維度的用戶駕駛行為分析方法,主要是通過用戶行駛軌跡數據接收、地圖匹配、軌跡結算和統計分析,從多個維度進行全面分析,獲取用戶的駕駛行為和出行行為特征,為保險建模分析、用戶分類進行個性化服務推送提供數據基礎。如圖1所示:1.接收用戶軌跡數據:用戶駕駛行為分析主程序從數據源接入服務中實時獲取自己需要的用戶軌跡數據,轉換成內部高效計算的數據格式并積攢數據。通過對用戶一次行駛軌跡的開始和結束判斷標準,將用戶該次行駛軌跡的所有數據打包進行后續處理。用戶一次行駛軌跡的開始和結束判斷標準如下:(1)如有明確的點火和熄火標志,就將點火時間和熄火時間之間的所有gps點作為用戶的一次行駛軌跡。(2)用戶導航開始和導航結束間的所有gps點作為用戶的一次行駛軌跡。(3)如果沒有1和2的判斷標志,就以軌跡中連續兩gps點時間間隔大于n分鐘(比如15分鐘)進行判斷,如超過該設定閾值,就將前面的所有gps點作為用戶的一次行駛軌跡。2.地圖匹配:由于用戶行駛時會出現跨城市,所以需要進行全國地圖的道路匹配,考慮到用戶軌跡數據量會越來越大和全國地圖需要占用大量內存,需要將地圖匹配做成服務的方式,方便用計算機集群進行分布式的地圖匹配。這樣可以減少主程序的內存和計算壓力,也可以減少不同功能之間的耦合度,方便維護和擴展。主程序將積攢的用戶每一次行駛軌跡的所有gps點傳輸給地圖匹配服務進行處理。首先對gps點序列按照時間的先后順序進行排序,并對gps點進行異常數據處理,比如時間重復gps點過濾、堆積點變成一個gps點進行處理等。然后進行單點地圖匹配,獲取每個gps點的多條候選道路,根據gps點方向與行駛道路的夾角和gps點距離候選道路的距離進行權重計算,獲取每條候選道路的選中權重。再經過兩兩gps點的路徑推測,其中需要考慮道路的連通性和匹配繞路錯誤。推測完后進行路徑回溯,獲取用戶行駛的所有道路。同時計算用戶行駛的每條道路的進入時間、行駛時間和行駛距離,還有每條道路的道路等級、長度、市區/郊區標識、高速/非高速標識、每條道路的限速值、用戶每次行駛軌跡的起始點和終止點分別對應的poi信息等內容。地圖匹配的處理流程具體如下:(1)gps點預處理:將車輛軌跡數據按gps時間進行排序,對異常gps點進行過濾,同時對堆積點和來回跳點進行處理,同時對gps方向進行修正,保證后續處理的軌跡是正常的。(2)gps點抓路獲取候選link:先進行單點匹配,獲取gps點的多條候選link,同時計算每條候選link的可信度,可信度計算方法有兩種,具體如下:i.根據距離和方向進行計算:根據gps方向和gps點到候選link的距離計算權重,如(a)式所示:(a)式中,wd+wθ=1;當候選道路過多時,wd=0.4,wθ=0.6,否則wd=0.6,wθ=0.4;di、θi分別為gps點到候選link的距離及gps點方向與候選link方向的夾角;dmax、θmax分別為設定的最大距離和最大角度閾值;λi越小,表示該候選link的選中權重越高,反之越低。ii.只根據距離計算:基于gps坐標點和投影點之間的距離計算匹配的概率,一般來說該距離滿足正態分布n(μ,σ2),如(b)式所示:(b)式中,μ=0,σ=30m~60m,綜合考慮gps精度和道路寬度;i指第i個gps點,j指第j個候選link。上述兩種方法需要根據實際情況使用。當速度偏高時,用第二種方法計算的概率可信度更高,同時結合第一種方法計算的概率,主要是參考gps方向的影響。(3)路徑推測:由于gps點的頻率較高,兩gps點間的行駛距離較短,幾乎是直線。所以用兩gps點間的直線距離和兩gps點間在候選link上的投影距離進行比較,誤差在10%(參數可調)內的,認為該link就是當前gps點的匹配link,投影點坐標即為該gps點在行駛link上的位置。另外,兩個gps點間隔1秒,大部分是在同一條link上,即使是跨link的話,基本上都是相連的后續link。根據link的拓撲關系和下一個gps點的候選link是否相同,從而確定車輛轉彎時的用戶行駛路徑。根據多個連續gps點的候選link的相同性,確定這些gps點的共同候選link就是用戶的行駛link。對于平行路,可能存在兩條link,這個需要通過后續gps點的行駛link和該link的拓撲關系進行判斷,加上速度和道路等級的判斷,選取概率較高的行駛路徑作為用戶的最終路徑。地圖匹配的正確率對駕駛行為分析的準確性至關重要,用不同城市的不同軌跡數據進行了測試,該算法的匹配準確率如下:城市軌跡數量(條)正確率p(%)北京41394.29%上海40894.78%廣州25992.51%深圳27893.79%。3.單次軌跡計算:經過地圖匹配后,用戶在每條道路上的行駛信息和道路的屬性信息就都得到了,同時實時接入每個城市的日出/日落時間,就可以計算出用戶在該次行駛軌跡中的里程、時間、市區/郊區/高速/非高速等的行駛里程和行駛時間、早晚高峰/白天/晚上不同時間段的行駛里程和行駛時間等信息,同時將該信息寫入數據庫,以便后面的查詢和統計分析。主要的內容包含:行駛里程、行駛時間、平均速度、最大速度、市區/郊區的行駛里程和時間、高速/非高速的行駛里程和時間、早晚高峰/白天/晚上不同時間段的行駛里程和行駛時間、用戶超限速值行駛的次數及里程和時間等。(1)用戶在每條道路上的行駛距離之和即為用戶該次軌跡的行駛里程,行駛時間計算方法相同。由于用戶行駛的每條道路都有屬性,比如市區/郊區標識、高速/非高速標識、限速值等,那么該用戶在所有市區標識道路上的行駛距離之和即為用戶該次行駛軌跡中的市區行駛里程,行駛時間之和即為用戶該次行駛軌跡中的市區行駛時間,郊區的行駛里程和時間、高速/非高速的行駛里程和時間的計算方法相同。(2)系統中實時接入各城市每天的日出/日落時間,同時根據用戶出行軌跡的大數據挖掘定義每個城市的早晚高峰時間段,從而將用戶的出行時間分為早晚高峰、白天、晚上三個時間段。根據用戶每次行駛軌跡中相鄰兩gps點涉及道路或部分道路的進入時間為基準,和早晚高峰、白天、晚上三個時間段進行判斷,將所屬時間段上用戶的行駛時間和里程分別相加,就可以得到用戶在一次行駛軌跡中在不同時間段的行駛時間和里程。(3)超速行駛是指用戶自己駕車行駛時在每條道路上的平均速度超過該道路的限速值,具體判斷標準如下:一般超速:1.2v限速<v車<=1.5v限速,嚴重超速:v車>1.5v限速。根據用戶在每條道路上行駛的速度和該道路的限速值進行比較,將不同超速程度下每條道路上行駛的里程和時間進行累加,就可以得到用戶該次行駛軌跡在不同超速程度下的超速行駛的次數、里程和時間。同時結合道路的市區/郊區、高速/非高速的路網屬性,可以計算出用戶在市區/郊區、高速/非高速等不同道路屬性上的超速次數、行駛里程和時間。4.統計分析:按天統計的數據一般放在凌晨進行,通過數據源id、用戶id作為關鍵key,將相同key的同一天數據進行累加即可以得到每個用戶一天的駕駛行為統計結果。按月、年時間周期的統計項和按天統計的數據一樣,在更新天表的時候同時更新月表、年表。5.數據挖掘分析:基于用戶長時間的出行統計數據進行數據挖掘,可以獲取用戶的熟悉路線及在熟悉路線上行駛的時間和里程;根據用戶每次出行軌跡的起始點所對應的poi信息計算用戶在不同位置的停留時間,從而分析出用戶是什么類型的人群,生成用戶標簽。(1)用戶在兩點(出行起點和終點)之間(家庭和公司之間、家庭和購物場所之間等)出行的行駛路徑一般不多,只有固定的幾條路線。根據用戶每次的行駛軌跡起點、終點坐標及對應的poi信息和中間經過的道路,統計分析出其幾個固定地點及這些地點之間的行駛路線,比如家、公司、購物場所、娛樂場所、餐飲餐所、汽車4s店等,通過這些信息就可以將熟悉路線提煉出來。有了這個判斷標準,就可以統計分析出用戶每次行駛軌跡中的道路是屬于熟悉路線還是陌生路線,從而計算出各自條件下的行駛時間和里程以及各自所占比例。具體示例如下:路線時間(hour)時間比例里程(km)里程比例熟悉路線7077.8%170063.0%陌生路線2022.2%100037.0%。(2)一般情況下,用戶在家庭停留時間在晚間,在公司停留時間在周一~周五的白天,在餐飲場所停留時間在中餐或晚餐時間,在娛樂場所停留時間在周末或者周一~周五的晚間,購物場所停留時間在周末。根據上述基本規律,通過用戶停車時間長短(在上述場所車輛會熄火,時間較長)及地圖poi信息(寫字樓、居民小區、購物場所、餐飲場所、娛樂場所等)的大數據分析,可以挖掘出用戶在上述地點的停留時間、次數及比例,進而可以分析出用戶是什么類型的人群,生成用戶標簽。根據用戶標簽類型,就可以向用戶推送其感興趣的廣告、新品上市等信息。比如:經常去汽車4s店就表示該用戶有買車的意向;經常去售樓處就表示該用戶有買房的意向。下面是一個用戶1個月(30天)在不同場所停留時間、次數及駕駛時間的分布示例:位置時間(hour)時間比例次數次數比例家庭27037.5%6027.0%公司20027.8%4219.0%購物場所405.5%209.0%娛樂場所304.2%209.0%餐飲場所506.9%4018.0%汽車4s店202.8%209.0%售樓處202.8%209.0%…………………………駕駛出行9012.5%111100%每次行駛軌跡的起點和終點各算1次,比如家->公司->4s店->家,那么家、公司和4s店就各為2次。經過用戶出行數據的統計分析和數據挖掘分析,就可以進行用戶駕駛行為特征判斷、用戶保險數據的建模分析、用戶個性化服務推送等等。其中,用戶保險和駕駛行為分析數據的計算模型如圖2所示。用戶個性化服務推送就是根據大量數據進行駕駛行為分析后得到的用戶標簽(比如:上班族、汽車發燒友、購物達人等),通過第三方軟件(比如app)進行消息發布,推送給相關用戶群體。當前第1頁12
    再多了解一些
    當前第1頁1 2 
    網友詢問留言 已有0條留言
    • 還沒有人留言評論。精彩留言會獲得點贊!
    1
    中文字幕一区在线观看视频_国产偷v国产偷v_西西人体44rt net毛最多_伊人久久大香线蕉综合网