大數(shù)據(jù)算出“異常出行行為” 小小公交卡或能讓小偷“現(xiàn)形”
全國公安交管部門已經(jīng)在新浪微博開通認(rèn)證了4300余個賬號,日均發(fā)布微博數(shù)量超過1.5萬條;公交卡大數(shù)據(jù)今后可能會抓住城市九成以上的小偷;南京蘇州已經(jīng)成為全國智能出行發(fā)展城市十強(qiáng)城市……近日由公安部交通管理科學(xué)研究所、高德地圖等機(jī)構(gòu)聯(lián)合主辦的“互聯(lián)網(wǎng)+交通出行服務(wù)”論壇上,專家介紹說,未來交通大數(shù)據(jù)的應(yīng)用將會給百姓帶來更多“不可能”的方便。
公交卡信息如何“算出”小偷
根據(jù)公交卡的大數(shù)據(jù),能夠篩選出九成以上的疑似小偷,這是怎么做到的?有參加論壇的專家介紹說,現(xiàn)在我們結(jié)合公交車GPS數(shù)據(jù)、乘客刷卡信息等數(shù)據(jù),能夠獲取每輛公交車每個站點停車時間、上下車乘客數(shù)量、乘客精細(xì)時空軌跡等,可以做“公交車線路、站點、發(fā)車頻次優(yōu)化”、“典型居住區(qū)和就業(yè)地的通勤出行分析”等分析。
A
驗證原理:絕大多數(shù)乘客乘坐公交車或地鐵出行時,會選擇最優(yōu)出行方案,要么用時最短,要么換乘次數(shù)最少;但有極少數(shù)人的乘車路線很奇怪,比如會繞行一大圈或者突然改變乘車路線,沒有什么規(guī)律可言,如果某人的異常行為足夠多,那么他有可能是小偷。
B
研究過程:此前發(fā)布的這一成果是一項大學(xué)教授做的研究,在一次國際會議上公布過成果。以北京為例,研究人員分析了兩個月約16億次公交卡刷卡數(shù)據(jù)記錄,共涉及約600萬名乘客。
第一步,研究者把北京劃分為居住、工作、教育、購物、娛樂、醫(yī)療等多個小功能區(qū)塊,建立起包括896條公交路線、近4.5萬個公交車站與18條地鐵路線、320個地鐵站的公共交通網(wǎng)絡(luò)數(shù)據(jù)集,通過數(shù)據(jù)建模從龐大的公交卡記錄中過濾掉普通乘客。
第二步,結(jié)合從警方報告和微博上收集到的失竊信息,通過機(jī)器學(xué)習(xí)算法從異常出行信息中挖掘出潛在的小偷。
實驗結(jié)果:上述方法中被歸為“行為異常”者,之后被確認(rèn)為小偷的驗證率高達(dá)92.7%??墒?,如果小偷頻繁換用公交卡呢?據(jù)研究此項目的專家表示,就算換卡也有辦法,比如小偷經(jīng)常團(tuán)伙活動,這也是一個明顯的特征。
C
質(zhì)疑聲音:不過也有人表示,人的活動是十分復(fù)雜和偶然的,也許乘客心情不好,或者坐過站回頭、臨時改變行程等等,都有可能出現(xiàn)行為異常,不能都判定為小偷吧。