▲圖片來源:工業技術研究院
何謂大數據(英語:big data),又稱作巨量資料,顧名思義的意思說,因資料量龐大與複雜程度到無法用傳統式的軟體來處理這些數據資料,主要又分成結構化資料、非結構化資料及半結構化資料。
結構化資料是什麼,就是可定義及具標準化格式的資料,例如:名稱、地址、電話等等,這些在事前都已經定義好的資料,供使用者填寫;非結構化資料,顧名思義來說,無法預測且即時變化的資料,如聲音、影像等等;而半結構化資料又是什麼,其實落在結構化及非結構化資料中間,例如:一支影片的中繼資料(解析度、位元速率、影格率等等)。
這三種類型的資料在大數據都會呈現,且處理大數據資料有三個重要的特性(簡稱三個V),Volume巨量的資料、Velocity資料處理速度快、Variety資料多樣性。
以捷運來說,可使用大數據資料來分析甚巨,例如:某個地區人員搭乘大眾交通運輸工具的人流資料,可進而分析此地人員搭乘什麼捷運路線到達目的地、年齡層、性別、及搭乘時間等等,或者使用在捷運工程方面,如水環工程可分析各項工程布置材料數量、使用比重、組裝方式等等供工程相關人員日後參考。
▲圖說:經大數據分析各軌道運輸站點轉成情形(圖片來源:交通部)