作者:探碼科技, 原文鏈接: http://nbbskj.com/bigdata/157
? ? ? ?這是一個探碼大數據客戶案例,我們根據客戶需求,作了如下調研。
? ? ? ?基于大數據的理論,機票數據采集系統的軟件架構應該是從這三方面來研發的:左邊是大量的數據源,中間是大數據平臺,后邊是對大數據分析處理以后的用途歸屬。
?
? ? ? ?提供機票數據源的平臺很多,包括像攜程、去哪兒、藝龍這樣的平臺,到各個航空公司自己的官網,都可以源源不斷的提供實時的機票數據,將這些機票數據匯集在一起,形成一個數據池。
? ? ? ?中間的大數據平臺是機票數據采集系統的核心,大數據平臺將數據池中的數據結構化以后,提供給項目作任何維度的分析和研究,查詢和檢索,同時根探碼大數據平臺的業務邏輯進行篩選。
? ? ? ?當有了大數據平臺以后,探碼科技將結構化的數據分發到不同的終端,這種終端可以是公司自有的APP、網站或者微信公共號,也可以是公司的第三方分銷平臺,如通過攜程API上傳到攜程分銷商,通過阿里開發結構對接到阿里旅行。
? ? ? ?機票數據是一種實時性要求很高的網絡數據,同時機票采集數據的用途也很多,數據采集的量也會相應增加。
? ? ? ?機票數據采集系統的核心目的是通過采集[去哪兒]數據源的機票實時價格信息,動態分析出需要的價格內容,并上傳到[攜程API]。以下的內容是針對機票數據采集系統策劃方案的詳細介紹。
1.采集去哪兒網站機票信息
?
2. 大數據平臺管理系統實現
3. 上傳到攜程API
? ? ? ?第一部分:所有航班的詳情,采集字段包括航空公司、起飛日期 、起飛機場 、到達機場 、航班號、 使用規定、對應艙位、 ?對應價格 、剩余座位。
? ? ? ?第二部分:最低價格的航班詳情,采集字段包括起飛城市三字碼、到達城市三字碼、 航空公司、起飛日期、起飛機場、 到達機場、 航班號、 使用規定、最低價格、 最低價格艙位 、I艙價格、 最低價剩余座位。
? ? ? ?采集目標: ?OTA網站機票價格、移動端機票價格,可采集指定網站的數據,按客戶要求進行處理,輸出所需數據格式.
? ? ? ?案例: ?www.qunar.com、www.ctrip.com、www.kuxun.cn、以及各大航空公司