作者:探碼科技, 原文鏈接: http://nbbskj.com/web-bigdata/376
? ? ? Web大數據集群系統是一種專門為存儲和分析海量非結構化數據而設計的特定類型的集群。本質上,它是一種計算集群,把一大堆看似雜亂無章的數據中總結出規律,將數據分析的工作分配到多個集群節點上,再對這些數據進行一番非常復雜的計算分析,從而并行處理數據。探碼Web大數據集群系統可以存儲Tb級采集到的數據,實現數據持久化。?
? ? ? 探碼Web大數據集群的架構主要分為:硬件層、軟件層、文件系統層、大數據集群技術層、基礎設施管理層。
? ? ? 最下層的布局是硬件層,探碼科技采用云主機提供商UCloud的云主機,是UCloud依托成熟的云計算技術、高性能基礎設施、以及優質的網絡帶寬和高品質的數據中心等資源,所提供的安全穩定、快速部署、彈性擴展、管理便捷的計算單元,同樣能夠實現單機多用戶,每個部分都可以做單獨的操作系統,管理方法同主機一樣。
?? ? ? 在基礎設施管理層,主要管理資源(更多的是軟件資源)以及資源的虛擬化等,比如網絡資源/設備、計算資源、內存 等的統一管理和優化分配,在此層,同時肩負著部署大型 Cluster 的任務,也就是將各個分散的節點通過Web大數據集群系統統一部署為一個整體。在 探碼Web集群中,分為管理節點和計算節點。部署的順序為,需要首先安裝管理節點,然后按照不同的硬件、網絡等配置集,來部署出計算節點。
? ? ? 在資源管理和大數據集群層,主要部署兩方面的組件,一是大數據分析處理組件,二是資源調度和管理組件。在一般情況下,這二者都是有機的結合在一起,組成一個產品。
?數據集群系統采用云主機提供商UCloud的云主機,可以保證7x24無故障運行。?
數據存儲采用MongoDB集群方案,此方案在集群上有兩大特點:
? 分片:分片即MongoDB在服務器之間劃分數據的一項技術。MongoDB能夠自動在分片
之間平衡數據,并且能夠在不需要數據庫離線的情況下增加和刪除分片。
? 復制:為了保證高可用性,MongoDB維護了許多數據的冗余備份,復制被嵌入于
MongoDB,并且在不需要專業網絡的情況下就可以在廣域網內工作。?
本著以合理利用硬件資源,根據業務需求,可隨時橫向伸縮的原則,探碼Web大數據集群啟用3臺2核8G 內存,500G存儲的云服務器,采用Docker容器技術,Rancher容器編排技術,組成基礎型的 高可用MongoDB集群系統,獨立局域網IP,開放27017端又。
? ? ? 近幾年來,數據的價值正得到越來越多的人的重視,如何讓數據"活起來",一直是 IT 界持續討論的話題,在這種利益的驅動下,大數據的分析技術可謂是"遍地開花",大數據集群的部署方案也層出不窮,針對不同的場景和不同的需求,各大 IT 公司都在爭先恐后的提出各種各樣的方案和技術。如何選擇合適的方案,主要可以從技術選題、穩定問題、高可用性、可擴展性、監控等方面入手。探碼科技致力于大數據的分析和部署的研究工作,從以上幾個方面來看,探碼Web大數據集群未來是較為出色的大數據集群部署解決方案。
?
?