作者:探碼科技, 原文鏈接: http://nbbskj.com/blog/422
文章轉自:http://www.gdupi.com/Common/news_detail/article_id/3691.html
2017年是我國大數據產業快速發展的一年,隨著信息技術和人類生產生活交匯融合,互聯網快速普及,全球數據呈現爆發增長、海量集聚的特點,對經濟發展、社會治理、國家管理、人民生活都產生了重大影響。世界各國都把推進經濟數字化作為實現創新發展的重要動能,在前沿技術研發、數據開放共享、隱私安全保護、人才培養等方面做了前瞻性布局。
從產業的角度看,企業級大數據市場經過兩年的醞釀已初具規模,中國企業級大數據進入快速發展時期,產業集聚將進一步特色化發展。隨著政策環境和技術手段的不斷完善,行業應用持續升溫,產業體系初具雛形,支撐能力日益增強。國內許多行業用戶如互聯網、電信、金融等開始實際部署大數據平臺并付諸實踐,同時帶動軟件、硬件和服務市場的快速發展。
目前大數據產業的統計口徑尚未建立,對于中國大數據產業的規模,各個研究機構均采取間接方法估算。中國信息通信研究院結合對大數據相關企業的調研測算,2016年中國大數據核心產業的市場規模約為168億元,較2015年增速達45%。2017年達到234億元,較2016年增長39.3%。
隨著國家政策激勵以及大數據應用模式的逐步成熟,未來幾年中國大數據市場仍將保持每年30%以上的快速增長,預計到2020年中國大數據市場規模將達到578億元。
從大數據市場細分領域來看,近年來,軟件和服務在市場整體規模中的比重呈上升趨勢,硬件比重逐年減少,整體變化趨勢較為平緩。與2015年相比,硬件市場規模為37.2 億元,占比下降1.8%;軟件市場規模為50.0 億元,占比提高0.8%;大數據服務市場規模28.6億元,占比提高1.0%。
我國大數據產業集聚區主要位于經濟比較發達的地區,北京、上海、廣東是發展的核心地區,這些地區擁有知名互聯網及技術企業、高端科技人才、國家強有力政策支撐等良好的信息技術產業發展基礎,形成了比較完整的產業業態,且產業規模仍在不斷擴大。
除此之外,以貴州、重慶為中心的大數據產業圈,雖然地處經濟比較落后的西南地區,但是貴州、重慶等地依托政府對其大數據產業發展提供的政策引導,積極引進大數據相關企業及核心人才,力圖占領大數據產業制高點,帶動區域經濟新發展。
京津冀地區依托北京,尤其是中關村在信息產業的領先優勢,培育了一大批大數據企業,是目前我國大數據企業集聚最多的地方。不僅如此,部分數據企業擴散到了天津和河北等地,形成了京津冀大數據走廊格局;
珠三角地區依托廣州、深圳等地區的電子信息產業優勢,發揮廣州和深圳兩個國家超級計算中心的集聚作用,在騰訊、華為、中興等一批骨干企業的帶動下,珠三角地區逐漸形成了大數據集聚發展的趨勢;
長三角地區依托上海、杭州、南京,將大數據與當地智慧城市、云計算發展緊密結合,吸引了大批大數據企業,促進了產業發展。上海發布《上海推進大數據研究與發展三年行動計劃》,推動大數據在城市管理和民生服務領域應用。
大西南地區以貴州、重慶為代表城市,通過積極吸引國內外龍頭骨干企業,實現大數據產業在當地的快速發展。2013年起,貴州市率先把握大數據發展機遇,充分發揮其發展大數據產業所獨具的生態優勢、能源優勢、區位優勢及戰略優勢等四大優勢,搶占先機率先啟動首個國家大數據綜合實驗區、國家大數據產業集聚區和國家大數據產業技術創新實驗區;率先建成全國第一個省級政府數據集聚共享開放的統一云平臺;率先開展大數據地方立法,頒布實施《貴州省大數據應用促進條例》;率先設立全球第一個大數據交易所;率先舉辦貴陽國際大數據產業博覽會和云上貴州大數據商業模式大賽等。
由中國信通院調查研究可知,截止到2017年1月份已經公開發布的37份地方的大數據規劃,涵蓋16個省21個市。第一類是以北深廣浙為代表的引領性的規劃,與產業現狀結合最為緊密;第二類是以蘇州、南寧為代表的落實性規劃,對接國家和省相關戰略制定可操作的具體落實措施;第三類是追趕型規劃,以相對欠發達地區制定的彎道超車型的發展規劃為主。
通過各地規劃目標和階段性實施成果的分析可總結出我國目前大數據發展的四大成效:
第一,區域特色創新發展促進大數據產業快速聚集。總的來說目前我們國家已經形成中西部地區、環渤海地區、珠三角地區、長三角地區、東北地區五大產業區,配合國家大數據綜合實驗區的建設,整個產業布局將進一步規劃。
第二,行業應用逐步深入。以共享開放推進在政府中的應用,發展工業大數據促進產業轉型升級,積極開展金融大數據的應用創新,推動在公共衛生醫療保健中的應用是各地規劃中要見成效的領域。
第三,政府試點促進數據中心建設迅速提升。通過大數據戰略倒逼基礎設施配合國家寬帶中國普遍服務、全面小康一系列戰略的推進,現在寬帶網絡和互聯網數據中心都取得了快速的發展。
第四,數據資源整合加快,共享開放的意識增強。截止到現在,80%以上省市提出要開展數據共享開放平臺的建設,強調政府數據的統籌協調管理。同時建設多個數據交易場所加快政府數據的開放共享,這個模式的大規模推廣,將數據的價值不斷挖掘出來,使產業特征或市場服務以及用戶體驗等帶來新的價值提升空間。
1.發展機遇
數據資源大量積累為大數據產業發展提供了良好條件。信息技術的廣泛深入應用,引發了數據量的爆發式增長,我國在信息產業不斷發展、信息化不斷推進的過程中,積累了大量的數據資源,為大數據產業發展提供了源泉。
經濟社會持續增長的應用需求為大數據產業發展提供了市場空間。大數據技術產品創新正逐漸從技術驅動轉向應用驅動,旺盛的應用需求和巨大的市場空間是我國大數據產業創新的強大內生動力。
政府重視和服務體系建設為大數據產業發展創造了優良環境。十八屆三中、四中、五中全會提出要利用大數據推動政府治理能力的提升,加快公共數據開放共享,推動大數據在科學決策、政府管理和公共服務等領域的應用,助推簡政放權和萬眾創新。良好的政策環境為大數據產業發展創造了難得的政策機遇。
產業體系雛形初具為大數據產業發展提供了基礎。2015年,我國規模以上電子信息產業總規模超過15.5萬億元,比“十一五”期末翻了一番。大型數據中心向綠色化、集約化發展,云計算服務逐漸成熟,國內龍頭企業面向大數據新需求,積極推出新產品和新服務,一批新興的專業化大數據企業崛起。
2.存在挑戰
雖然我國大數據產業快速發展,但是仍存在行業發展良莠不齊、數據開放程度較低、安全風險日益突出、技術應用創新滯后等四大挑戰。
行業發展良莠不齊。我國大數據仍處于起步發展階段,行業標準和管理機制尚未成熟,在“萬眾創新,大眾創業”的大環境下,大量的大數據企業不斷涌現,存在很多企業借大數據概念熱潮投機倒把,行業發展良莠不齊;
數據開放程度較低。數據開放共享是促進大數據產業發展的重要舉措,我國政府部門掌握著全體社會80%的信息資源,但這些信息資源由于部門或區域利益分別被不同的部門控制,且不同部門的數據標準不一致,導致信息流的上游環節處于封閉狀態,不能有效地釋放和共享,數據源的欠缺直接影響大數據分析和處理的需求,導致大數據應用缺乏價值;
安全風險日益突出。隨著云計算、物聯網和移動互聯網等新一代信息技術的飛速發展,大數據應用規模日趨擴大,數據及其應用皆呈指數級增長態勢,當企業用數據挖掘和數據分析獲取商業價值的時候,黑客也可以利用大數據分析向企業發起攻擊,同時社交網站的隱私數據也可能被不法商家利用等等,這都給數據安全帶來了巨大的挑戰;
技術應用創新滯后。我國大數據產業雖然與國際大數據發展幾近步伐相同,但是仍然存在技術及應用滯后的差距,在大數據相關的數據庫及數據挖掘等技術領域,處于支配地位的領軍企業均為國外企業。市場上,由于國內大數據企業技術上的不足,用戶更加青睞IBM、甲骨文、EMC、SAP等國外IT企業,國內企業市場占有率僅5%左右。
目前,我國大數據需求端以互聯網企業為主,覆蓋面不廣,在O2O趨勢下,大型互聯網廠商嘗試引入外部數據支撐金融、生活、語音、旅游、健康和教育等多種服務。然而在具體的領域或行業內,我國普遍未形成成型的數據采集、加工、分析和應用鏈條,大量數據源未被激活,大多數數據擁有者沒有數據價值外化的路徑。比如,各醫療健康類應用收集了大量的數據,但沒有像Sermo.com那樣面向醫藥公司售賣數據。與國外相比我國的政府、公共服務、農業應用基本缺位,電信和銀行業更缺少與外部數據的碰撞。數據質量方面,即便是政府機構這樣的權威數據持有方,也存在很多數據缺失、數據錯誤、噪音多各方面的問題。理論上我們中國有很多數據,但不同部門數據存在在不同的地方,格式也不一樣。政府內部本身整合各部門的數據就已經是一件很頭大的事情,更不要提大規模的數據開放。同時數據開放面臨一個嚴重問題就是隱私問題,脫敏遠遠不夠,隱私問題是一個無底洞。
同任何新興產業一樣,科學技術水平是推動產業發展的內在動力,是影響大數據產業發展最重要的因素。但是目前由于我國科學技術水平等基礎條件不夠成熟,嚴重影響了大數據產業的發展速度。隨著大數據概念的火熱,做大數據的公司越來越多,產品做得五花八門,但現在數據分析的技術,方法,模型,算法都有了非常大的改進,跟過去六七十年代完全不一樣,不是說做幾個SAAS軟件或者RAAS軟件就是大數據了,雖然短期看市場火熱,但長遠來說這條路是走不通的,大數據行業發展,技術才是真正的發力點,提高行業準入門檻尤為重要。
其次,中國的數據有它的特色,例如在金融行業,目前大部分銀行采用的是風險評分卡,運用專家經驗定義風險變量,基于定性認識進行評分,通過事后風險回檢優化評分卡,風險預警功能較差。雖然央行征信中心與國內少數技術領先銀行使用的是風險評分模型,但模型方法相對陳舊,如央行所用FICO評分模型為上世紀80年代基于邏輯回歸算法構建的評分體系,邏輯回歸算法適合處理線性數據,但實際問題往往是非線性的,特別是信用風險評估場景下。此外,FICO模型沒有針對我國具體業務進行場景細分,建模邏輯并不完全符合我國實際情況,因此導致準確率不足,風險預警能力差。
我們國家大數據發展最大的優勢就是市場大,最大的劣勢恰巧就是缺乏相應專業人才,人才缺乏的程度非常嚴重。首先在國際市場方面,我們要跟國外公司爭人才,然而國外大數據行業同樣十分火熱。而不論在國內還是國外,跟企業競爭人才都是一項艱巨的事業,比如在世界上最好的大學之一的美國普林斯頓大學,想找數學家也是非常困難,人才很容易被大公司挖走,每年都有非常好的數據分析人才被企業挖走。所以人才難覓不只是口頭說說,更是一個亟待解決的問題。
目前為止,我們國家仍然沒有良好的培育大數據人才的機制,大數據教育主要面臨以下三個問題。首先,大數據是一個交叉學科,涉及統計學,管理,編程等多學科,知識點復雜,培訓課程編輯難度大,缺乏系統的學習教程;其次,現階段大數據教育大多還停留在理論知識上,理論與實戰嚴重脫節,學習者缺乏良好的實踐機會;再次,大數據教育的根本目的是為了解決業務上面臨的實際問題,用科學的手段推動業務的進展,然而現階段的大數據教育機構普遍缺乏相應的業務經驗,產學研結合并不密切。
據不完全統計,從2014年至今我國涉及到大數據發展與應用的國家政策規定已多達63個,其中國家大數據發展頂層設計1個,國家層面頂層規劃4個,重點行業領域發展應用31個,重點工作推進25個,重點區域發展2個。大數據戰略已上升為國家戰略高度,各部委從戰略規劃、技術能力提升、應用與管理三個層面積極落實推進大數據發展政策。
大量的異質性企業,借助大數據互相依存,形成了共生、再生、乃至互生的價值循環體系。不同的行業,形成業務交叉、數據通聯、運營協同的產業融合機制。不同的經濟主體,借助大數據,形成跨地域、跨行業、跨系統的社會協同平臺。
具備新型的“價值循環體系”、“產業融合機制”、“社會協同平臺”屬性的業態,稱之為產業生態。產業生態在數字經濟中,是一個基礎的經濟單元。無數個經濟單元疊加、化合,構成數字經濟。
大數據驅動的產業生態,與以往不同,離散的“生產單元”之間的數據融合,成為產業生態的核心,是和過去以“消費”為主導的互聯網經濟發展模式,形成鮮明的對比。這是數字重組產業的開端。
大數據產業是一個典型的技術密集型產業,隨著數據資源量的不斷增加,大數據技術也呈現著多元發展的勢頭。麥肯錫全球研究所曾經給大數據作了一個定義:“超出傳統的數據庫軟件工具處理能力的超大規模的數據集”。但是大數據帶來的技術方面的挑戰,遠遠不止于處理工具,事實上對傳統的網絡結構、計算模型、安全體系,提出了全方位的課題。主要包括以下幾個方面:一是數據處理能力不斷提升,網絡承載能力要滿足“數據摩爾定律”的需要(數據摩爾定律,指數據在未來18個月內,數據量將增加一倍)。二是安全可控體系不斷完善,需要建立自主可控的安全防護體系、身份識別體系。必須在網絡空間實現4W的機制,即“Who”、“Where”、“when”、“what”。在網絡空間中,安全能力必須能夠對任何一個單體,掌握“在任何時間、任何地點的狀態”的數據。三是跨領域的建模技術發展迅速,需要參考仿生學、腦科學,建立起“社會計算”的模型,構建“智能大腦”,應對日益增長的海量數據和多方面、多層次應用需求。
在政策、技術和產業生態等多方面利好的推動下,近幾年來,大數據創業公司不斷涌現,得到不少風投機構的追逐。2010年以來,大數據領域成功融資的企業數量逐年增加,2014年進入爆發期,環比上升193.55%,2015年以來持續穩步增長,2016年獲得融資的企業數量達到400多家。2017年大數據產業資本依舊瘋狂,經過前瞻產業研究院初步統計,2017年前三個月便有150多家企業獲得融資,大數據領域持續獲得資本市場的高度青睞,其中數據挖掘與分析、行業化應用(如醫療、金融、旅游等)和垂直化應用(如智能營銷、業務管理、移動開發服務等)三個方向最受資本關注。大數據領域的創新、創業欣欣向榮,給國家大數據戰略順利實施,奠定了人才基礎、技術基礎。
文章轉自數中網