數塔.Datale是一個基于探碼科技Datale大數據采集、機器學習、模型算法、知識圖譜、時序分析等人工智能技術的企業大數據工具平臺。
平臺介紹
數塔.Datale是一個基于探碼科技Datale大數據采集、機器學習、模型算法、知識圖譜、時序分析等人工智能技術的企業大數據工具平臺。致力于為政府、金融機構、中小企業提供各種專業的大數據智能服務。從企業查詢、獲客、成長性評價、授信分析、輿情預警等業務場景出發,幫助政府機構大幅提升信息管理水平。
數塔.Datale應用“大數據+人工智能”技術挖掘數據價值。截止目前,打造了服務金融機構的大數據智能風控平臺,服務政府部門的大數據智能風險監管平臺,服務中小企業的大數據營銷獲客平臺,服務“一帶一路”沿線國家的企業大數據服務平臺。
?
探碼科技實現了一系列的大數據底層技術突破,開創性的應用機器學習等人工智能技術、評估企業成長價值和投資價值、預測企業全生命周期經營狀況,幫助全國20多家園區機構有效實施金融創新,也幫助多地政府監管部門防范金融風險。
?
利用分布式高性能網絡爬蟲實時采集非結構化大數據、清洗降噪并轉換為規范的結構化數據,利用卷積神經網絡、LDA 聚類、支持向量機等機器學習算法,從多源異構數據中提取高相關性風險因子,構建一個覆蓋全面、權重合理、可量化的行業特征風險模型:對非法集資風險趨勢進行模擬、對企業 DNA 進行全面刻畫、精準定位企業非法集資風險點。
基于全國3000萬+收錄企業大數據。一鍵查盡企業基礎信息,包含工商、股東成員、知識產權、財稅、新聞、團隊招聘等。
企業API開放平臺是一個面向企業及應用開發者的數據集成和分析服務平臺。匯聚了3000萬+企業大數據,涵蓋150+數據維度,在提供基礎數據接口服務的同時,還對外輸出數據處理、智能模型配置等數據分析能力,幫助用戶更加高效地挖掘數據價值,開發數據產品。
?
集合數據采集、數據挖掘、數據清洗、數據標準頂層設計和數據建模等大數據全產業鏈人才隊伍,為您提供專業的技術支持和穩定的接口服務
企業輿情監測是指整合企業互聯網信息采集技術及信息智能處理技術,通過對互聯網海量信息自動抓取、自動分類聚類、主題檢測、專題聚焦,實現用戶的網絡輿情監測和新聞專題追蹤等信息需求,形成簡報、報告、圖表等分析結果,為客戶全面掌握群眾思想動態,做出正確輿論引導,提供分析依據。
建立基于SaaS模式的輿情語義分析基礎設施,可更好的實現人機結合,提高輿情研判的準確率。企業輿情監測系統的具體功能:完成全網和指定網站互聯網信息監測,實時監測各網站的相關內容的輿論導向是否正確;及時發現負面、最新、最熱、最重要的網絡信息;對已經發生的輿情和事件,掌握其在互聯網上的傳播特點和發展趨勢;通過植入行業輿情知識,建立適合于本企業輿情管理特色的輿情分析研判模型;對重點事件、敏感事件的輿情進行回溯尋找輿情源頭;跟蹤輿情傳播過程,進行傳播趨勢分析和統計;并全面監控輿情分布情況及處置結果。
企業評估可以從多個維度考慮,一方面是經驗風險預警預測評估;一方面是企業成長性、投資價值評估。當然如果數據更詳細,還可以實現企業估值等模型。Datale評價模型共分20個風險等級。與外部評級相比,分層更明確,幫助投資機構進一步區分不同信用主體的風險情況。
?
基于數塔.Datale豐富的數據資源與數據挖掘能力,面向政府、高校、研究機構對于大數據及其衍生產品的實際需求,整合政府數據資源和企業大數據,形成全面覆蓋宏觀、微觀,省、市、縣、園區,標準行業和新興產業全產業鏈的大數據服務產品,為政府提供決策支撐,為高校、研究機構提供數據素材,助力社會誠信體系建設。
?
政府誠信平臺從宏觀、中觀、微觀的角度出發,搭建數據庫模塊和應用主題模塊,其中,數據庫模塊由宏觀環境庫、產業運行庫、企業全景庫三個子庫構成,應用主題模塊由營商環境、產業監測、產業聚集、產業評價、產業鏈、產業信用、企業畫像、 智能報告八大模塊構成,力圖全方位、多角度構建地區、行業、企業社會誠信檔案。
?
宏觀環境庫:
源于國家統計局等權威機構 , 以月、季、年為更新頻率,包括GDP核算、人口、財政等主要宏觀環境指標。
?
企業全景庫:
整合工商、稅務、海關、互聯網等數據資源,以不定期抓取、月、年為更新頻率,包括企業信用狀況、財務狀況等企業數據信息。
通過分布式數據采集技術、ETL(extract-transform-load)技術實現對結構化和非結構化數據的采集、清洗、轉換和加載,按照內存分布式的數據存儲方式進行安全存儲,運用風險傳導模型、復雜網絡模型、行為統計模型、異常檢測模型對數據進行量化處理,并通過交叉驗證確保數據準確,讓數據中隱藏的實用信息能夠直觀展示在用戶面前。
?
基于人工智能和機器學習算法,充分整合海量數據,同時通過深度挖掘投資、上下游、合作等關聯關系,全面便捷的管理和呈現目標企業及其關聯企業風險信息,集成了全網定向監控系統及大數據分析工具,實時采集推送企業客戶的行為變化、輿情信息,并利用文本分析、機器學習、序列分析等工具,建立風險模型,實現動態預警,從而控制敞口風險,穩定資產質量,增強金融機構的風險管理水平。
?
通過部署分布式爬蟲引擎、對接權威官方數據,實現海量數據采集,使用ETL技術,將海量數據清洗、轉載、加載后,采用數據加密存儲、多副本存儲的方式予以安全保存。
?
獨立研發MaaS系統(Machine learning as a Service),用戶在提交結構化數據之后,系統自動實現模型建立的剩余過程。通過決策引擎幫助用戶優化內部控制,并隨著使用的加深,將用戶經驗工具化。
?
獨立研發“六菱星”模型,根據六度分析、復雜網絡等理論基礎,構建全方位立體網絡關聯圖,及其風險傳導路徑,建立了100多種危險行為模式,全面量化企業風險狀況,識別準確率達90%以上。
?
海量數據建模分析之后,將結果進行可視化處理,支持多種類型圖表、終端展示,真正讓用戶看到數據的價值,用數據說話。
從2014年中央經濟工作會議首次明確提出“大眾創業、萬眾創新”,到2015年正式寫入《政府工作報告》,近兩年來,創業、創新已成為社會發展的一個主題詞。2016年,在全球融資總額整體下降的大趨勢下,我國融資總額逆勢增長,漲幅為10%。2017上半年國內共發生2786例投資事件,融資總額達3252億元,平均投資額度創歷史新高。但是也發現幾個問題,部分地區出現雙創虛熱,質量跑不過數量的線下;部分地區出現付出多、回報少的主體獲得感低。少數地方在“雙創”中出現的“浮、漂、虛”的現象值得高度警惕。如果通過大數據征信、風險、評價預警等平臺,可以及時預判,使政府和機構在開展“雙創”工作更加精準和有效。
同時,近年來政府對金融科技行業的監管更加嚴格了,行業亂象被清理,政府、企業、包括個人均越來越重視數據保護。市場上對私業務被監管、限制,對公業務需求則在持續穩定的增長。這對探碼科技的發展來說是一個非常好的趨勢,契合我們一直堅持做企業大數據智能評價服務的核心戰略。
市場對企業端智能大數據服務需求猛增。而基于此的大數據增值服務也將迎來黃金時代。在未來,大數據產業的核心競爭力將不再是數據,更多集中到對數據的分析、挖掘結果處理上,如何應用它給業務帶來價值。
數塔.Datale核心競爭力可包括三個部分:
?
數塔.Datale的數據主要來自三方面,政府公開數據、第三方數據以及企業共享數據,具體而言包括工商信息、司法訴訟、新聞輿情、知識產權、財務、海關、互聯網行為、企業交易數據等等,目前數塔.Datale已經積累了超過3000萬家企業的數據,而且能夠持續更新數據庫,讓評價系統的風險監控也變成實時動態的監控;
?
包括數據清洗、數據挖掘和建模能力等。數塔.Datale具有20多人的數據處理團隊,從事數據分析及評估模型開發等工作多年,數塔.Datale企業成長性評估模型經過違約樣本的測試之后,驗證準確率超過96%。在大數據和人工智能技術研發方面,公司專門成立了大數據研究小組,首席數據科學家是擁有十多年大數據和人工智能研究經驗的專家。
?
即如何將大數據和人工智能能力轉化為可持續發展的產品和業務模式。數塔.Datale采用DaaS模式,依托自身數據服務優勢,將其產品形態標準化、互聯網化。目前服務的客戶80%為政府園區機構客戶,20%為企業和類金融機構。與傳統的企業盡調方式相比,數塔.Datale能夠幫助機構降低66%的風控成本,提高3倍的決策能力支撐。
?
?