數(shù)塔.Datale企業(yè)大數(shù)據(jù)平臺介紹
數(shù)塔.Datale是一個基于探碼科技Datale大數(shù)據(jù)采集、機器學習、模型算法、知識圖譜、時序分析等人工智能技術(shù)的企業(yè)大數(shù)據(jù)工具平臺。
平臺介紹
資料下載:下載Datale.數(shù)塔-企業(yè)成長性評價系統(tǒng).pdf1.3 MB
數(shù)塔.Datale是一個基于探碼科技Datale大數(shù)據(jù)采集、機器學習、模型算法、知識圖譜、時序分析等人工智能技術(shù)的企業(yè)大數(shù)據(jù)工具平臺。致力于為政府、金融機構(gòu)、中小企業(yè)提供各種專業(yè)的大數(shù)據(jù)智能服務。從企業(yè)查詢、獲客、成長性評價、授信分析、輿情預警等業(yè)務場景出發(fā),幫助政府機構(gòu)大幅提升信息管理水平。
數(shù)塔.Datale應用“大數(shù)據(jù)+人工智能”技術(shù)挖掘數(shù)據(jù)價值。截止目前,打造了服務金融機構(gòu)的大數(shù)據(jù)智能風控平臺,服務政府部門的大數(shù)據(jù)智能風險監(jiān)管平臺,服務中小企業(yè)的大數(shù)據(jù)營銷獲客平臺,服務“一帶一路”沿線國家的企業(yè)大數(shù)據(jù)服務平臺。
探碼科技實現(xiàn)了一系列的大數(shù)據(jù)底層技術(shù)突破,開創(chuàng)性的應用機器學習等人工智能技術(shù)、評估企業(yè)成長價值和投資價值、預測企業(yè)全生命周期經(jīng)營狀況,幫助全國20多家園區(qū)機構(gòu)有效實施金融創(chuàng)新,也幫助多地政府監(jiān)管部門防范金融風險。
利用分布式高性能網(wǎng)絡爬蟲實時采集非結(jié)構(gòu)化大數(shù)據(jù)、清洗降噪并轉(zhuǎn)換為規(guī)范的結(jié)構(gòu)化數(shù)據(jù),利用卷積神經(jīng)網(wǎng)絡、LDA 聚類、支持向量機等機器學習算法,從多源異構(gòu)數(shù)據(jù)中提取高相關(guān)性風險因子,構(gòu)建一個覆蓋全面、權(quán)重合理、可量化的行業(yè)特征風險模型:對非法集資風險趨勢進行模擬、對企業(yè) DNA 進行全面刻畫、精準定位企業(yè)非法集資風險點。
核心功能
企業(yè)信息查詢工具
基于全國3000萬+收錄企業(yè)大數(shù)據(jù)。一鍵查盡企業(yè)基礎(chǔ)信息,包含工商、股東成員、知識產(chǎn)權(quán)、財稅、新聞、團隊招聘等。
企業(yè)API開放平臺是一個面向企業(yè)及應用開發(fā)者的數(shù)據(jù)集成和分析服務平臺。匯聚了3000萬+企業(yè)大數(shù)據(jù),涵蓋150+數(shù)據(jù)維度,在提供基礎(chǔ)數(shù)據(jù)接口服務的同時,還對外輸出數(shù)據(jù)處理、智能模型配置等數(shù)據(jù)分析能力,幫助用戶更加高效地挖掘數(shù)據(jù)價值,開發(fā)數(shù)據(jù)產(chǎn)品。
集合數(shù)據(jù)采集、數(shù)據(jù)挖掘、數(shù)據(jù)清洗、數(shù)據(jù)標準頂層設計和數(shù)據(jù)建模等大數(shù)據(jù)全產(chǎn)業(yè)鏈人才隊伍,為您提供專業(yè)的技術(shù)支持和穩(wěn)定的接口服務
企業(yè)輿情監(jiān)控系統(tǒng)
企業(yè)輿情監(jiān)測是指整合企業(yè)互聯(lián)網(wǎng)信息采集技術(shù)及信息智能處理技術(shù),通過對互聯(lián)網(wǎng)海量信息自動抓取、自動分類聚類、主題檢測、專題聚焦,實現(xiàn)用戶的網(wǎng)絡輿情監(jiān)測和新聞專題追蹤等信息需求,形成簡報、報告、圖表等分析結(jié)果,為客戶全面掌握群眾思想動態(tài),做出正確輿論引導,提供分析依據(jù)。
建立基于SaaS模式的輿情語義分析基礎(chǔ)設施,可更好的實現(xiàn)人機結(jié)合,提高輿情研判的準確率。企業(yè)輿情監(jiān)測系統(tǒng)的具體功能:完成全網(wǎng)和指定網(wǎng)站互聯(lián)網(wǎng)信息監(jiān)測,實時監(jiān)測各網(wǎng)站的相關(guān)內(nèi)容的輿論導向是否正確;及時發(fā)現(xiàn)負面、最新、最熱、最重要的網(wǎng)絡信息;對已經(jīng)發(fā)生的輿情和事件,掌握其在互聯(lián)網(wǎng)上的傳播特點和發(fā)展趨勢;通過植入行業(yè)輿情知識,建立適合于本企業(yè)輿情管理特色的輿情分析研判模型;對重點事件、敏感事件的輿情進行回溯尋找輿情源頭;跟蹤輿情傳播過程,進行傳播趨勢分析和統(tǒng)計;并全面監(jiān)控輿情分布情況及處置結(jié)果。
企業(yè)風險評價系統(tǒng)
企業(yè)評估可以從多個維度考慮,一方面是經(jīng)驗風險預警預測評估;一方面是企業(yè)成長性、投資價值評估。當然如果數(shù)據(jù)更詳細,還可以實現(xiàn)企業(yè)估值等模型。Datale評價模型共分20個風險等級。與外部評級相比,分層更明確,幫助投資機構(gòu)進一步區(qū)分不同信用主體的風險情況。
政府決策支撐平臺
基于數(shù)塔.Datale豐富的數(shù)據(jù)資源與數(shù)據(jù)挖掘能力,面向政府、高校、研究機構(gòu)對于大數(shù)據(jù)及其衍生產(chǎn)品的實際需求,整合政府數(shù)據(jù)資源和企業(yè)大數(shù)據(jù),形成全面覆蓋宏觀、微觀,省、市、縣、園區(qū),標準行業(yè)和新興產(chǎn)業(yè)全產(chǎn)業(yè)鏈的大數(shù)據(jù)服務產(chǎn)品,為政府提供決策支撐,為高校、研究機構(gòu)提供數(shù)據(jù)素材,助力社會誠信體系建設。
政府誠信平臺從宏觀、中觀、微觀的角度出發(fā),搭建數(shù)據(jù)庫模塊和應用主題模塊,其中,數(shù)據(jù)庫模塊由宏觀環(huán)境庫、產(chǎn)業(yè)運行庫、企業(yè)全景庫三個子庫構(gòu)成,應用主題模塊由營商環(huán)境、產(chǎn)業(yè)監(jiān)測、產(chǎn)業(yè)聚集、產(chǎn)業(yè)評價、產(chǎn)業(yè)鏈、產(chǎn)業(yè)信用、企業(yè)畫像、 智能報告八大模塊構(gòu)成,力圖全方位、多角度構(gòu)建地區(qū)、行業(yè)、企業(yè)社會誠信檔案。
宏觀環(huán)境庫:
源于國家統(tǒng)計局等權(quán)威機構(gòu) , 以月、季、年為更新頻率,包括GDP核算、人口、財政等主要宏觀環(huán)境指標。
企業(yè)全景庫:
整合工商、稅務、海關(guān)、互聯(lián)網(wǎng)等數(shù)據(jù)資源,以不定期抓取、月、年為更新頻率,包括企業(yè)信用狀況、財務狀況等企業(yè)數(shù)據(jù)信息。
核心技術(shù)
技術(shù)體系
通過分布式數(shù)據(jù)采集技術(shù)、ETL(extract-transform-load)技術(shù)實現(xiàn)對結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的采集、清洗、轉(zhuǎn)換和加載,按照內(nèi)存分布式的數(shù)據(jù)存儲方式進行安全存儲,運用風險傳導模型、復雜網(wǎng)絡模型、行為統(tǒng)計模型、異常檢測模型對數(shù)據(jù)進行量化處理,并通過交叉驗證確保數(shù)據(jù)準確,讓數(shù)據(jù)中隱藏的實用信息能夠直觀展示在用戶面前。
技術(shù)理念
基于人工智能和機器學習算法,充分整合海量數(shù)據(jù),同時通過深度挖掘投資、上下游、合作等關(guān)聯(lián)關(guān)系,全面便捷的管理和呈現(xiàn)目標企業(yè)及其關(guān)聯(lián)企業(yè)風險信息,集成了全網(wǎng)定向監(jiān)控系統(tǒng)及大數(shù)據(jù)分析工具,實時采集推送企業(yè)客戶的行為變化、輿情信息,并利用文本分析、機器學習、序列分析等工具,建立風險模型,實現(xiàn)動態(tài)預警,從而控制敞口風險,穩(wěn)定資產(chǎn)質(zhì)量,增強金融機構(gòu)的風險管理水平。
數(shù)據(jù)采集
通過部署分布式爬蟲引擎、對接權(quán)威官方數(shù)據(jù),實現(xiàn)海量數(shù)據(jù)采集,使用ETL技術(shù),將海量數(shù)據(jù)清洗、轉(zhuǎn)載、加載后,采用數(shù)據(jù)加密存儲、多副本存儲的方式予以安全保存。
機器學習
獨立研發(fā)MaaS系統(tǒng)(Machine learning as a Service),用戶在提交結(jié)構(gòu)化數(shù)據(jù)之后,系統(tǒng)自動實現(xiàn)模型建立的剩余過程。通過決策引擎幫助用戶優(yōu)化內(nèi)部控制,并隨著使用的加深,將用戶經(jīng)驗工具化。
深度分析
獨立研發(fā)“六菱星”模型,根據(jù)六度分析、復雜網(wǎng)絡等理論基礎(chǔ),構(gòu)建全方位立體網(wǎng)絡關(guān)聯(lián)圖,及其風險傳導路徑,建立了100多種危險行為模式,全面量化企業(yè)風險狀況,識別準確率達90%以上。
可視化處理
海量數(shù)據(jù)建模分析之后,將結(jié)果進行可視化處理,支持多種類型圖表、終端展示,真正讓用戶看到數(shù)據(jù)的價值,用數(shù)據(jù)說話。
市場前景
從2014年中央經(jīng)濟工作會議首次明確提出“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”,到2015年正式寫入《政府工作報告》,近兩年來,創(chuàng)業(yè)、創(chuàng)新已成為社會發(fā)展的一個主題詞。2016年,在全球融資總額整體下降的大趨勢下,我國融資總額逆勢增長,漲幅為10%。2017上半年國內(nèi)共發(fā)生2786例投資事件,融資總額達3252億元,平均投資額度創(chuàng)歷史新高。但是也發(fā)現(xiàn)幾個問題,部分地區(qū)出現(xiàn)雙創(chuàng)虛熱,質(zhì)量跑不過數(shù)量的線下;部分地區(qū)出現(xiàn)付出多、回報少的主體獲得感低。少數(shù)地方在“雙創(chuàng)”中出現(xiàn)的“浮、漂、虛”的現(xiàn)象值得高度警惕。如果通過大數(shù)據(jù)征信、風險、評價預警等平臺,可以及時預判,使政府和機構(gòu)在開展“雙創(chuàng)”工作更加精準和有效。
同時,近年來政府對金融科技行業(yè)的監(jiān)管更加嚴格了,行業(yè)亂象被清理,政府、企業(yè)、包括個人均越來越重視數(shù)據(jù)保護。市場上對私業(yè)務被監(jiān)管、限制,對公業(yè)務需求則在持續(xù)穩(wěn)定的增長。這對探碼科技的發(fā)展來說是一個非常好的趨勢,契合我們一直堅持做企業(yè)大數(shù)據(jù)智能評價服務的核心戰(zhàn)略。
市場對企業(yè)端智能大數(shù)據(jù)服務需求猛增。而基于此的大數(shù)據(jù)增值服務也將迎來黃金時代。在未來,大數(shù)據(jù)產(chǎn)業(yè)的核心競爭力將不再是數(shù)據(jù),更多集中到對數(shù)據(jù)的分析、挖掘結(jié)果處理上,如何應用它給業(yè)務帶來價值。
市場優(yōu)勢
數(shù)塔.Datale核心競爭力可包括三個部分:
數(shù)據(jù)獲取能力
數(shù)塔.Datale的數(shù)據(jù)主要來自三方面,政府公開數(shù)據(jù)、第三方數(shù)據(jù)以及企業(yè)共享數(shù)據(jù),具體而言包括工商信息、司法訴訟、新聞輿情、知識產(chǎn)權(quán)、財務、海關(guān)、互聯(lián)網(wǎng)行為、企業(yè)交易數(shù)據(jù)等等,目前數(shù)塔.Datale已經(jīng)積累了超過3000萬家企業(yè)的數(shù)據(jù),而且能夠持續(xù)更新數(shù)據(jù)庫,讓評價系統(tǒng)的風險監(jiān)控也變成實時動態(tài)的監(jiān)控;
數(shù)據(jù)分析能力
包括數(shù)據(jù)清洗、數(shù)據(jù)挖掘和建模能力等。數(shù)塔.Datale具有20多人的數(shù)據(jù)處理團隊,從事數(shù)據(jù)分析及評估模型開發(fā)等工作多年,數(shù)塔.Datale企業(yè)成長性評估模型經(jīng)過違約樣本的測試之后,驗證準確率超過96%。在大數(shù)據(jù)和人工智能技術(shù)研發(fā)方面,公司專門成立了大數(shù)據(jù)研究小組,首席數(shù)據(jù)科學家是擁有十多年大數(shù)據(jù)和人工智能研究經(jīng)驗的專家。
商業(yè)化能力
即如何將大數(shù)據(jù)和人工智能能力轉(zhuǎn)化為可持續(xù)發(fā)展的產(chǎn)品和業(yè)務模式。數(shù)塔.Datale采用DaaS模式,依托自身數(shù)據(jù)服務優(yōu)勢,將其產(chǎn)品形態(tài)標準化、互聯(lián)網(wǎng)化。目前服務的客戶80%為政府園區(qū)機構(gòu)客戶,20%為企業(yè)和類金融機構(gòu)。與傳統(tǒng)的企業(yè)盡調(diào)方式相比,數(shù)塔.Datale能夠幫助機構(gòu)降低66%的風控成本,提高3倍的決策能力支撐。