作者:探碼科技, 原文鏈接: http://nbbskj.com/blog/480
原文出處:https://eaglealpha.com/alternative-data/
另類數(shù)據(jù)是投資過程中使用的非傳統(tǒng)數(shù)據(jù),它使得越來越多以前無法收集的信息變成了可以分析的數(shù)據(jù) ,而從這些雜亂無章的信息中找到規(guī)律的能力也變得無比強大。?
另類數(shù)據(jù)是用于金融交易的非傳統(tǒng)性數(shù)據(jù),可以尋求全球量化獨有價值,并獲取超額的市場收益。它是傳統(tǒng)金融數(shù)據(jù)的補充,可以提供不同視角的市場洞察,提升數(shù)據(jù)模擬準確性。另類數(shù)據(jù)在金融領(lǐng)域的作用比喻為“新石油”,因其就像石油對于國民經(jīng)濟的重要性一樣。
引爆點
另類數(shù)據(jù)并不新鮮。幾年來,有超過50家公司一直在使用替代數(shù)據(jù)。然而,2017年是替代數(shù)據(jù)空間的轉(zhuǎn)折點,因為資產(chǎn)更廣泛管理行業(yè)開始將其整合到投資過程中。在我們看來,另類到2018年/ 2019年第一季度末,數(shù)據(jù)空間將“跨越鴻溝”(臨界點)。
優(yōu)點
下面我們將重點介紹24種另類數(shù)據(jù)在每種應(yīng)用的一些應(yīng)用場景。對于每個類別,在數(shù)據(jù)庫中都說明相關(guān)數(shù)據(jù)集的數(shù)量。
1.廣告(23個數(shù)據(jù)集):?主要是跟蹤在企業(yè)投放廣告的各類平臺及活動上花費的時間。廣告數(shù)據(jù)交換基于其互聯(lián)網(wǎng)瀏覽習(xí)慣隨時間具有關(guān)于消費者興趣的數(shù)據(jù)。該數(shù)據(jù)可用于跟蹤類別流行度,例如豪華產(chǎn)品和金融產(chǎn)品、抵押貸款、汽車、網(wǎng)絡(luò)安全等。但是這類數(shù)據(jù)使用得很少,但是其潛力很大。此類別中的另一種類型數(shù)據(jù)來自監(jiān)測跟蹤,電視和在線媒體。這些數(shù)據(jù)更多的是樣本或者預(yù)估。不過,他可以用來跟蹤企業(yè)營銷信息。
2.應(yīng)用程序使用和Web流量(44個數(shù)據(jù)集):可以使用在線和移動的Web瀏覽流量估算公司收入。移動應(yīng)用使用情況數(shù)據(jù)跟蹤使用應(yīng)用的下載次數(shù)和使用時間。在以前該另類數(shù)據(jù)常常衡量社交媒體平臺,手機游戲,媒體提供商,電子商務(wù)的受歡迎程度。移動應(yīng)用評論的趨勢也可以幫助分析師評估產(chǎn)品的成功。國家特定數(shù)據(jù)可以提供國際產(chǎn)品采用的見解。投資者也可以跟蹤應(yīng)用程序中嵌入的服務(wù),如支付提供商和廣告服務(wù)。應(yīng)用程序用法和網(wǎng)絡(luò)交通數(shù)據(jù)經(jīng)常是不穩(wěn)定的,并且在許多情況下,消費者可以提供更準確的信號交易數(shù)據(jù)。
3. B2B(25個數(shù)據(jù)集):各種數(shù)據(jù)聚合器提供有關(guān)企業(yè)B2B商務(wù)的數(shù)據(jù)集,包括供應(yīng)鏈分析。其中一些數(shù)據(jù)集與一系列行業(yè)相關(guān),例如監(jiān)控企業(yè)級互聯(lián)網(wǎng)瀏覽情況和阿里巴巴B2B貿(mào)易指數(shù)的企業(yè)數(shù)據(jù)。其他數(shù)據(jù)集提供基礎(chǔ)信息,例如工業(yè)材料數(shù)據(jù)庫和石油數(shù)據(jù)庫合同和鉆探特許權(quán)。
4.業(yè)務(wù)洞察(156個數(shù)據(jù)集):一組異構(gòu)數(shù)據(jù)集,提供獨特的見解。一個例子是利用另類數(shù)據(jù)跟蹤公司間業(yè)務(wù)連接的數(shù)據(jù)集。其他數(shù)據(jù)提供商跟蹤信用質(zhì)量相關(guān)的業(yè)務(wù)活動或?qū)C器學(xué)習(xí)技術(shù)應(yīng)用于大型大量匯總數(shù)據(jù),以識別面臨失敗風(fēng)險的公司。自然語言應(yīng)用于企業(yè)通信文本數(shù)據(jù)的處理算法也屬于這一類。
5.消費者信貸(13個數(shù)據(jù)集):市場借貸數(shù)據(jù)每天經(jīng)常更新,顯示貸款發(fā)放金額,貸款定價,借款人信用質(zhì)量和違約水平。其他數(shù)據(jù)提供者在特定國家/地區(qū)跟蹤消費者信用質(zhì)量。這些另類數(shù)據(jù)通常比以前更及時,可用于確定消費者信貸的動態(tài)。
6.消費者交易數(shù)據(jù)(30個數(shù)據(jù)集):這些數(shù)據(jù)來源廣泛,可以提供商家級交易數(shù)據(jù)(例如零售商,航空公司,服務(wù)提供商),產(chǎn)品級購買數(shù)據(jù)(例如食物,飲料,電子產(chǎn)品)和宏觀水平數(shù)據(jù)。一些數(shù)據(jù)來源,如信用卡交易數(shù)據(jù),代表一個龐大的用戶群。其他數(shù)據(jù)來源涉及較小的面板,例如2%消費者,但仍然提供可靠的信息。消費者交易數(shù)據(jù)經(jīng)常用于估算數(shù)據(jù)的季度收入增長季度,企業(yè)盈利公布前可用。投資者也可以使用消費者交易數(shù)據(jù),用它來深入了解消費者的購買行為。包括產(chǎn)品采用率,“優(yōu)質(zhì)”產(chǎn)品購買趨勢,促銷效果和折扣,客戶人口統(tǒng)計和共同購買行為。另外,付款處理諸如PayPal和Square的使用之類的數(shù)據(jù)在消費者交易數(shù)據(jù)中經(jīng)常是可識別的。2018年4月,Eagle Alpha基于來自的數(shù)據(jù)推出了名為RevCast的消費者交易數(shù)據(jù)集合伙人,是一家知名的消費者交易公司和在線搜索公司。
7.數(shù)據(jù)聚合器(96個數(shù)據(jù)集):技術(shù)創(chuàng)新使聚合器能夠收集數(shù)據(jù)來自不同的來源并以有助于資產(chǎn)經(jīng)理的格式匯總數(shù)據(jù)。集合商可以挖掘深層網(wǎng)絡(luò)或及時分析政府的備案和發(fā)布。其他聚合器可以運行可以購買數(shù)據(jù)集的交換機或平臺。
8.雇傭(19個數(shù)據(jù)集):職位發(fā)布列表可用于評估公司戰(zhàn)略和方向,行業(yè)增長率和對特定技能的需求。例如,是需求具有Tableau或Google AdWords經(jīng)驗,成長或穩(wěn)定的候選人?另一個數(shù)據(jù)提供商跟蹤公司員工的變化,使分析師能夠識別出高企業(yè)員工流動率或銷售人員增長強勁的公司。
9. ESG(27個數(shù)據(jù)集):另類源可以提供對環(huán)境,社會和環(huán)境的洞察力公司的治理(ESG)標準。資產(chǎn)經(jīng)理傾向于使用三種ESG特征目的:
此外,消息來源監(jiān)控業(yè)務(wù)投訴,業(yè)務(wù)聲譽,員工薪酬和招聘趨勢也很有用。我們相信這是對話和分析難以建立完整的ESG框架不使用替代數(shù)據(jù)。一些供應(yīng)商提供ESG數(shù)據(jù)生成評分的框架。例如,一個供應(yīng)商掃描了數(shù)萬個非結(jié)構(gòu)化Web源并組成ESG超過8,000家公司的得分。其他供應(yīng)商提供允許ESG的特定數(shù)據(jù)集分析師專注于某個因素ESG框架。我們看到需求不斷增長后者作為資產(chǎn)管理者開始在內(nèi)部進行評分并創(chuàng)建自己的評分數(shù)據(jù)集的內(nèi)部數(shù)據(jù)庫。
10.事件檢測(41個數(shù)據(jù)集):預(yù)警來自主要新聞線或社交媒體的突發(fā)新聞消息來源允許交易者在資產(chǎn)價格完全打折之前做出反應(yīng)。其他事件受到監(jiān)控包括了政府備案和天氣。
11.專家意見(10個數(shù)據(jù)集):任何行業(yè)或領(lǐng)域?qū)<业囊娊馀c預(yù)測趨勢的專業(yè)知識與一般人和新聞提供的趨勢大不相同。通過博客和論壇分享的信息量使投資者難以合成所有的評論。自然語言處理(NLP)工具可以幫助總結(jié)情緒和話題。
12.地理位置(54個數(shù)據(jù)集):從移動設(shè)備派生的位置數(shù)據(jù)可以及時產(chǎn)生信息訪問趨勢。常見的行業(yè)應(yīng)用包括游樂園,零售商,餐館,酒店,旅行,運輸和房地產(chǎn)投資信托基金。除了觀察人流量水平外,這些數(shù)據(jù)還可以用于識別促銷和天氣事件的影響。跨品牌忠誠度和區(qū)域性特質(zhì)可能是可識別的。地理位置數(shù)據(jù)提供商從移動應(yīng)用程序接收位置數(shù)據(jù)所有者,藍牙連接和傳感器。
例如Whole Foods的人流量數(shù)據(jù)用于跟蹤降價情況。該提供商將全球移動電話的實時位置轉(zhuǎn)換為客觀和對企業(yè),市場和經(jīng)濟表現(xiàn)的可操作見解。
13.物聯(lián)網(wǎng)(IoT)(13個數(shù)據(jù)集):由來自互聯(lián)網(wǎng)連接設(shè)備的數(shù)據(jù)組成。傳感器提供交通數(shù)據(jù),可用于衡量房地產(chǎn)的當?shù)亟?jīng)濟活動目的或跟蹤倉庫配送中心周圍的活動。傳感器可以提供有價值的農(nóng)業(yè)作物健康信息。傳感器還可以跟蹤石油和天然氣管道中的流量。
14.在線搜索(17個數(shù)據(jù)集):由搜索引擎收集的有關(guān)數(shù)據(jù)的數(shù)據(jù)搜索的術(shù)語頻率。谷歌搜索和百度是最大的搜索提供商數(shù)據(jù)。已經(jīng)進行了大量的學(xué)術(shù)研究發(fā)表了關(guān)于該數(shù)據(jù)的建立在線搜索量可以用作經(jīng)濟活動指標,以及消費者對產(chǎn)品或產(chǎn)品的興趣指標話題。而且,這些研究表明了這一點,最佳指標通常用數(shù)據(jù)構(gòu)建從一籃子條款而不是單一條款術(shù)語或少數(shù)術(shù)語。利用另類數(shù)據(jù)對復(fù)雜的數(shù)據(jù)進行科學(xué)技術(shù)分析用于確定最具指示性的搜索術(shù)語將這些術(shù)語組合成指標的有效模型。在線搜索數(shù)據(jù)已超過10年歷史,并及時提供。它的主題報道非常廣泛。
列如:2018年3月,Eagle Alpha使用Web Queries工具和Google Trends的數(shù)據(jù)對消費者使用三星Galaxy S9產(chǎn)品的推出興趣調(diào)查。指出消費者對三星S9的興趣低于其前身S8。缺乏許多功能的材料升級似乎導(dǎo)致了這種弱勢表現(xiàn)。超過50%的Twitter對話專注于相機和性能功能,相比之下關(guān)于S8發(fā)布的新顯示器的興奮。此外,搜索興趣S9比S7更接近S7。這標志著消費者對此的需求水平較低產(chǎn)品!
15.開放數(shù)據(jù)(80個數(shù)據(jù)集):大量數(shù)據(jù)可用作開放數(shù)據(jù)。CKAN,Comprehensive Knowledge Archive Network,是一個開放數(shù)據(jù)的非營利性注冊機構(gòu)。 CKAN準備數(shù)據(jù)并以使數(shù)據(jù)更易被發(fā)現(xiàn)和可用的方式提供對數(shù)據(jù)的訪問。CKAN數(shù)據(jù)管理平臺正在被許多政府,組織和企業(yè)使用世界各地的社區(qū)。與投資者相關(guān)的開放數(shù)據(jù)示例包括:打開Charge Map API(谷歌地圖、騰訊地圖),允許用戶訪問電動汽車充電位置的數(shù)據(jù)站。Wayback Machine提供互聯(lián)網(wǎng)頁面的歷史存檔,在以下情況下可能很有用回填Web爬網(wǎng)程序的數(shù)據(jù)。GDELT項目提供了一個不斷記錄世界新聞媒體的印刷平臺,廣播和網(wǎng)絡(luò)格式的每個國家的每個角落,100多種語言,和提供新聞媒體內(nèi)容的歷史檔案。
16.價格(104個數(shù)據(jù)集):現(xiàn)在,企業(yè)和消費者的商品和服務(wù)的狀況數(shù)據(jù)比過去更容易獲得。 這些數(shù)據(jù)可以提供有關(guān)企業(yè)收入和行業(yè)競爭的分析。 目前已經(jīng)使用網(wǎng)絡(luò)爬行定價數(shù)據(jù)開發(fā)了替代的通貨膨脹措施。 此類別還包括房地產(chǎn)銷售、租賃。早在2014年CAI(中國汽車洞察)利用另類數(shù)據(jù),就對中國國內(nèi)汽車制造商長城汽車運用另類數(shù)據(jù)對其銷售情況進行了研究調(diào)查并為其正確地預(yù)測了下半年報告收入的定向變動.
17.公共部門(55個數(shù)據(jù)集):政府機構(gòu)發(fā)布大量數(shù)據(jù)集,可用于衡量社會和經(jīng)濟活動以及行業(yè)動態(tài)。 許多數(shù)據(jù)集提供了來自地方政府的精細數(shù)據(jù)以及國家層面的匯總數(shù)據(jù)。這些數(shù)據(jù)如果沒有很好的索引,使用可能性很大卻又會引起麻煩。?鑒于此,公共數(shù)據(jù)將是很好的前景應(yīng)用。
18.評論和評級(27個數(shù)據(jù)集):可以收集在線發(fā)布的產(chǎn)品和服務(wù)評論,并分析評級趨勢和經(jīng)常提到的主題。大量的學(xué)術(shù)研究表明,消費者非常相信在線評論,而有利的評論通常會引起銷售增加。 與此同時,過度的負面評論和投訴可能是管理不善的跡象。 應(yīng)用評論可以提供消費者對移動銀行等應(yīng)用服務(wù)滿意度的見解。其他數(shù)據(jù)提供商通過整合各種來源來衡量消費者和B2B的意見,包括調(diào)查,從而追蹤品牌聲譽。
19.衛(wèi)星(64個數(shù)據(jù)集):將衛(wèi)星圖像分析處理為數(shù)據(jù)或情報對資產(chǎn)管理者是非常有用的。它已被用作跟蹤工業(yè)的模型的數(shù)據(jù)源生產(chǎn),特別是在缺乏及時信息的發(fā)展中國家。它可以使用跟蹤礦山,建筑工地,工廠和零售點的活動。衛(wèi)星數(shù)據(jù)也被用于估計石油和天然氣庫存和生產(chǎn)。同時已被可以準確地預(yù)測農(nóng)業(yè)收獲狀況。除了衛(wèi)星之外,無人機圖像的使用頻率也在增加。
利用另類數(shù)據(jù)國外一家公司利用衛(wèi)星圖像數(shù)據(jù),對停車場的車輛信息進行測試編目并重新測試了超過一百萬個停車場圖像,占據(jù)了15億輛汽車超過七年。然后可以使用從衛(wèi)星圖像獲得的交通數(shù)據(jù)進行分析累計同比車數(shù)增長率并將其與收入增長和股價動態(tài)進行比較。
20.情緒(63個數(shù)據(jù)集):由于其相對較長的歷史和柱狀時間序列結(jié)構(gòu),通過情感和新穎性對新聞提要和社交媒體帖子進行評分是一種流行的數(shù)據(jù)來源,特別是對于量化基金而言。 情緒評分可以應(yīng)用于投資者評判消費者對產(chǎn)品和品牌的態(tài)度,或主流新聞提要。情感數(shù)據(jù)提供者除了將文章映射到諸如政府機構(gòu)和公開交易公司之類的實體之外,還可以提供與主題新穎性,相關(guān)性,價格影響估計和動量相關(guān)的額外分數(shù)。數(shù)據(jù)可以應(yīng)用于因子模型,也可以在動量和逆向交易策略中使用。
21.社交媒體(100個數(shù)據(jù)集):來自社交媒體平臺的數(shù)據(jù)可用于分析消費者趨勢,產(chǎn)品發(fā)布狀況,品牌知名度,客戶滿意度,產(chǎn)品銷售促銷,社會和政治動態(tài)以及企業(yè)/客戶參與程度。利用該類數(shù)據(jù)品牌,越來越多的個人在社交媒體上與該品牌互動,已經(jīng)證明了這一點良好的銷售勢頭,品牌實力往往是股價的驅(qū)動因素。
22.商店位置(14個數(shù)據(jù)集):跟蹤商店位置可以深入了解企業(yè)增長和戰(zhàn)略,特別是在跟蹤商店營業(yè)時間和促銷活動時。商店位置數(shù)據(jù)還可用于評估可尋址的市場規(guī)模和市場飽和度。
23.貿(mào)易(39個數(shù)據(jù)集):許多大型企業(yè)利用該類數(shù)據(jù)集進行國際收支估算,對主要商品市場的見解,國家競爭優(yōu)勢的跡象和消費者實力的指標。以股票為重點的策略使用貿(mào)易數(shù)據(jù)來衡量那些產(chǎn)品可以與特定商品的進口/出口相關(guān)聯(lián)并分析供應(yīng)鏈活動的公司的銷售額。 貿(mào)易數(shù)據(jù)還可用于衡量運輸公司和公開交易港口的活動。
24.網(wǎng)頁抓取(69個數(shù)據(jù)集):網(wǎng)絡(luò)爬取是通過從公共URL請求信息的計算機程序來聚合價格,社交媒體,評級/評論,就業(yè)和商店位置數(shù)據(jù)的手段。 網(wǎng)絡(luò)爬取還用于監(jiān)控企業(yè)網(wǎng)站的變化,例如反映戰(zhàn)略計劃的網(wǎng)站結(jié)構(gòu)的擴建,某些產(chǎn)品線中增加的內(nèi)容,增加的博客活動,促銷活動和地理擴展。
網(wǎng)絡(luò)爬取可用于監(jiān)控提供特定服務(wù)(如太陽能裝置或軟件服務(wù))的小眾電子商務(wù)站點和站點。有時可以通過網(wǎng)絡(luò)爬取很好地獲取有關(guān)政府備案的信息。 數(shù)據(jù)可以在內(nèi)部收集,也可以由專門從事定制數(shù)據(jù)采集的公司采集。 包含歷史爬網(wǎng)數(shù)據(jù)的數(shù)據(jù)集已由專業(yè)的網(wǎng)絡(luò)采集公司進行爬取。
盡管目前另類數(shù)據(jù)的應(yīng)用仍面臨技術(shù)的局限、較高的成本和監(jiān)管不完善等問題,但隨著技術(shù)的發(fā)展,另類數(shù)據(jù)的應(yīng)用也許會突破我們想象的邊界,在未來扮演更重要的角色,成為傳統(tǒng)數(shù)據(jù)的重要補充,以及投資者提升決策質(zhì)量的利器。同時,量化投資者也需要對數(shù)據(jù)背后的市場驅(qū)動因素有深刻的認識,才能在這場數(shù)據(jù)革命中立于不敗之地。