一、智能投研現(xiàn)狀
狹義:人工智能在投資研究上的應(yīng)用。通過人工智能技術(shù)拓寬投資信息來源,提高獲取信息的及時性,減少基礎(chǔ)數(shù)據(jù)處理的工作量,通過自動化的數(shù)據(jù)分析,為投資決策提供參考,從而提高投資研究的效率。
廣義:人工智能在資本市場相關(guān)領(lǐng)域的應(yīng)用。從使用者的角度來看,智能投研的受眾包括各種類型的投資者(買方)、券商(賣方)、監(jiān)管機構(gòu)、銀行和財經(jīng)媒體等。從投資的標(biāo)的來看覆蓋一級市場公司、股票、債券、外匯等。而人工智能的應(yīng)用場景涉及業(yè)務(wù)的各種環(huán)節(jié),與投研直接相關(guān)的就包括研究、投資、交易和風(fēng)險管理。
1、供求
大部分獨立的智能投研公司主要在數(shù)據(jù)的處理環(huán)節(jié)。最終與投資交易直接掛鉤的智能投研由投資機構(gòu)自己搭建為主,同時會采購?fù)獠康谌降臄?shù)據(jù)和服務(wù),在內(nèi)部進行整合。
智能投研的流程及功能
數(shù)據(jù)獲取 | 數(shù)據(jù)處理 | 數(shù)據(jù)處理 | 數(shù)據(jù)輸出 |
•數(shù)據(jù)爬 取 •另類數(shù) 據(jù) | •結(jié)構(gòu)化 •標(biāo)準(zhǔn)化 | •標(biāo)簽 •知識圖 譜 | •智能搜 索 •可視化 •預(yù)測 |
數(shù)據(jù)來源:公開資料整理
產(chǎn)業(yè)鏈的上游是數(shù)據(jù)源。(1)傳統(tǒng)數(shù)據(jù)。金融行業(yè)本身已經(jīng)存在大量標(biāo)準(zhǔn)化的數(shù)據(jù),包括公司財務(wù)數(shù)據(jù)、公司公告、交易數(shù)據(jù)、宏觀數(shù)據(jù)、行業(yè)數(shù)據(jù)、券商研報等,這些數(shù)據(jù)主要由金融數(shù)據(jù)公司進行整合。(2)爬蟲數(shù)據(jù)。這些數(shù)據(jù)來自于互聯(lián)網(wǎng),相比傳統(tǒng)金融數(shù)據(jù)庫,這些數(shù)據(jù)的顆粒度更細,數(shù)據(jù)來源主要是地方政府網(wǎng)站、地方監(jiān)管部門網(wǎng)站、社交網(wǎng)站、媒體網(wǎng)站等。(3)另類數(shù)據(jù),主要指通過智能設(shè)備采集的數(shù)據(jù),包括衛(wèi)星圖片、天氣數(shù)據(jù)等,更多的是通過個人移動終端采集的各種數(shù)據(jù)。
產(chǎn)業(yè)鏈的中游主要是數(shù)據(jù)的采集和標(biāo)準(zhǔn)化。產(chǎn)品形態(tài)包括數(shù)據(jù)處理的工具或者處理之后的數(shù)據(jù)產(chǎn)品。(1)數(shù)據(jù)抓取工具:直接對客戶開放的基礎(chǔ)產(chǎn)品,也是開發(fā)其他高級工具的底層技術(shù)。應(yīng)用于標(biāo)準(zhǔn)化金融文本的關(guān)鍵信息摘取。(2)核查類工具:對于有明確規(guī)則的金融文本提供自動核查,包括核對財務(wù)數(shù)據(jù)。(3)產(chǎn)業(yè)鏈圖譜:通過打標(biāo)簽和標(biāo)簽之間的關(guān)系建立,細化行業(yè)分類,展現(xiàn)產(chǎn)業(yè)鏈上下游、競爭對手、股權(quán)投資等關(guān)系,尋找潛在的投資標(biāo)的或發(fā)現(xiàn)潛在的風(fēng)險傳導(dǎo)路徑。
產(chǎn)業(yè)鏈的下游是數(shù)據(jù)的需求方和應(yīng)用場景,以金融機構(gòu)為主。(1)券商主要包括三個部門的需求。投行部門:提交文件的審核、找項目。網(wǎng)金部:APP智能投顧功能的底層支持。研究所:報告的質(zhì)控檢查、信息搜索、公告數(shù)據(jù)提取。(2)投資機構(gòu)。一級市場投資者:找項目,監(jiān)控競爭對手。二級市場投資者:量化投資的策略因子、資產(chǎn)組合的監(jiān)控及風(fēng)險預(yù)警。(3)證監(jiān)會&交易所:標(biāo)準(zhǔn)金融文本的審核、信息披露的監(jiān)控等監(jiān)管科技范疇。(4)其他需求。如銀行的小微企業(yè)信貸風(fēng)控、尋找潛在的企業(yè)客戶;企業(yè)尋找合作伙伴等。
2、參與者
智能投研對于這些數(shù)據(jù)服務(wù)商來說可以提升數(shù)據(jù)采集的自動化程度,增加數(shù)據(jù)功能模塊。彭博、湯森路透是全球市占率最高的兩家金融數(shù)據(jù)公司,其優(yōu)勢在于數(shù)據(jù)全、顆粒度細、服務(wù)好,但價格比較高。商業(yè)模式也較為類似,除了提供數(shù)據(jù)終端之外,也是財經(jīng)媒體,擁有自己的電視臺、電臺。CaptitalIQ、Factset、MorningStar與頭部的兩家公司形成一定的差異化競爭,雖然數(shù)據(jù)不夠全,但在細分領(lǐng)域上做更深的數(shù)據(jù)挖掘和加工,且價格相對便宜。國內(nèi)金融數(shù)據(jù)服務(wù)市場的集中度更高,基本處于萬得一家獨大的狀態(tài)。
國內(nèi)外主要的金融數(shù)據(jù)服務(wù)商
區(qū)域 | 主要機構(gòu) |
海外 | 彭博、湯森路透、CaptitalIQ、Factset、MorningStar |
國內(nèi) | Wind萬得、東方財富choice、同花順iFinD、恒生聚源 |
數(shù)據(jù)來源:公開資料整理
在智能投研領(lǐng)域有大量的創(chuàng)業(yè)公司。這些創(chuàng)業(yè)團隊一般都具有人工智能的技術(shù)背景和金融行業(yè)從業(yè)經(jīng)歷。
2、互聯(lián)網(wǎng)巨頭
具有明顯的數(shù)據(jù)優(yōu)勢,可提供獨家因子給量化基金。BAT在人工智能領(lǐng)域均有布局,重點放在通用的基礎(chǔ)技術(shù)研發(fā)上。其中螞蟻金服在金融行業(yè)的布局較廣。螞蟻金服在底層通用技術(shù)的研發(fā)包括人臉識別技術(shù)、圖像識別技術(shù)、自然語言處理等,應(yīng)用在泛金融場景中的包括智能客服、智能營銷、智能推送、智能定損、安全風(fēng)控等。從整個資產(chǎn)管理行業(yè)來看,螞蟻金服在獲客、客戶運營方面有優(yōu)勢,在投研領(lǐng)域,互聯(lián)網(wǎng)巨頭在另類數(shù)據(jù)方面有明顯的優(yōu)勢,可以提供獨家的因子給投資機構(gòu)。
3、投資機構(gòu)內(nèi)部研發(fā)
就投資而言,外部第三方以提供數(shù)據(jù)工具為主,具體落地到投資策略制定和交易執(zhí)行一般在投資機構(gòu)內(nèi)部。投資機構(gòu)通常會外部采購標(biāo)準(zhǔn)模塊,疊加內(nèi)部投資策略,構(gòu)建內(nèi)部智能投研系統(tǒng)。(1)海外智能投研使用已經(jīng)較為普遍。成熟的金融市場有充足的投資工具,運用人工智能的量化投資已積累了一定量的歷史數(shù)據(jù)。部分由人工智能管理的基金取得了超過業(yè)績基準(zhǔn)的超額收益。(2)國內(nèi)的資本市場仍處于發(fā)展早期,歷史數(shù)據(jù)和交易工具比較缺乏,前幾年推出的大數(shù)據(jù)基金并未取得理想的業(yè)績表現(xiàn)。目前國內(nèi)有部分公募基金正在積極探索智能投研的應(yīng)用,包括嘉實基金、天弘基金、富國基金、華夏基金等,智能投研的發(fā)展是資產(chǎn)管理行業(yè)的大勢所趨。
4、人工智能
在智能投研中主要應(yīng)用的人工智能技術(shù)包括圖像識別、自然語言處理、情感分析、知識圖譜等。這些技術(shù)的使用本身存在遞進的關(guān)系。首先通過圖像識別技術(shù),對圖像中印刷或者手寫的文字進行識別,輸出可以編輯的文檔格式。其次是通過自然語言處理及情感分析對本文進行結(jié)構(gòu)化處理,變成機器可讀的數(shù)據(jù)。最后結(jié)合專家知識和機器學(xué)習(xí)等算法,建立起數(shù)據(jù)之間的關(guān)系網(wǎng)絡(luò),實現(xiàn)一定程度的分析功能。
人工智能的能力邊界。(1)優(yōu)勢:相比人工模式,人工智能拓展了數(shù)據(jù)來源,大幅提升了數(shù)據(jù)運算的能力。人腦習(xí)慣于線性關(guān)系和因果關(guān)系的分析,而機器能分析多元、非線性關(guān)系,尋找相關(guān)性而非局限于因果關(guān)系。(2)不足:就現(xiàn)階段來看,人工智能在有明確邊界、規(guī)則和目標(biāo)的場景中,效果更明顯。例如:數(shù)據(jù)工具類產(chǎn)品主要應(yīng)用于審核、檢查、核對等場景,這些場景的特征就是規(guī)則明確、目標(biāo)清晰;人工智能已經(jīng)可以實現(xiàn)自動寫新聞,但自動寫的研究報告可用性不強,更適合上市公司財務(wù)數(shù)據(jù)披露使用,原因在于研究報告的分析角度受撰寫者的思考邏輯和知識背景差異而不同;人工智能在防范風(fēng)險上的表現(xiàn)優(yōu)于尋找機會,歷史數(shù)據(jù)積累有助于風(fēng)險模型的不斷優(yōu)化,而潛在的投資機會往往會突破原有的分析框架。(3)約束條件:數(shù)據(jù)質(zhì)量影響智能投研的效果,隨著底層數(shù)據(jù)質(zhì)量不斷提升,智能投研的效果會越來越好。
5、自然語言處理
自然語言處理(NLP)就是將復(fù)雜的人類自然交流的語言轉(zhuǎn)化成標(biāo)準(zhǔn)化的計算機語言。自然語言處理包括兩個部分,一是自然語言理解(NLU),使計算機理解人類的語言,二是自然語言生成(NLG),把計算機運算的結(jié)果以人類自然語言的形式呈現(xiàn)。
自然語言處理的四個層面
層面 | 描述 |
詞典構(gòu)造 | 構(gòu)造包含盡量多的語法信息、語義信息、語用信息等 的機器語言詞典,將其作為構(gòu)建自然語言理解平臺的 基礎(chǔ)。 |
語法分析 | 對自然語言進行表層的形式化分析,包括詞法分析和 句法分析兩部分。詞法分析是將自然語言進行切分, 并將每個切分的詞加上詞性標(biāo)記,它是句法分析的基 礎(chǔ)。句法分析是將句子的詞語序列映射為句法成分的 層次結(jié)構(gòu)。 |
語義分析 | 在語法分析的基礎(chǔ)上理清句子的語義結(jié)構(gòu)關(guān)系,對整 個句子的語義進行組合和表達并說明句子中詞語搭 配上存在的各種語義限制條件。 |
篇章分析 | 研究句子之間的關(guān)系以及整個篇章中包含的知識。 |
數(shù)據(jù)來源:公開資料整理
自然語言生成的三個功能
功能 | 描述 |
內(nèi)容規(guī)劃 | 決定生成的文本所要表達的內(nèi)容,并對已確定的內(nèi)容 進行結(jié)構(gòu)化描述,使之符合閱讀理解習(xí)慣 |
句子規(guī)劃 | 進一步明確定義規(guī)劃文本的細節(jié)。 |
表層生成 | 將句子規(guī)劃后的文本描述映射至由文字、標(biāo)點和結(jié)構(gòu) 注解信息組成的表層文本 |
數(shù)據(jù)來源:公開資料整理
情感分析是自然語言處理中的一個重要研究方面,主要是對帶有感情色彩的主觀性文本進行分析、處理、歸納和推理。情感分析的發(fā)展得益于社交媒體的興起,產(chǎn)生了大量個體參與的、對于人物、事件和產(chǎn)品的評論信息,通過機器學(xué)習(xí),得出可量化的數(shù)據(jù)結(jié)論。
情感分析的步驟
步驟 | 描述 |
情感信息的提取 | 在文本中抽取有價值的情感信息 |
情感信息的分類 | 主要包括主、客觀信息的分類和主觀信息的情 感分類 |
情感信息檢索 | 可以檢索出與主題相關(guān)且包含情感信息的文 檔。 |
情感信息歸納 | 可以將與大量主題相關(guān)的情感文檔進行自動 分析和歸納并得出情感分析結(jié)論。 |
數(shù)據(jù)來源:公開資料整理
自然語言處理的應(yīng)用場景:大數(shù)據(jù)分析、日志挖掘及分析、自動摘要、文本分類、信息提取、文本朗讀/語音合成、語音識別、信息檢索、文字校對、機器翻譯、問答系統(tǒng)等。在金融行業(yè)的應(yīng)用包括輿情監(jiān)測、智能風(fēng)控、智能客服等。
6、知識圖譜
知識圖譜:將知識結(jié)構(gòu)繪制成以各個知識單元概念為節(jié)點的地圖。知識圖譜的基礎(chǔ)是自然語言處理,在計算機對文本中的知識點理解之后,再建立起各個知識單元之間的關(guān)系,形成知識網(wǎng)絡(luò),最后以可視化的形式展現(xiàn)出來,或者通過智能搜索引擎呈現(xiàn)。知識圖譜的底層是文本、標(biāo)簽和表格,在此基礎(chǔ)上構(gòu)建圖表、模式、本體和規(guī)則。
投研領(lǐng)域的知識圖譜。在投研領(lǐng)域,知識單元包括公司、產(chǎn)品、股東、管理層等,知識單元之間的關(guān)系包括上下游、競爭對手、合作、股權(quán)、擔(dān)保等。知識圖譜可以知識單元之間的關(guān)系網(wǎng)絡(luò)直觀地顯示出來,當(dāng)其中某個節(jié)點發(fā)生變化時,能快速識別出這個變化在關(guān)系網(wǎng)絡(luò)中的傳導(dǎo)過程及對特定主體的具體影響。
建立知識圖譜的步驟
步驟 | 描述 |
實體識別 | 從新聞資訊、公司公告、券商研究報告等海量的信 息源中抓取實體。 |
關(guān)系構(gòu)建 | 基于機器學(xué)習(xí)等方法發(fā)掘?qū)嶓w之間的各種關(guān)系 |
數(shù)據(jù)來源:公開資料整理
二、市場空間及行業(yè)趨勢
要從數(shù)據(jù)服務(wù)廣義的角度看智能投研的市場空間。(1)如果僅從投資機構(gòu)的付費能力看,智能投顧的市場空間有限。頭部的券商和具有一定資產(chǎn)管理規(guī)模的投資機構(gòu)是收入的主要來源,機構(gòu)數(shù)量和資產(chǎn)規(guī)模成為主要的限制條件。目前國內(nèi)傳統(tǒng)的金融數(shù)據(jù)服務(wù)被萬得基本壟斷,市占率超過80%,萬得2016年的營業(yè)收入為13.3億元,整個市場規(guī)模在20-30億元左右。(2)間增量空間1:投資機構(gòu)需求的多元化。從數(shù)據(jù)層面,從傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)向非機構(gòu)化數(shù)據(jù)拓展,而非結(jié)構(gòu)化數(shù)據(jù)的規(guī)模占到80%。從服務(wù)層面,在數(shù)據(jù)功能上要不斷完善,提高自動化程度,減少簡單重復(fù)的人工作業(yè);此外數(shù)據(jù)服務(wù)與軟件服務(wù)相結(jié)合,形成綜合性的投資管理平臺。(3)增量空間2:目標(biāo)客戶的多元化。從金融行業(yè)領(lǐng)域來看,除了投研部門之外,金融數(shù)據(jù)服務(wù)的對象豐富,包括投行業(yè)務(wù)部門、銀行信貸部門、監(jiān)管審核部門等。其他潛在客戶還有媒體、企業(yè)、政府、法律機構(gòu)等。
全球金融數(shù)據(jù)市場的規(guī)模達到260億美元,全球的資產(chǎn)管理規(guī)模約為80萬億美元;由證券業(yè)協(xié)會統(tǒng)計的國內(nèi)資產(chǎn)管理行業(yè)的約為50萬億元,而金融數(shù)據(jù)行業(yè)的規(guī)模僅為20-30億,與海外市場相比,市場潛力巨大。
2014-2018年主要上市金融數(shù)據(jù)公司的營業(yè)收入(億美元)
數(shù)據(jù)來源:公開資料整理
資產(chǎn)管理行業(yè)是智能投研的主要客戶來源,資產(chǎn)管理行業(yè)的機構(gòu)數(shù)量、資產(chǎn)規(guī)模決定了智能投研行業(yè)的收入規(guī)模。根據(jù)調(diào)查數(shù)據(jù)統(tǒng)計,截止2018年末,資產(chǎn)管理業(yè)務(wù)總規(guī)模約為50萬億元,其中包含了公募基金、私募基金、基金子公司、證券公司及期貨公司。從增速來看,由于近兩年宏觀經(jīng)濟增速下滑、資本市場波動及監(jiān)管趨嚴(yán)等因素影響,資產(chǎn)管理規(guī)模增速放緩,其中2018年整體規(guī)模有所下滑,但從2014年以來,規(guī)模的復(fù)合增速達到了25%。隨著資產(chǎn)管理行業(yè)成熟度提升,更多機構(gòu)(保險機構(gòu)、外資機構(gòu)等)和資金(養(yǎng)老金、居民儲蓄等)進入資本市場,資產(chǎn)管理行業(yè)規(guī)模長期將保持增長態(tài)勢。
2014-2018年資產(chǎn)管理業(yè)務(wù)總規(guī)模(萬億元)
數(shù)據(jù)來源:公開資料整理
一方面,投資機構(gòu)通過自動化程序不斷提升運營效率,包括投資研究和交易;另一方面,投資交易的風(fēng)格越來越偏被動和量化,逐漸降低人為主觀操作的比例,或者說通過技術(shù)手段更好的執(zhí)行投資經(jīng)理的投資策略,這些需求都要提升投資機構(gòu)的科技投入。具體來說,β收益產(chǎn)品要求更低的管理成本和交易成本,提升跟蹤標(biāo)的的準(zhǔn)確度,α收益產(chǎn)品的管理難度不斷提升,需要持續(xù)發(fā)現(xiàn)新的、有效的投資策略才能獲取超額收益。Smartβ產(chǎn)品介于主動及被動管理之間,人工智能可以幫助該類產(chǎn)品進行動態(tài)的因子調(diào)整,進一步提升獲取超額收益的可能性。
傳統(tǒng)的金融數(shù)據(jù)服務(wù)公司在數(shù)據(jù)積累及客戶資源上具備優(yōu)勢,通過外部并購優(yōu)秀的創(chuàng)業(yè)公司可提升數(shù)據(jù)產(chǎn)品能力,利用最前沿的人工智能技術(shù),賦能已有的數(shù)據(jù)業(yè)務(wù),增強客戶粘性、做大收入規(guī)模。例如標(biāo)普全球公司最近兩年連續(xù)收購了固定收益技術(shù)供應(yīng)商Algomi、替代數(shù)據(jù)技術(shù)公司UrsaSpaceSystems和Kensho以及機器學(xué)習(xí)與分析公司PanjivaInc。
盡管海外金融數(shù)據(jù)市場非常成熟,頭部幾家基本都有數(shù)十年的歷史,但在一級市場上仍有大量的初創(chuàng)公司在細分領(lǐng)域進行探索,運用自然語言處理、知識圖譜等人工智能技術(shù)開發(fā)差異化的數(shù)據(jù)產(chǎn)品。
海外典型智能投研創(chuàng)業(yè)公司
公司 | 簡介 |
AlphaSense | 搜索引擎,整合公司公告、新聞、研究報告中的 投資信息 |
Automated Insights | 自動寫作,自動撰寫新聞和上市公司的營收報 告 |
AlgoDynamix | 風(fēng)控系統(tǒng),對全球金融交易所數(shù)據(jù)進行實時分 析,及時發(fā)現(xiàn)市場異常,對潛在風(fēng)險發(fā)出預(yù)警 |
VisibleAlpha | 財務(wù)模型,整合各家賣方報告的財務(wù)預(yù)測模型, 除了三表之外,還包括其他業(yè)績驅(qū)動因素的分析 及預(yù)測。 |
Dataminr | 社交數(shù)據(jù)的大數(shù)據(jù)挖掘,搜集社交媒體上的實時 數(shù)據(jù),包括每天5億條的推特,利用機器學(xué)習(xí)提 前發(fā)現(xiàn)可能會影響公司的事件。 |
數(shù)據(jù)來源:公開資料整理
相關(guān)報告:智研咨詢發(fā)布的《2020-2026年中國人工智能行業(yè)市場消費調(diào)查及投資前景評估報告》


2025-2031年中國人工智能大模型行業(yè)市場運營態(tài)勢及發(fā)展趨向研判報告
《2025-2031年中國人工智能大模型行業(yè)市場運營態(tài)勢及發(fā)展趨向研判報告》共十五章,包含中國人工智能大模型行業(yè)重點上市企業(yè)經(jīng)營狀況分析,2025-2031年中國人工智能大模型行業(yè)投資潛力分析,對2025-2031年中國人工智能大模型行業(yè)發(fā)展前景及趨勢預(yù)測等內(nèi)容。



