中小型基金公司是如何考慮數據建設“性價比”的?
一直以來,基金都被認為是一個有門檻的投資領域,不僅僅因為產品的復雜性,也因為渠道的局限性。過去,投資者主要通過銀行代銷和基金公司自銷渠道購買基金產品,但前者手續費昂貴、后者產品單一,只能滿足少數投資群體的需要。
直到互聯網金融平臺盛行,局面開始發生改變。
(資料圖片)
由于互聯網平臺的購買流程相對簡單、手續費用較低,而產品來源和種類又更為多樣化,近幾年越來越多的大眾投資者開始涌入基金領域;同時,通過接入互聯網平臺,基金公司也從幕后來到臺前,開始直接面對海量投資者。
這些改變于基金公司而言亦喜亦憂。流量涌入帶來的自然是交易量的提升,但一方面,傳統基金交易與互聯網平臺的基金交易數量級已經不可同日而語,這對基金公司底層技術能力是一次從量變到質變的考驗。
在日前接受專訪時,九泰基金總經理嚴軍舉例,過去傳統基金公司的交易最多只有幾萬到上百萬的并發量,通常只有在新基金申購的最后幾天才會達到幾十萬,最多上百萬的峰值;而互聯網平臺考驗的是短時并發,流量高峰甚至會超過十億級。
嚴軍強調,面對這種海量的動態申購贖回,用戶在意的是體驗感,也就是說在業務交易過程中具有連續性。如果按照傳統方式處理這種大并發情況,數據處理系統可能就會直接宕機。
另一方面,更多大眾投資者甚至是理財小白的入場,這要求基金公司必須具備更強大的風險管控能力,并且能夠持續優化投資組合,滿足投資者多樣化的需求。在這個過程中,只有拿捏住數據,才能拿捏住變局。
但是,對于像九泰基金這樣的小型基金公司來說,和公募基金巨頭千億級、萬億級的基金管理規模相比,目前其體量只有數十億到百億級。據嚴軍介紹,在基金行業,考慮到資金成本、資源配比和人員投入等“性價比”的問題,像九泰基金這樣體量的公司通常不會自建數據中心,而是通過恒生等第三方平臺提供的工具獲取交易數據,許多關鍵的銷售數據、申贖數據都無法掌握,更不要說將數據作為資產留存下去,盤活賦能全部業務。
不過,九泰基金并沒有走這條所謂的“尋常路”。自成立以來,九泰基金就非常重視IT投入,雖然只有十幾人的技術團隊,但僅用了1年多的時間,就自主構建了自己的數據中心。從搭建系統到建設數據中心,從數據整理、分類到數據分析,從單一數據指導到群集數據賦能,九泰基金從零開始,蹚出了一條小型基金公司數據能力建設的道路。
01 擺脫孤島,小體量公司也要自建數據中心
過去,傳統基金公司的系統架構主要是煙囪式建設模式,一般是基于規劃容量進行設計與開發。這是因為那時基金公司推出的產品有限,用戶規模可以估計,在極端的情況下,也可通過用戶排隊等機制來降低系統負載壓力。然而,在互聯網場景下,互聯網金融平臺各種活動層出不窮,短時間內發生用戶集體申購贖回基金的行為增加,面臨數據大并發,這時候再采用簡單的等候排隊策略,會嚴重降低用戶的體驗感。
其次,傳統基金公司的業務之間很少互相訪問,業務服務在設計與運營過程中也缺乏復用的考慮,所以很難滿足多個場景并發訪問的需求。但是基于互聯網,投資者與基金公司的交互頻率將越來越高,顯然這種設計和運營模式很難快速響應用戶需求。在競爭激烈的市場上,擁有速度和體驗便等于擁有了用戶的注意力與認可,這意味著,傳統基金公司可能因此錯失大把商機。
除了快速為用戶提供產品之外,關注基金的銷售數據、用戶的申贖數據,進而洞察用戶的深層需求也至關重要。但是,傳統基金公司過往的數據資源,要么已經在自己原有的歷史系統中,要么存在于各種銀行和券商等渠道中,這造成了數據整合難、質量差、無法實時同步等問題,很難為洞察用戶需求提供有價值的信息。
嚴軍表示,這些“前車之鑒”是促使九泰基金自建數據中心非常重要的原因。“我們希望能夠把系統全部整合在自有的數據平臺上,通過數據中心形成一個完整的運行體系,而不是成為一個個孤島。”
據他介紹,目前九泰基金已經構建了投研、營銷和內部管理三大數據中心,覆蓋了投資、銷售、運營等大量數據。這對九泰基金的工作人員來說是意義重大。
比如:對于傳統基金銷售人員來說,以前都是拍腦袋猜測用戶的投資偏好,還要一次次地進行問卷調查,不但效率低,銷售效果也不一定好。而基于后臺數據,銷售人員可以進行千人千面的分析,包括哪個地區的人買的最多是什么結構的產品、什么類型的人群喜歡更買哪類產品等等,往往能夠給出比較準確的數據分析結果,指導公司改進銷售策略;
再比如:對于運營人員來說,無論是面對外部監管還是公司內部運營,他們都可以通過數據后臺提取需要的數據,僅需2名運營人員,最快在幾分鐘內,就能生成相關報表。如此一來,既節省了時間成本,又增加了工作的便利性。在適應日益普及的金融監管數字化報送機制過程中,這提供了非常關鍵的支撐。
嚴軍介紹,目前很多小型基金公司會把監管數據報送的工作全部依托給外部第三方公司,這可能造成對報送過程的不可控,不一定能保證項目進度,從而使得公司處于被動狀態。
但是,他還強調,九泰基金在自主建設數據架構的過程中,同時還保留了第三方公司提供的系統代碼和邏輯,“這么做的好處是,當對同一套數據進行分析時,就可以在兩邊系統各自跑,如果跑出來對結果完全一致,那證明數據一定是準確的,可以直接上報;如果跑出來的結果不一樣,就證明其中有誤差,需要員工再次做核對。”
也就是說,通過數據中心的自主建設,使得九泰基金大量的經驗數據能夠沉淀下來,不僅可以構成驅動系統應用的核心,還可以整合資源,通過平臺服務支撐各類業務的訪問需求。
02 人員有限,系統該自研還是外購
不過,就像羅馬帝國不是在一天建成,九泰基金的數據基礎也不是在短時間內打好的,在這個過程中,他們也遇到了不少挑戰。
首先,九泰基金成立時間晚,IT建設完全是從零開始,這意味著在數據處理之前,他還有大量的基礎建設工作要補齊。但是,最初九泰基金的技術人員只有不到10人,據嚴軍介紹,他們接到的第一個任務是在一個月時間內,構建14套主要系統。在人員有限,公司業務又必須往前推進的情況下——先建設哪個系統?如何建設?如何最高效地滿足當時業務的發展需求?這些問題急需解決。
無疑,最快的解決辦法是外購技術提供商通用的系統。嚴軍表示,有些企業會擔心外購系統靈活度不高、自主性不強等問題,但是,比如銷售系統、投資系統等對時效性的要求極高的系統,并非是基金公司的技術開發強項,通過沉淀投資公司遇到的共性問題,技術商往往能夠提供更專業和成熟的方案。所以,這部分的系統九泰基金就會考慮完全外購,不占用非必要的人力,讓系統盡快投入使用。
另外,針對與業務邏輯有強關聯,但短期內自身開發能力又不足的系統,九泰基金則優先選擇與外部技術公司共建。在合作共建的過程中,由技術商提供成熟專業的技術、工具,而九泰基金則可以提供具有針對性的數據,以及業務邏輯指導。
比如,如何利用工具從系統中抓取所需要的數據?技術工具本身并不是九泰基金的長處,但哪些業務流程是主要的?具體抓取的數據字段又有哪些?這部分就需要九泰基金內部成熟的業務人員與外部專業公司共同參與;再比如,APP可以自己開發,但是其中的安全防護模塊,涉及身份識別、密碼插件等各種關鍵安全防護技術,這時候就需要外部專業公司從技術上提供相應服務,把相關安全防護技術產品嵌入到APP中。
也就是說,共建的方法可以解決九泰基金一些“當務之急”,利用外部資源補足自身的短板,同時也滿足了部分業務個性化的需求。
但顯然,這仍然不夠。隨著公司業務的拓展,個性化的需求越來越多,共建系統的弊端也逐漸彰顯——比如想進行部分功能的調整,還需要兩方人員的花費大量時間共同協商,長此以往,又會加大時間與人力成本,得不償失。所以,針對個性化極強的系統,九泰基金全都選擇了自研。
比如,投資系統可以外購,但是研究報告系統最好就要自研。“我們希望對所有的報告自行進行智能篩選,從海量報告中找出高質量的研究報告,從而進行持續的跟蹤和評價。目前市場上的研究報告系統普遍差強人意。而且隨著基金品種的增多,業務復雜度進一步增強,大家又有差異化發展的目標,這種個性化需求會越來越多。”嚴軍解釋。
再比如,包括OA在內的管理類系統,九泰基金未來也會選擇自研。由于九泰基金處于快速增長期,隨著人員的增加、部門的擴張、以及業務的變化等原因,OA系統必須可以及時動態調整,滿足公司個性化運營和管理的需求。
總而言之,九泰基金在時間緊、任務重、人員有限的多重挑戰下,按照任務優先級和系統個性化需求程度分別選擇了三種方法建設基礎的系統設施,把僅有的技術人員投入到必須自主開發的項目中,充分利用了現有資源,并保證了公司業務的有序運營。
03 如何才讓數據真正帶來價值
眾所周知,數據是數字化轉型的核心,數據處理又是利用好數據的關鍵環節,也是最困難的環節。根據嚴軍介紹,企業進行數據能力建設有三個關鍵部分:數據清洗、數據分類、數據分析。
第一步:數據清洗,要挖掘“業務+IT”復合人才
“我們剛開始采用的數據系統來自于四五個IT供應商,像恒生、金證、贏時勝、浪潮等。想要做自己的數據中心挑戰很大,需要把所有的底層數據全部鋪過來,把所有的人員也都鋪上去,進行數據加工、清洗、識別。”嚴軍補充道。
具體來說,基金業務流程涉及到開設基金賬戶、認購申贖基金、選擇基金分紅方式、設置贖回模式等,在此過程中,包括了用戶、產品、銷售、交易等海量信息。這些信息又通常會以不同的字段、不同的方式存儲在對應的數據中心中。數據清洗的目的在于洗掉無效、重復的信息,確保數據質量,讓數據盡可能的完整、準確、一致、可用。如此才能夠利用數據賦能業務。
據嚴軍介紹,業務部門提出的需求是希望在1年內,把九泰基金所有的數據全都梳理清楚。當時,系統中已經沉淀了4年多的數據,規模達到近百TB,并且數據質量參差不齊。對于技術部門來說,這個工作量并不小。雖然交給專門的數據處理公司,速度更快,但是成本高,雙方對業務理解還可能會存在偏差。“而且,如果一個公司想真正地提升自己對專業化能力,提升數據準確度和利用效率,這是繞不過去的坎兒,這個工作自己早晚都要做。所以,我們選擇自己內部來完成。”
時間緊、任務重,但是數據質量的問題絲毫不能馬虎。優質的數據意味著更大的商業價值,相反,如果數據質量不佳,將會導致一系列的問題。比如,不準確的數據,面對嚴格的審查機制是不可能通過的;再比如,數據質量不佳,難以賦能公司運營,無法精準建構客戶畫像、把握投資需求,更有甚者還可能提出錯誤的戰略方向,影響公司業務發展。
嚴軍表示,數據質量的保證沒有竅門,唯一的辦法,是讓對的人去做對的事,讓真正懂業務的人去做這個工作。“因為他會知道哪些數據是有用的,哪些是沒用的,技術人員如果對這個不清楚,他很可能把一些有效的數據給刪掉了,無效的數據卻留了下來。”嚴軍說道。
但是,這種既懂業務又懂技術復合型人才無論在哪個行業都是可遇不可求的。對于企業而言,解決辦法無非兩種,一種是在外積累人才資源,另一種是在內培養復合型人才。
對于嚴軍個人而言,他曾先后在天津證券、渤海證券、博時基金、信達澳銀基金等金融機構長期從事與IT、運營、互聯網銷售等相關的工作,擁有業務和技術的雙重視角。他表示 ,這些經歷對于他后續的人才資源積累起到了非常重要的作用,他認為,技術人員必須要走出企業,在專業領域多交流、多學習,只有這樣,才能遇見更多優秀專業的人才。
針對內部人才培養,需要公司具備一定的戰略目標,比如將部分IT人員下沉到業務部門,跟業務部門共同學習。同時,人才激勵制度的設定也不可忽視。比如,傳統IT人員的工作職責可能僅局限在于技術層面,業績考核和激勵也多以此為標準。然而公司要想進行數字化轉型,那么IT人員的工作職責不可避免將會拓展,在這個過程中,第一,在于明確考核、激勵的權責界定,給到人才更好的動力;第二,與業務部形成聯動機制,共同培養復合型人才。
第二步:數據分類,從業務出發基于關系圖譜找到“關鍵數據”
如果說數據清洗的目的是設計好樓盤地基,這是必不可少的基礎工作;那么數據分類的目的便在于第一層要建什么,是有選擇性的戰略部署。
嚴軍說,數據分類的目的在于讓大量的數據集群化、條理化,從而更好的賦能公司業務。但是,不同維度各有價值,如何選擇一個維度對數據進行分類需要考慮數據分類的目的。
通常而言,首先,基于技術角度,需要考慮數據會用來干什么,例如基礎查詢、建模分析、還是應用于未來人工智能算法中。其次,基于未來發展,需要考慮數據的處理方式,例如原始數據是否會改變、是否會融合產生新數據等情況。若原始數據不會改變,那么數據分級的粒度可以適量大一些;如果以后還好融合產生新的數據,那么數據的分級粒度應當更細致一些,避免數據融合分析過程中,無法拆分數據。
傳統的數據分類是從技術角度出發,再考慮未來業務發展變化。但是,面對的是越來越復雜的業務邏輯,如果先從技術角度進行數據分類,不可避免的會遇到數據分級不合理等問題。九泰基金的做法是從業務視角出發,先簡單做歸類,比如來自于銷售系統肯定就是銷售數據,來自投資系統肯定就是投資數據,以此類推。
“但是,它們之間也不是完全割裂開的,因為有些關鍵基礎數據是一樣的,比如客戶的基本信息,這些數據在不同業務系統中都會有;再比如投資收益數據,它可能對銷售和投資都有指導作用。所以,針對這些錯綜復雜的數據維度,不能簡單地說就它屬于哪一類,需要一個‘數據字典’,基于‘數據聯絡圖’,找出它們的潛在關系,最后呈現給前端數據使用者的,是一個串聯的關系圖譜。”
第三步:數據分析,可以參考但不能盲目依賴
在擁有大量數據的基礎上,分析好關鍵數據,讓數據產生價值,這才是關鍵所在。
但是很多企業表示數據利用率并不高,核心問題在于——數據量夠不夠、數據清洗和數據分類是否做好、數據維度是不是豐富。“首先,基金公司的目標,應該是讓自己所有持有人、客戶都在自己平臺上留下你所需要的信息,這是基礎中的基礎。”
其次,在這個過程中有沒有形成統一的數據標準和體系,也會影響數據分析結果。比如說,不同系統對數據的分類維度和標簽不統一,就可能出現數據提取有遺漏導致分析結果不準確的情況,或者不同系統間數據不匹配,就會造成數據分析人員不知道以哪套體系為參照。
“另外,在這個過程中,企業通常還會遇到很多非常具體的情況。”嚴軍表示,“例如我們通常會判斷一個用戶使用的手機號歸屬地就是他的所在地,基于這個共識去做分析。但是,不能排除有人用的是老家的手機號,但長期在外地工作但情況,這時候數據分析出來的結果就是不準確的。
也就是說,即便基于非常扎實的數據準備工作,數據質量非常高、數據體系非常完善,但是數據分析的結果也只能作為一種參考,不能絕對地去依賴它。
除此之外,用好AI也能幫助基金公司達到數據分析的目的。舉例來說,基金行業最早應用AI的場景就是量化交易,即從不同市場中挖掘投資機會,對海量的交易數據進行分析,制定和優化投資策略和策略組合。
在嚴軍看來,量化交易給予了基金公司業務發展的全新邏輯。在傳統基金交易中,判斷投資影響因素的主要是人,人通過數據分析得出最佳的投資解決方案。但是在量化交易中,分析因子、更換因子,是一瞬間的事情。極端情況下數十、乃至于數百個因子在實時變化,人不可能在變化的一瞬間作出及時應對,而AI則可以通過學習的方式,知道哪些因子是有效的,哪些因子是無效的,何時應該刪除無效因子,何時應該加入新的有效因子。
量化分析固然有優勢,但是它的進入門檻很高,要做好很難,在中國仍屬于小眾業務。
首先,市場可以提供的相關復合型人才有限。普通的“金融+技術”復合型人才既要有基礎的編程技術、軟件技術,又要有一定的金融知識,這樣的人才在市場上已經是少數。而量化分析人才最重要的是要有強大的數理分析能力,幫助計算以及數據收集分析,對市場進行預測和風險估價。
其次,量化投資的投入成本很高,涉及到強大的計算機算力以及數據支撐體系,如:收集大量的數據、建立準確的數據模型、進行多角度數據分析挖掘有效的因子、優化迭代交易系統。
所以,量化分析需要的是一個完整的生態,人才和技術同樣重要。
不過,基金的量化分析雖然難,但嚴軍認為,只有差異化才能夠在基金行業中形成競爭力。所以,九泰基金一直將量化投資作為公司一個重要發展方向,并且通過人才和技術升級,基于海量關鍵數據,以“人才+技術+數據”共同帶動量化分析業務發展。如今,在寬基指數、SMART貝塔、量化對沖絕對收益型產品等領域,九泰基金正在探索逐步打開量化產品布局。