一種基于K-mediods改進BIRCH的大數(shù)據(jù)聚類方法——以證券客戶大數(shù)據(jù)為例.pdf_第1頁
已閱讀1頁,還剩80頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、伴隨著信息科技、互聯(lián)網、云計算、物聯(lián)網、社交網絡、智能終端等技術的高速發(fā)展,海量數(shù)據(jù)已圍繞在人們身邊,這就是“大數(shù)據(jù)”時代。人們不只是數(shù)據(jù)的生產者,同時也是數(shù)據(jù)的受惠者;人們不是只能被動地接受數(shù)據(jù)和科技,人們能改變科技在生活中所扮演的角色,同時也能改變享受數(shù)據(jù)帶來的恩惠方式。金融行業(yè)天生擁有大量的數(shù)據(jù),“金融大數(shù)據(jù)”起源于金融的信息化。大量傳統(tǒng)金融行業(yè)的數(shù)據(jù)是為了業(yè)務而存在,其本身不具備資產屬性。在“大數(shù)據(jù)”時代,多元化、多樣化的數(shù)據(jù)已

2、發(fā)生本質性改變,數(shù)據(jù)不僅僅是業(yè)務信息化的產物,數(shù)據(jù)也是資產。金融企業(yè)可以通過海量數(shù)據(jù)建立全面的風險管理機制,可以通過海量數(shù)據(jù)實現(xiàn)精細化管理,也可以通過海量數(shù)據(jù)改善客戶服務質量,提升企業(yè)競爭力。
  隨著我國證券市場的發(fā)展,證券企業(yè)不斷涌現(xiàn),導致了證券企業(yè)之間相互競爭客戶資源的現(xiàn)象。而我國證券市場也逐步由一個“買方”市場逐步轉入到了一個“賣方”市場,證券企業(yè)的競爭已開始由新增客戶,漸行轉向如何穩(wěn)定存量客戶的戰(zhàn)略性思考。如何從客戶角度

3、思考服務問題是一次大挑戰(zhàn)。證券企業(yè)不是“替”客戶賺更多的錢,而是幫助客戶提高收益率?;氐娇蛻絷P系管理的本質,證券企業(yè)所有的一切都應該圍繞著如何幫助客戶提升盈利水平而工作。
  本文以多樣化、多類化、多層次化的客戶聚類、客戶細分為切入點,為證券企業(yè)對客戶適當性服務與分類管理提供技術支持。
  首先,本文提出了一種適用于大數(shù)據(jù)集的組合聚類方法:BIRCH.K-mediods方法。BIRCH.K-mediods方法是BIRCH方法

4、的衍生,是基于K-mediods聚類對BIRCH方法的改進。BIRCH方法具有抗異常數(shù)據(jù)干擾性、可伸縮性、可增量性、高效性等特點,其通過構建 CF(聚類特征)樹層次,可在較小信息丟失的前提下實現(xiàn)對數(shù)據(jù)的壓縮。再用K-mediods聚類方法對CF樹結構進行聚類,進一步提升聚類方法的抗異性、準確性和穩(wěn)定性。
  其次,本文針對證券交易記錄數(shù)據(jù),從風險偏好、風險承受能力、交易習慣和資金流動性四個方面,構建了換手率、持倉率、止盈點、止損點

5、、持股時長、資金流動性等的特征提取算法。在算法中,用較為穩(wěn)健的統(tǒng)計量:中位數(shù)代替均值,提升特征提取過程中的抗異性,提高結果的準確率和可信度。
  最后,本文通過 BIRCH.K-mediods方法和穩(wěn)健的特征提取算法對某證券企業(yè)662位客戶10年來的近200萬余條交易記錄進行客戶聚類,并甄別出風險性、關注度、價值性、成熟性等屬性交互的六類客戶,實現(xiàn)多樣化、多類化、多層次化的客戶分類。
  本文提出的BIRCH.K-medio

6、ds方法滿足“大數(shù)據(jù)”時代對聚類方法的抗異常數(shù)據(jù)干擾、可伸縮性、可增量性、高效性、穩(wěn)定性等上的要求,其可謂是適用于“大數(shù)據(jù)”時代的有效聚類方法之一。通過證券交易記錄數(shù)據(jù)提取出可描述客戶多方面狀態(tài)的動態(tài)屬性,可增加證券企業(yè)對客戶的識別和刻畫能力。并根據(jù)這些動態(tài)屬性進行聚類,其結果可為證券企業(yè)探求不同客戶的、最具偏好的針對性需求作支撐。本文不僅細化了解客戶屬性,還充分了解客戶的風險承受能力,這既符合監(jiān)管部門的管理要求,又是適當性服務的前提之

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論