說到人工智能,大多會聯想到聊天機器人、人臉識別、無人駕駛,但人工智能的應用絕不僅只是停留在這些具象的前沿應用場景上,就金融領域而言,人工智能還可以通過深度學習技術幫助金融機構進行反欺詐以及降低信用風險。
欺詐一直以來都是銀行業的主要風險之一。銀行零售業務反欺詐的本質是對實施欺詐人員進行偽造身份、聯系方式、設備信息、資產信息等虛假信息的識別。傳統銀行擁有上億萬級的信息數據庫,但由于缺乏有效的科技手段,傳統規則的經驗式反欺詐模型已無法應對日益演進的欺詐模式和欺詐技術。
傳統銀行反欺詐模型的局限
銀行經過多年歷史數據沉淀,擁有大量的歷史違約和欺詐數據,是反欺詐的重點聚焦領域。但對傳統銀行來說,一些傳統的反欺詐手段,無論在效率、有效性、全面性以及成本上都是銀行的短板,尤其隨著互聯網金融的興起,非現場交易增多,更是加劇了銀行風險防控的難度。
“小眾的欺詐事件越來越難以用商業經驗和確切規則描述出來,國內目前的欺詐都是rule base(規則驅動)的,即憑借過往經驗和從此前發生過的事實中,抽象出系列規則,每一條規則觸發一種欺詐場景,交叉組合所施加的業務邏輯判斷,就構成了欺詐模型,”天云大數據CEO雷濤在接受第一財經采訪時表示。
“但在這個過程中,傳統規則的模型就會帶來很多問題,”雷濤表示,“申請欺詐就很難將一些難以描述的規則抽象出來。”
例如,團伙在某村莊以招工的名義大量收取村民的身份證,并申請信用卡,然后刷卡透支,讓村民背負銀行債務。此時,銀行按照過往經驗便會判定該村地址為欺詐地址,使該村村民抹上信用污點,然而事實并非如此。因此,對于抽象的、難以描述的金融現象,便可以借助機器處理。
作為人工智能最重要的技術——機器的深度學習,其最大價值就是能夠做特征表達,通過一個數學的復雜結構來表達一些以往很難描述的金融現象,因此特別適合處理風險、欺詐以及金融產品的營銷這些依靠過往經驗難以準確定量的事件。
深度學習在金融領域本質上還是進行特征提取和問題描述,因為在整個金融鏈條上,包括借貸、個人理財、等多種金融產品和服務上,數據都起著核心作用,尤其是銀行,擁有著上億規模的標注數據。“機器的深度學習可以將這些數據通過特征表達的方式轉化到復雜的數據模型上,并依靠深層的神經網絡,生成多層非線性的表達,這種表達可以代替原先的簡單描述,”雷濤稱。“例如Alpha go,就是利用深層的神經網絡解決了對棋手棋風的描述和棋手大局觀的定義問題,從而使之戰勝世界級冠軍。”
事實上,國內目前將人工智能的深度學習技術與銀行反欺詐相結合的應用還比較少,一些征信類公司開始通過提供豐富的外部數據資源來為銀行提供反欺詐技術支持。例如前海征信研發部門基于Encoder-Decoder深度學習技術框架設計的智能風控專家機器人,可以應用于銀行業風控反欺詐領域,解釋貸款產品特性、借款人風險識別、貸款產品政策等各類問題,高效智能地服務信貸審批、貸后風控管理和資產組合經理,提升信貸產品審批速度,降低客戶違約率,防范貸款欺詐風險。
同時,一些金融科技企業也正在與銀行合作。例如天云大數據近期就利用其模型算法訓練平臺(MaximAI)為光大銀行提供反欺詐方面的技術支持。基于樣本數據進行一站式的模型算法訓練、驗證以及輸出。訓練完成的模型算法程序,被輸出到欺詐分析引擎中,運行于大數據平臺技術上,實現了實時在線對交易數據進行欺詐識別。
然而,目前在銀行反欺詐方面中國與北美的差距還是很大的,硅谷的金融科技創業公司很早就將這一技術應用到金融反欺詐中。例如,京東和百度同時投資的美國金融科技公司Zest Finance,便是利用機器的深度學習這一人工智能中最重要的技術手段,從大量的數據中提取變量并采用多個預測分析模型包括欺詐模型、預付能力模型來幫助用戶降低信貸成本,其核心競爭力便是數據挖掘能力和模型開發能力。
機器深度學習提升反欺詐能力
利用機器的深度學習技術反欺詐的原理,實際上是從銀行反欺詐的脆弱點著手,不再只通過傳統策略引擎,而是通過機器收集到大量異構、多源化的信息,包括可交叉驗證信息主體所提供的信息以及第三方信息來源的真實性,形成共享庫。通過對數據的采集和分析,再通過機器學習及復雜網絡等模型算法技術,對數據進行深度挖掘,從傳統歷史數據中量化抽取風險特征指標,利用復雜網絡關聯分析技術從歷史違約數據中發現實時欺詐業務風險指標,豐富深度學習風險模型的業務維度,建立人工智能反欺詐模型,從而發現欺詐者隱藏的蛛絲馬跡,分析其數據的矛盾點和可疑點,從而識別欺詐者身份,加上與傳統經驗規則配合使用,大幅提升銀行欺詐風險的防控能力。
欺詐分析所使用的數據主要來源內部數據和外部數據,針對不同的數據源,通過多種采集方式對數據進行有效采集,并集中在數據湖中進行融合存儲。根據預測模型分析的需求,通過配套的數據處理技術工具對數據進行預處理,最終輸出模型訓練所需的樣本數據。
就拿上述某村莊信用卡申請欺詐為例,銀行可以利用復雜網絡(Complex Network)技術,在不從外部引入新數據的情況下,抽取現有進件數據(application form)的關聯性,從每一個進件與進件的關聯中分辨出是否使用類似的電話號碼、類似的地址以及類似的區域,建立的社交關聯屬性與其他金融數據輸入深度學習網絡做有監督的訓練,在數十萬欺詐案例數據上得到一個動態識別模型。
去年10月,美國政府發布的《為人工智能的未來做好準備(Preparing for the Future of Atificial Intelligence)》報告稱,機器的深度學習是人工智能最重要的技術手段之一,同時也是人工智能取得很多進展和商業應用的基礎。該報告同時還提到,現代機器學習是一個始于大數據的統計學過程,通過數據分析推導出規則或者流程,用于解釋數據或者預測未來數據。
在金融科技領域,大型金融實體與Fintech企業的合作上具有獨到優勢,因其多年歷史沉淀下來的數據,不僅僅是行為數據,更有有價值的違約數據,與人工智能目前的發展階段非常匹配——即提供給機器“答案”的學習。
未來,隨著人工智能的逐步成熟,例如當下GAN對抗神經網絡等科技演進,讓機器自主選擇方法,我們不僅不再需要描述問題,或為提供答案而承擔昂貴的試錯成本,而是面向最終安全的反欺詐目標,由人工智能提供面向“目標”的學習。