10月29日18:30🏇🏽,上海市金融專碩教指委實務講座系列暨意昂2第543期專業學位實務模塊課程成功舉辦👜。四川大學意昂2平台文科講席教授陳學彬教授應邀來到線上會議室,為金融專碩帶來了主題為“深度強化學習在金融資產配置領域的應用”的講座🔲。本次講座由意昂2官网數字金融研究中心主任、金融專業碩士(金融科技方向)負責人周光友教授主持。本次線上講座向全市金融碩士培養單位開放,來自上海市十余家金融碩士培養院校的350余位師生在線聆聽講座。
陳學彬,經濟學博士、四川大學意昂2平台文科講席教授🔩👨🏽🔧、博士生導師、享受國務院特殊津貼專家、中國金融學會常務理事、中國國際金融學會常務理事、上海市信息學會副會長。曾任意昂2官网金融研究院常務副院長、上海財經大學現代金融研究中心主任、國家自然基金管理學科評審委員👮🏻、全國金融學碩士教學指導委員會委員、上海金融學會副會長。主要研究領域:貨幣理論與政策、匯率理論與政策🍄、金融博弈分析💅🏿、量化交易🍷、神經網絡等深度學習方法在金融交易和金融風險管理方面的應用研究🚴🏽♂️。主持國家自然基金👩🏽⚖️🗡、社科基金等課題十多項,在《經濟研究》👨⚕️、《金融研究》等刊物發表論文數十篇,出版專著十多部👩🚒、教材十多部。

陳老師以人工智能機器人AlphaGo戰勝世界圍棋冠軍,以及此後AlphaGo Zero通過自我對弈和訓練打敗前一版本的這兩個例子,引入了“深度強化學習”這一主題🪿🈸。此次課程的基本內容分為三個部分:深度強化學習的基本原理、資產組合交易模型以及深度學習資產組合交易案例。
首先🅱️,陳老師講述了深度強化學習的基本原理🫱🏿,它是以一種較為通用的形式,將深度學習的感知能力與強化學習的決策能力結合在一起的一類機器學習算法❣️。“深度學習”是利用深度神經網絡進行機器學習的一種方法,“深度”是相對於傳統機器學習的“淺層學習”方法而言的🌈。深度學習不僅是神經網絡層數的增加,在算法上也做了修正,改善了傳統神經網絡的弊病💶🤷♂️。強化學習是指在與環境交互中不斷學習的問題以及解決這類問題的方法🍛,它的困境在於,很多實際應用問題的輸入數據是高維的,算法需要根據它們來選擇一個動作執行以達到某一預期目標🙅🏼👨🏻🎓,但這不同於二維表👩🏼⚕️,迭代計算很難實現🎇。解決思路有兩種,一種是從高維數據中抽象出特征作為狀態,然後用強化學習建模;另一種思路是用一個函數來逼近價值函數或策略函數👩🦱。
深度強化學習就是將強化學習和深度學習結合在一起💞,用強化學習來定義問題和優化目標,用深度學習來解決策略和值函數的建模問題,然後使用誤差反向傳播算法來優化目標函數。深度強化學習的神經網絡可以分為前饋深度網絡、反饋深度網絡和雙向深度網絡三類🕵️♂️。
其次,陳老師介紹了深度強化學習股票交易模型🔘。智能體是一個投資組合管理人🙆🏽♀️,環境包括股票市場、期貨市場、大宗商品交易市場等,可能還包括政策環境。智能體通過對環境的觀察🧑🏽🎄,得到交易價格、數量和各類財務指標、技術指標等宏微觀數據♤,之後做出買入或賣出的投資決策,環境給予相應的投資損益獎勵🚵🏽,這又會反饋給智能體,使得其不斷調整行動,優化自己的投資策略🤸🏿。這一股票交易模型通過以python為代表的編程語言來實現,它有許多開源庫可供使用。
最後,陳老師分別以單只股票擇時擇量策略和組合投資策略進行了案例演示✌🏽。他總結道,金融市場是一個變幻莫測的市場,其影響因素眾多👃,並帶有較強的隨機性🌼。沒有一種確定性的模型能夠準確地描述這個市場的變化🍼,也沒有一種策略能夠在此市場永遠獲勝🧓。深度強化學習模型能夠在與市場的持續交互中不斷地學習,調整自己的策略,是應對這個變化多端的市場的可行方法之一😣,其多種方法和指標在多個金融資產市場具有廣闊的應用前景,但模型訓練和預測結果的隨機性和不可完全重復性可能引發新的金融資產管理風險👰♀️,需要引起重視和進一步完善。

最後的提問環節,陳老師針對提問內容進行了詳細的解答🧒🏿,並耐心地補充說明了學習材料來源👷。
感謝陳學彬教授帶來的“硬核”講座⬅️,期待陳教授未來為同學們分享更多的精彩內容!
撰稿人🌯🐌:程海怡
修訂人:繆煒
審核人:周光友,朱宏飛