分享人:马帅
地点:经管中楼307
主办方:经济与管理学院
开始时间:2026年01月22日 9:00
结束时间:2026年01月22日 9:30
学习交流主题:风险敏感马尔可夫决策过程。
交流内容简介:聚焦于马尔可夫决策过程(MDP)框架下针对一系列风险敏感优化准则(如方差、夏普率、Shannon熵率等)的动态规划理论研究。重点围绕风险准则不满足 Bellman 最优方程的核心瓶颈,分享在该领域构建的 “理论突破 - 算法创新” 研究体系及标志性成果,包括平均/折扣均值-方差优化中基于Bellman 局部最优方程构建两类动态规划迭代优化算法、平均/折扣均值-方差全局最优动态规划优化算法、熵率/折扣熵优化中结合凸优化的动态规划迭代算法、夏普率优化中基于动态规划的优化算法等原创性进展,阐述后续拟深化的理论完善目标、算法高效求解等核心科学技术难题,以及对应的研究推进思路,为该领域理论与算法创新提供学术交流借鉴。
分享人简介:辽宁沈阳人,博士,助理研究员。现任北京启元实验室验证评估中心研究员。主持省部级项目2项、横向项目1项。以第一作者/通讯作者在《Mathematics of Operations Research》、《European Journal of Operational Research》、《AAAI Conference on Artificial Intelligence》等数学/运筹学/人工智能领域内的国内外权威刊/会议发表学术论文十余篇。担任《IEEE Transactions on Automatic Control》、《Discrete Event Dynamic Systems》、《IEEE Control Systems Letters》、《IEEE Transactions on Systems, Man, and Cybernetics》、《IEEE Transactions on Automation Science and Engineering》、《IEEE Conference on Decision and Control》等十余个期刊/会议的同行评议专家。