ENGLISH 集团主站 加入收藏
当前位置: 首 页 > 学术科研 > 讲座报告 > 正文

讲座 | 智能管理交叉学科系列讲座(第十九期)

发布时间:2023-11-08来源:12BET 浏览次数:

讲座题目:《Data-driven Convex Policy Optimization in an Assemble-to-order System》

主讲嘉宾:邓天虎 副教授

讲座主持:陈俊霖副教授

讲座时间:2023年11月8日(星期三)15:00-16:00

讲座地点:沙河校区 学院4号楼106

讲座摘要:This paper investigates the optimization of periodic-review assemble-to-order (ATO) production systems with multiple products assembled from multiple components, under the data-driven setting where only historical demand data is available and demand distributions are unknown. To address this challenge, we propose a semi-model-based fitted Q iteration (S-FQI) algorithm framework that leverages the known transition dynamics. We provide a proof of the statistical convergence rate of the proposed algorithm concerning the number of iterations, the number of demand samples, and the number of generated trajectories.

嘉宾简介:

邓天虎,清华大学,副教授,博士生导师,博士毕业于美国加州大学伯克利分校。目前研究方向侧重智慧供应链。以第一作者和通讯作者在Operations Research、Manufacturing & Service Operations Management等国际高水平学术期刊和学术会议发表论文30余篇。主持国家自然科学基金优秀青年基金、科技部国家重点研发计划子课题等项目多项,负责执行的中石油天然气管网优化项目入围INFORMS设立的管理科学应用界最高奖项弗兰茨·厄德曼奖 (Franz Edelman Award)2018年决赛。

主办单位:12BET