深度强化学习与直播购物
【学术成果】直播购物时,平台如何精准发放折扣券?市场学研究实验室团队中来自纽约大学的刘晓副教授使用深度强化学习方法(Deep Reinforcement Learning),将直播情境下平台消费折扣券系列发放过程视为一个奖励函数未知的强化学习问题,并利用Batch Constrained Q-Leaning和深度神经网络(Deep Neural Networks)方法学习出最优策略,并利用实地检验(Field Experiment)检验了该策略相比于传统随机发放、不考虑跨期的个性化发放、基于结构模型的动态方法的优势。