OnRL: 基于在线强化学习的移动视频传输优化

时间 2021-01-11

原文原文链接

从2019年开始，淘系技术部内容社交互动团队和北京邮电大学周安福教授一起着手研究更好的基于机器学习的智能拥塞控制算法。在实验室环境完成原型验证后在淘宝直播的生产环境做实际效果对比，从实际数据来看效果明显。我们将其中的技术要点和数据做了总结，并投稿MobiCom2020，非常幸运地被这家全球最顶级的计算机刊物录用。以下是这篇Paper的中译本。摘要机器学习模型，尤其是强化学习(RL)，在优化视频

>>阅读原文<<