为在线强化学习 (Online Reinforcement Learning) 智能体提供特征服务,本质上是一个在数据一致性、时效性和可复现性之间寻求平衡的架构难题。智能体需要在几十毫秒内获取当前状态的最新特征以做出决策,而训练和审计流程则
2023-10-27