任务详情
人才需求: 可以熟练使用python完成DQN或double DQN算法 需求描述: 1.有一段空调房间温度和机组能耗的计算代码(相当于强化学习的游戏环境,我已经用python搭建好了,具体需求可以线上沟通),可以通过外部环境参数和动作参数的输入,输出下一时刻的房间干球温度、房间相对湿度和十五分钟的设备总能耗。每日开始时的初始房间参数与室外相同。(即,通过四个逐时更新的环境参数和两个逐时更新的状态参数,输入两个动作参数,会得到两个新的状态参数,这两个新的状态参数和四个新的环境参数构成下一时刻新的状态) 2.通过对整个供冷季节的动作参数的输入学习,训练智能体double DQN模型