怎样用神经网络解决Q-learning的问题
参考DQN
■网友
我觉得可以把(state,action) pair输入,输出一个Q(state,action) 但这样要算出在这个state 所有action的Q(state,action)要算N次, N是action的个数也可以只把state 当做输入,让神经网络的输出个数是N,这样只要过一遍神经网络就可以得到所有的action 的Q。具体可以参考http://outlace.com/Reinforcement-Learning-Part-3/
推荐阅读
- 聪明人养花,这3种“花”怎样也要养一盆,每年能省不少医药费
- 蟹爪兰叶子软塌,难复花,“根源”在这里,解决后开花一茬接一茬
- 贵州在建骨干水源工程达到465座有效解决工程性区域性缺水问题
- 长春社区开设助老餐厅探索解决老人“吃饭难”
- 互联网怎样解决“家政服务上门速度慢”的问题
- 怎样看待从1月8号起,QQ钱包开始提现收费
- 银行it人怎样转型
- 汽车|冬天怎样让车内温度快速升高?座椅加热的最佳使用方式二,外循环的作用总结
- 怎样进入通信行业
- 怎样评价扶他柠檬茶的小说《云养汉》的结尾