怎样用神经网络解决Q-learning的问题参考DQN","re

参考DQN
■网友
我觉得可以把(state,action) pair输入，输出一个Q(state,action) 但这样要算出在这个state 所有action的Q(state,action)要算N次, N是action的个数也可以只把state 当做输入，让神经网络的输出个数是N，这样只要过一遍神经网络就可以得到所有的action 的Q。具体可以参考http://outlace.com/Reinforcement-Learning-Part-3/

怎样用神经网络解决Q-learning的问题

推荐阅读

董洁|她38岁成“武林盟主”，今穿黄色针织衫娇嫩可爱，美回颜值巅峰

李登辉|李登辉办公室主任声明：其病情由荣民总医院以新闻稿对外公开

作业帮直播课入选《人民日报》科技战疫数字化转型成功案例

曾经的霸主诺基亚陨落，苹果却突破两万亿，有些选择决定了结局

经济观察报|挖掘十万亿增值服务市场，碧桂园服务李长江：输出数字化能力

「周星驰」周星驰唯一的恐怖片，也是票房最惨的一部电影，多数人没看过

每年来粤工作港澳人员超20万人次

张飞在长坂坡,吓死谁-?张飞在长坂坡吼了什么

弄潮中国茶包装行业,访河南信阳云龙包装

长两米！白云湖现不明鱼类疑似外来物种鳄雀鳝

江苏镇江必打卡的景点镇江一日游

投资|浙江广厦：2020年前三季度净利润约1126万元，同比下降99.06%

投影时代■柔宇推出新型可折叠OLED显示器

新华网客户端|呼吁疫情后改革安理会，日本外务大臣声称日本已准备好“入常”

【拜佛过人|姚明为何职业生涯如此短暂？老搭档麦迪一针见血指出真因】

广州日报|广州生产安全事故起数死亡人数连续18年下降

翡翠|一颗小小的翡翠珠子，这拥有昂贵的价格，主要就是因为太难做

鸡蛋清美容方法蛋清美容

「世界卫生组织」新冠病毒是人为制造？这次终于有了结果，世卫组织给出了真正答案

美食工坊美食界的最佳搭档，除了火腿泡面，还有这4对“神仙组合”