IT亚文化

    最近更新

    您现在的位置: 首页 > 新疆中亚商品交易中心 能够模仿⼈类的AI策略

    新疆中亚商品交易中心 能够模仿⼈类的AI策略

    作者:  来源:  时间:2021-10-14 10:48:47  阅读:
    新疆中亚商品交易中心 能够模仿⼈类的AI策略

    根据我们之前对性质的描述,在这个任务上表现最好的⾏为策略就是⼈类策略 ,即:
    通过这种⽅式,我们就得到了⼀个能够模仿⼈类的AI策略。
    逆强化学习虽然能够解决⾏为克隆中存在累积误差的问题,但它本身也存在诸多问题,⽐如逆强化学习假设⼈类总是做出最优的选择,这个假设通常在模仿⼈类⼈类的问题中显得过强了。
    此外,逆强化学习问题本身并不是⼀个良定义的问题,通常有多个可能的奖赏函数能够满⾜要求,例如对任意状态-动作对都给出0值的平凡奖励函数可以成为任意逆强化学习的解。