IT亚文化

    最近更新

    您现在的位置: 首页 > 汇通盛世商品交易中心 基于⽣成式对抗⽹络的⽅法

    汇通盛世商品交易中心 基于⽣成式对抗⽹络的⽅法

    作者:  来源:  时间:2021-10-14 14:03:49  阅读:
    汇通盛世商品交易中心 基于⽣成式对抗⽹络的⽅法

    GAIL是⼀种基于⽣成式对抗⽹络的⽅法,与各种使⽤⽣成式对抗⽹络的⽅法相似,它也会构建⼀个⽣成器G和⼀个判别器D,在这之中并让⼆者不断进⾏博弈并交替进⾏更新。在GAIL中,判别器D是⼀个⼆分类器,通常是⼀个深度神经⽹络,它的输⼊是状态-动作对(s,a),输出则是⼀个(0,1)区间内的概率值,代表输⼊的状态-动作对由⼈类⽣成的概率。和⼀般的⼆分类任务相似的,每轮训练中我们可以可以简单的通过最⼩化交叉熵损失函数。接着对D进⾏更新。