可变奖励

可变奖励（或不可预测的奖励或可变程序的奖励）是一种间歇性提供的奖励。强化程序的设计通常是为了使行为最大化。可变比率程序可以在不可预测的反应次数后提供强化物（例如，以 1:4 的平均比例）。可变时距程序会使用不可预测的间隔（例如，平均为 60 秒）。关于可变奖励的力量，一个流行的例子是对赌博的成瘾。该领域的开创性研究是由 B.F. Skinner 进行的。

另见：

预防成瘾的奖励多样性^[1]：如何避免可变奖励的消极影响
游戏障碍^[2]：可变奖励如何导致游戏成瘾、

Thoughts Memo 汉化组译制
题图：#百合イラコン汗っかきの君 - ふめ〜的插画 - pixiv
原文：Variable reward - supermemo.guru

参考

多样奖励对于预防上瘾的作用http://zhuanlan.zhihu.com/p/490001254
游戏障碍http://zhuanlan.zhihu.com/p/487955131

@Thoughts Memo

参考

专栏：认知基石 & 教育培训