可变奖励

学校≠教育≠技能;文凭溢价=80%信号传递+20%人力资本

11 👍 / 6 💬

可变奖励(或不可预测的奖励可变程序的奖励)是一种间歇性提供的奖励。强化程序的设计通常是为了使行为最大化。可变比率程序可以在不可预测的反应次数后提供强化物(例如,以 1:4 的平均比例)。可变时距程序会使用不可预测的间隔(例如,平均为 60 秒)。关于可变奖励的力量,一个流行的例子是对赌博的成瘾。该领域的开创性研究是由 B.F. Skinner 进行的。

另见:

Thoughts Memo 汉化组译制
题图: #百合イラコン 汗っかきの君 - ふめ〜的插画 - pixiv
原文: Variable reward - supermemo.guru

参考

  1. 多样奖励对于预防上瘾的作用 http://zhuanlan.zhihu.com/p/490001254
  2. 游戏障碍 http://zhuanlan.zhihu.com/p/487955131

专栏:认知基石 & 学校教育