斯金纳盒子的实验内容。
操作条件作用的概念是斯金纳新行为主义学习理论的核心。斯金纳把行为分为两类:一类是反应性行为,是由已知刺激引起的反应;另一类是操作行为,是生物体自身的反应,与任何已知的刺激无关。与这两种行为相对应,斯金纳把条件反射分为两类。与反应行为相对应的是反应反射,称为S(刺激)型(S型的名称来源于英语刺激);与操作行为相对应的是操作反射,称为R(反应)型(R型名称来源于英文Reaction)。s型条件反射与强化和刺激直接相关,R型条件反射与强化和反应直接相关。斯金纳认为,人的行为主要是由操作性反思构成的操作性行为,操作性行为是作用于环境并产生结果的行为。在学习情境中,操作行为更具代表性。斯金纳非常重视R条件反射,因为它可以塑造新的行为,这在学习过程中尤为重要。
实验1:把一只饥饿的老鼠放进一个有按钮的盒子里,每按一次按钮,就掉一口食物。
结果:小鼠自发学会按按钮。
这个实验比巴甫洛夫的“敲钟喂狗”实验更进了一步,确立了行为。
什么是学习?它意味着在行为和操作者的需求之间建立一种依赖关系。换句话说,让行为人觉得“行为”和“回报”是有关联的。
只要把行为和奖励重复、挂钩,就可以培养出经营者的行为模式。
奖励可以培养行为习惯,是不是很棒?然后看实验二。
2.行为与惩罚
实验二:把鼠标放在一个有按钮的盒子里。每次鼠标没按下按钮,盒子就通电了。
结果:小鼠学会了按按钮。
但遗憾的是,一旦盒子不再通电,鼠标按下按钮的行为很快就消失了。
“惩罚”,作为对邪恶双胞胎的奖励,可以快速建立行为模式。但是,惩罚有一定的副作用:它建立的行为模式来的快去的也快。一旦惩罚消失,行为模式也会很快消失。
从长远来看,惩罚不会对阻止行为起到显著作用。现实生活中,惩罚带来的凡勃伦效应有时甚至会让惩罚适得其反。
凡勃伦效应:美国学者范布伦认为,与产品价格下降、需求增加的一般规律不同,特定产品价格上升,需求增加。一些上层人士的消费目的是炫耀自己的社会地位和成功,满足虚荣心,所以价格越高,需求就越高。反之,如果降低价格,反映上层阶级的界限就会变得模糊,所以需求就会减少。
要想控制行为人不去做某个行为,就要找到错误行为的“奖励”,把奖励去掉,从而制止他的错误行为。
然而,即使是奖励,当食物不再掉落时,老鼠的学习行为也会逐渐消失(虽然很慢)。而且是浪费粮食!那么我们该怎么办呢?
接下来是实验三。
3.固定时间奖励
实验三:把一只饥饿的老鼠放进剥皮盒,食物从开始的每1分钟掉一次。按下按钮放下食物。
结果:鼠标一开始没有停止按键。过了一段时间,老鼠学会了每1分钟按一次按钮。
当掉落的食物停止时,老鼠的行为就消失了。
啧啧,失败了。而不是训练鼠标持续按键,让鼠标变得“懒惰”。为什么?因为行为人知道该行为短期内不会得到回报。.....好吧。最关键的实验4。
4.概率奖励
实验四:把一只饥饿的老鼠放进一个剥皮器盒子里,按几次按钮,食物就会掉下来。
结果:老鼠学会了一直按按钮。
当食物不再掉落时,老鼠的学习行为消失得非常慢。
随着概率越来越低,老鼠的学习行为不变。直到鼠标按键40-60次掉落一个食物,鼠标还是会长时间保持按键。
(同样,在用鸽子做的实验中,不同时间间隔的鸽子每秒可以做出2-3次反应,连续反应持续15小时。)
这个实验模拟了为什么“赌博”——比如简单的老虎机或者更复杂的赌博——会给人类一种依赖感,或者说上瘾。
由于给出结果的概率,行为人很难直观判断该机制是否失效,因此单次失效不会给出明显的“惩罚”效果,终止行为人的习惯,从而使行为人的学习行为得以继续。
然后是一个有趣的实验5。
5.迷信老鼠?
实验5:嗯,其实实验5还是实验4,概率性斯金纳盒子。
结果:这些老鼠中有许多养成了奇怪的行为习惯,比如撞盒子、鞠躬、转圈跳舞。
这是因为老鼠在掉落食物前只是在做这些行为,所以有一种“迷信”。
游戏中流传的很多谣言,比如“中午抽奖很容易中大奖”或者“装满幸运兔脚的背包可以获得更好的装备”,都有同样的道理。