斯金纳盒子的实验内容。

斯金纳关于操作性条件反射的实验是在他设计的动物实验仪器——著名的斯金纳盒子中进行的。在盒子里放一只白老鼠或鸽子,设置一个杠杆或钥匙。盒子的结构尽可能地排除了所有的外界刺激。动物可以在盒子里自由活动。当它按下杠杆或啄钥匙时,一团食物就会掉到盒子下面的盘子里,动物就可以吃到食物了。盒子外面有一个记录动物活动的装置。斯金纳实验和巴甫洛夫条件反射实验的区别在于(1)斯金纳盒子里的动物可以自由活动,而不是被绑在架子上;(2)受试动物的反应不是由已知刺激引起的,操作行为(按杠杆或啄键)是获得增强刺激(食物)的手段;(3)反应不是唾液腺活动,而是骨骼肌活动;(4)实验的目的不是揭示大脑皮层活动的规律,而是展示刺激与反应的关系,从而有效地控制生物体的行为。

操作条件作用的概念是斯金纳新行为主义学习理论的核心。斯金纳把行为分为两类:一类是反应性行为,是由已知刺激引起的反应;另一类是操作行为,是生物体自身的反应,与任何已知的刺激无关。与这两种行为相对应,斯金纳把条件反射分为两类。与反应行为相对应的是反应反射,称为S(刺激)型(S型的名称来源于英语刺激);与操作行为相对应的是操作反射,称为R(反应)型(R型名称来源于英文Reaction)。s型条件反射与强化和刺激直接相关,R型条件反射与强化和反应直接相关。斯金纳认为,人的行为主要是由操作性反思构成的操作性行为,操作性行为是作用于环境并产生结果的行为。在学习情境中,操作行为更具代表性。斯金纳非常重视R条件反射,因为它可以塑造新的行为,这在学习过程中尤为重要。

实验1:把一只饥饿的老鼠放进一个有按钮的盒子里,每按一次按钮,就掉一口食物。

结果:小鼠自发学会按按钮。

这个实验比巴甫洛夫的“敲钟喂狗”实验更进了一步,确立了行为。

什么是学习?它意味着在行为和操作者的需求之间建立一种依赖关系。换句话说,让行为人觉得“行为”和“回报”是有关联的。

只要把行为和奖励重复、挂钩,就可以培养出经营者的行为模式。

奖励可以培养行为习惯,是不是很棒?然后看实验二。

2.行为与惩罚

实验二:把鼠标放在一个有按钮的盒子里。每次鼠标没按下按钮,盒子就通电了。

结果:小鼠学会了按按钮。

但遗憾的是,一旦盒子不再通电,鼠标按下按钮的行为很快就消失了。

“惩罚”,作为对邪恶双胞胎的奖励,可以快速建立行为模式。但是,惩罚有一定的副作用:它建立的行为模式来的快去的也快。一旦惩罚消失,行为模式也会很快消失。

从长远来看,惩罚不会对阻止行为起到显著作用。现实生活中,惩罚带来的凡勃伦效应有时甚至会让惩罚适得其反。

凡勃伦效应:美国学者范布伦认为,与产品价格下降、需求增加的一般规律不同,特定产品价格上升,需求增加。一些上层人士的消费目的是炫耀自己的社会地位和成功,满足虚荣心,所以价格越高,需求就越高。反之,如果降低价格,反映上层阶级的界限就会变得模糊,所以需求就会减少。

要想控制行为人不去做某个行为,就要找到错误行为的“奖励”,把奖励去掉,从而制止他的错误行为。

然而,即使是奖励,当食物不再掉落时,老鼠的学习行为也会逐渐消失(虽然很慢)。而且是浪费粮食!那么我们该怎么办呢?

接下来是实验三。

3.固定时间奖励

实验三:把一只饥饿的老鼠放进剥皮盒,食物从开始的每1分钟掉一次。按下按钮放下食物。

结果:鼠标一开始没有停止按键。过了一段时间,老鼠学会了每1分钟按一次按钮。

当掉落的食物停止时,老鼠的行为就消失了。

啧啧,失败了。而不是训练鼠标持续按键,让鼠标变得“懒惰”。为什么?因为行为人知道该行为短期内不会得到回报。.....好吧。最关键的实验4。

4.概率奖励

实验四:把一只饥饿的老鼠放进一个剥皮器盒子里,按几次按钮,食物就会掉下来。

结果:老鼠学会了一直按按钮。

当食物不再掉落时,老鼠的学习行为消失得非常慢。

随着概率越来越低,老鼠的学习行为不变。直到鼠标按键40-60次掉落一个食物,鼠标还是会长时间保持按键。

(同样,在用鸽子做的实验中,不同时间间隔的鸽子每秒可以做出2-3次反应,连续反应持续15小时。)

这个实验模拟了为什么“赌博”——比如简单的老虎机或者更复杂的赌博——会给人类一种依赖感,或者说上瘾。

由于给出结果的概率,行为人很难直观判断该机制是否失效,因此单次失效不会给出明显的“惩罚”效果,终止行为人的习惯,从而使行为人的学习行为得以继续。

然后是一个有趣的实验5。

5.迷信老鼠?

实验5:嗯,其实实验5还是实验4,概率性斯金纳盒子。

结果:这些老鼠中有许多养成了奇怪的行为习惯,比如撞盒子、鞠躬、转圈跳舞。

这是因为老鼠在掉落食物前只是在做这些行为,所以有一种“迷信”。

游戏中流传的很多谣言,比如“中午抽奖很容易中大奖”或者“装满幸运兔脚的背包可以获得更好的装备”,都有同样的道理。