斯金纳盒子的实验内容。

斯金纳关于操作性条件反射的实验是在他设计的动物实验仪器——著名的斯金纳盒子中进行的。在盒子里放一只白老鼠或鸽子，设置一个杠杆或钥匙。盒子的结构尽可能地排除了所有的外界刺激。动物可以在盒子里自由活动。当它按下杠杆或啄钥匙时，一团食物就会掉到盒子下面的盘子里，动物就可以吃到食物了。盒子外面有一个记录动物活动的装置。斯金纳实验和巴甫洛夫条件反射实验的区别在于(1)斯金纳盒子里的动物可以自由活动，而不是被绑在架子上；(2)受试动物的反应不是由已知刺激引起的，操作行为(按杠杆或啄键)是获得增强刺激(食物)的手段；(3)反应不是唾液腺活动，而是骨骼肌活动；(4)实验的目的不是揭示大脑皮层活动的规律，而是展示刺激与反应的关系，从而有效地控制生物体的行为。

操作条件作用的概念是斯金纳新行为主义学习理论的核心。斯金纳把行为分为两类:一类是反应性行为，是由已知刺激引起的反应；另一类是操作行为，是生物体自身的反应，与任何已知的刺激无关。与这两种行为相对应，斯金纳把条件反射分为两类。与反应行为相对应的是反应反射，称为S(刺激)型(S型的名称来源于英语刺激)；与操作行为相对应的是操作反射，称为R(反应)型(R型名称来源于英文Reaction)。s型条件反射与强化和刺激直接相关，R型条件反射与强化和反应直接相关。斯金纳认为，人的行为主要是由操作性反思构成的操作性行为，操作性行为是作用于环境并产生结果的行为。在学习情境中，操作行为更具代表性。斯金纳非常重视R条件反射，因为它可以塑造新的行为，这在学习过程中尤为重要。

实验1:把一只饥饿的老鼠放进一个有按钮的盒子里，每按一次按钮，就掉一口食物。

结果:小鼠自发学会按按钮。

这个实验比巴甫洛夫的“敲钟喂狗”实验更进了一步，确立了行为。

什么是学习？它意味着在行为和操作者的需求之间建立一种依赖关系。换句话说，让行为人觉得“行为”和“回报”是有关联的。

只要把行为和奖励重复、挂钩，就可以培养出经营者的行为模式。

奖励可以培养行为习惯，是不是很棒？然后看实验二。

2.行为与惩罚

实验二:把鼠标放在一个有按钮的盒子里。每次鼠标没按下按钮，盒子就通电了。

结果:小鼠学会了按按钮。

但遗憾的是，一旦盒子不再通电，鼠标按下按钮的行为很快就消失了。

“惩罚”，作为对邪恶双胞胎的奖励，可以快速建立行为模式。但是，惩罚有一定的副作用:它建立的行为模式来的快去的也快。一旦惩罚消失，行为模式也会很快消失。

从长远来看，惩罚不会对阻止行为起到显著作用。现实生活中，惩罚带来的凡勃伦效应有时甚至会让惩罚适得其反。

凡勃伦效应:美国学者范布伦认为，与产品价格下降、需求增加的一般规律不同，特定产品价格上升，需求增加。一些上层人士的消费目的是炫耀自己的社会地位和成功，满足虚荣心，所以价格越高，需求就越高。反之，如果降低价格，反映上层阶级的界限就会变得模糊，所以需求就会减少。

要想控制行为人不去做某个行为，就要找到错误行为的“奖励”，把奖励去掉，从而制止他的错误行为。

然而，即使是奖励，当食物不再掉落时，老鼠的学习行为也会逐渐消失(虽然很慢)。而且是浪费粮食！那么我们该怎么办呢？

接下来是实验三。

3.固定时间奖励

实验三:把一只饥饿的老鼠放进剥皮盒，食物从开始的每1分钟掉一次。按下按钮放下食物。

结果:鼠标一开始没有停止按键。过了一段时间，老鼠学会了每1分钟按一次按钮。

当掉落的食物停止时，老鼠的行为就消失了。

啧啧，失败了。而不是训练鼠标持续按键，让鼠标变得“懒惰”。为什么？因为行为人知道该行为短期内不会得到回报。.....好吧。最关键的实验4。

4.概率奖励

实验四:把一只饥饿的老鼠放进一个剥皮器盒子里，按几次按钮，食物就会掉下来。

结果:老鼠学会了一直按按钮。

当食物不再掉落时，老鼠的学习行为消失得非常慢。

随着概率越来越低，老鼠的学习行为不变。直到鼠标按键40-60次掉落一个食物，鼠标还是会长时间保持按键。

(同样，在用鸽子做的实验中，不同时间间隔的鸽子每秒可以做出2-3次反应，连续反应持续15小时。)

这个实验模拟了为什么“赌博”——比如简单的老虎机或者更复杂的赌博——会给人类一种依赖感，或者说上瘾。

由于给出结果的概率，行为人很难直观判断该机制是否失效，因此单次失效不会给出明显的“惩罚”效果，终止行为人的习惯，从而使行为人的学习行为得以继续。

然后是一个有趣的实验5。

5.迷信老鼠？

实验5:嗯，其实实验5还是实验4，概率性斯金纳盒子。

结果:这些老鼠中有许多养成了奇怪的行为习惯，比如撞盒子、鞠躬、转圈跳舞。

这是因为老鼠在掉落食物前只是在做这些行为，所以有一种“迷信”。