您的位置:首页 > 娱乐 >

全球即时看!【笔记7】养狗前的功课——正向训练之塑形法《别毙了那只狗》摘抄2

还有三天缪缪就要到家了!!!

正增强的理论和正向反馈的思路在我自己的教学工作当中其实用得是很熟练的了,今天仔细看了另一本随心群里大佬推荐的书 ,发现还有很多细节值得摘抄和反复复习,开肝!

【笔记】这是我自己的笔记,不是经验干货,全是我云的,未经验证,可能有错,慎重参考。我以后验证了也许会回来复盘和修正。

塑形法

塑形法(shaping):是指把一个倾向于正确方向的小行为慢慢进行调整,每次只改变一点儿,朝最终行为目标推进。这个过程有个专有名词 - 「连续渐进法」(successive approximation)。塑形练习的成效之一(尤其当训练对象有过收获良多的经验时)是它会增加训练对象的专注力,你事实上正塑形越来越长的期待时间。


【资料图】

适用范围:能使动物出现那些牠们可能永远都不会碰巧出现的行为呢。增强针对原本就会出现的行为,这个相反。

塑性方法: 各阶段发展出来的行为和发展出这些行为的步骤。一个行为可以有多种训练方法。

塑性原则:行为被增强的理由、增强方式及时间点的依循原则。原则比方法重要

1) 逐渐提高增强标准的幅度不可过大,这样训练对象才有不断被增强的机会。

每次调高增强标准时,你便改变了规则,所以你必须让训练对象有机会发现:虽然规则改变了,只要牠多费点儿劲表现,仍然可以轻易获得增强物,而且继续维持旧标准的行为有时已经不管用了。然而牠只有在达到新的增强标准时获得增强,才能够学会这一点。

2) 每次只针对行为的某项特性进行训练,不要企图同时塑形两项特性。

并不是指在同一段练习时间内不能训练多种不同行为,这当然可以。这么做可以减少单调无聊的情形。好的指导老师会一直变化练习项目,当一项有些进步之后就换到下一项。不过,训练每项行为时,你应该每次只针对一项增强标准作练习。假如我想训练海豚溅水,这次因为水溅得不够高而不给增强物,下次又因为牠溅错方向而不给,海豚将因此无法领悟出我到底希望牠做什么。一份增强物无法传达两种讯息,我应该先对溅水的高度进行塑形直到满意为止,然后再针对溅水的方向(不管溅水的高度)进行塑形!直到牠学会了溅水的方向。等两项增强标准都能个别达成之后,我才能要求牠同时达到这两项标准。

3) 进行塑形时,先「变化性增强」目前符合增强标准的行为,然后再提高增强标准

正增强的训练方法不仅不必一辈子增强每个正确反应,而且在学习过程中还必须偶尔忽略反应不作增强。如果你正训练一个毫无经验的学习生手,在你开始挑选更强烈或更佳的反应之前,事先刻意教导牠学习容忍增强时制的小小变化将会很实用。你的训练对象必须能够容忍你偶尔出现的「失误」才不会完全不反应,或者以专业术语来解释,这代表你必须先建立起变化性增强时制,然后名能藉由区别性增强时制增强较佳的表现。例如,先教短距离唤回,变频奖励,直到在任何场景下任何奖励模式下都能成功唤回,再教远距离唤回。

4) 针对某项行为特性采用新的增强标准时,暂时放宽其他特性的旧有增强标准。

学过的东西不会被忘记,但是处于吸收新技能的压力下,原来已学习很好的行为有时会暂时瓦解。

5) 永远抢得先机,知道下一步要做什么

当训练动物突然出现大幅进步时,训练者可能因此措手不及。原本打算要从 A 行为训练成 B行为,可是动物只经过两次增强就突然表现出完美的 B 行为,这时训练者心中最好已经先有个底,知道接下来要做 C 行为和 D 行为,否则你将会不知道接下来要增强哪个行为。

行为出现突破时便成为能够迅速大幅进步的黄金契机,如果自己未作好准备,不知道接下来该做什么,使得动物一直维持在低水平的表现,除了浪费时间之外,最严重的伤害可能是使动物打消动机或感到厌烦,于是牠将来工作的意愿便会降低。

6) 塑形中途不可更换训练者。

塑形中途换人训练应该只有一种必要的情况,当然就是在训练持续停滞不前的时候,若原本几乎没有形成任何学习,换人也就不会有什么损失。

7) 当某个塑形方法没有进展时,改采用别的方法。

无论什么行为,只要训练者动动脑筋,塑形出这个行为的方法不胜枚举。好的老师在训练时如果看见有个孩子对某个方式感到无聊或害怕时,他会改换方式,同一个塑形方法不一定对每个个体都管用。 「训练时最重要的是理解训练原理,而非只是学习方法」,主要理由在于,每个人都自有「方法」,但是真正管用的方法都得遵循训练原理。

8) 不可无故中止训练,这么做将形成一种处罚。

如果你想向训练对象表达责备之意,「移除注意力」会是个好方法。海豚训练师称此为「暂停时间」(timeout),用来纠正错误行为,把装鱼水桶拿起来离开一分钟是少数几个用来对海豚表达「不行!」或「错了!」的方法之一,而它通常非常有效,你可能不认为海豚会有懊恼或悔悟的样子,但是牠们真的有。移除注意力是很有效的工具,所以不要草率滥用或不当使用。

9) 如果行为越表现越差,请回顾所有塑形的步骤。

有时显然已经训练良好的行为仍会变得很差,而且永远找不到原因。谁知道原因?有人在乎原因是什么吗?这种时候,你需要的不是合理的理由,而是有效的解决方法。修正这类退步最快的方法不是硬碰硬,不应坚持训练对象的行为一定得完全回复到令你满意为止,也不应坚持牠得在完全回复后名予以增强。正确的作法应是回想所有塑形的过程,并且很快地重新经历所有塑形步骤,到新情境(二十年后、在公共场所、在雨中等等)中进行增强,每个步骤只要增强一两次就好。

10) 在训练进展很好时停下训练。

结束训练的「时机」比停止训练的「时间点」来得重要,你永远都应该在训练进展很好时结束训练,不但每回训练都应该这么做,而且每回训练到不同阶段(将改换训练下个行为时)也应该这么做。你应该在训练进展不错时就告一段落 -- 也就是说,只要达成了一些进步就停手。 最后达成的行为会记得最清楚,所以你必须确定最后一个行为是值得增强的好表现。一次又一次地重来,设法重现佳绩。但这只会很快一让训练对象疲累、行为变差、不断出现错误,接着就是纠正和破口大骂,最后搞砸了训练。

塑形的快捷方法

目标法:作法是塑形动物以鼻子去碰触「目标物」- 可能是棒子的圆端,或者也常用训练者的拳头,然后再移动目标物,让动物跟随它、碰触它。 

你可以引发各式各样的其他行为,例如爬楼梯、跳起来、以后脚站立、跟随训练者、进出运输笼等等,当我们拍拍大腿引狗儿靠近时,我们基本上就是利用目标法,这个动作似乎对狗儿有吸引作用,当牠们靠近时,我们以拍抚增强这个行为。

模仿:许多狗儿都没有很好的观察学习能力,当牠们出现其他狗儿的行为时,这通常是因为牠们对同一个刺激出现反应,而非模仿的结果。相反地,被心理学家评为智商低于狗儿的猫咪大都具有很棒的模仿能力。

模拟:若想让行为模拟法生效,你得并用塑形法,当你让训练对象摆出姿势或做出动作时,仔细留意牠是否出现了一点点主动启始适当行为的表现,这个些微表现便是你应该增强的行为。狗儿稍微自己咬哑铃皎得紧一些、高尔夫球员开始顺利挥出一杆、幼猩猩的手自己动了,你立即当下给予赞美,然后便能一边「略去」协助模拟的动作,一边塑形新的技巧。并用行为模拟和塑形法通常可以有效训练行为,但是两者结合才能有效,不能单单利用模拟。

标签: 教学工作 训练方法

相关阅读