Clickertraining
In september 2000 kwam Kayce Cover binnengewaaid voor een snel-snel introductie in Bridge & Target. Sceptisch ernaartoe, ben ik gefascineerd weer naar huis gegaan. Daarom hier een artikel over Clickertraining, in drie delen: een theoretisch stukje over begrippen rond "leren", een praktisch stukje over wat Clickertraining (en Bridge & Target) nu eigenlijk zijn, en als laatste een begin van ethische overweging, als aanzet tot weer een stukje verder op die levenslange weg die horsemanhip is. Met één gevoel héél centraal: "kinship with all life".
Lees ook volgende getuigenis van een ander voormalig scepticus: Fjord Maud en de clicker.
Even vooraf: definities over "leren"
Reinforcement (versterking)
al wat je doet om een bepaald bedrag te vermeerderen
- positive reinforcement = door een stimulus (prikkel) toe te voegen aan de omgeving (je krijgt een dessert als je netjes je bord leegeet)
- negative reinforcement = door een stimulus (prikkel) weg te nemen uit de omgeving (kinderen die ruzie maken wordt hun ijsje afgenomen).
Straf (punishment)
is al wat je doet om een bepaald gedrag te verminderen
- positive punishment = door een stimulus (prikkel) toe te voegen aan de omgeving (blijf daar af! + een tik op de vingers)
- negative punishment = door een stimulus (prikkel) weg te nemen uit de omgeving (je was veel te laat thuis, nu mag je niet meer uitgaan de rest van de maand).
Héél belangrijk in deze definities is dat het erom gaat om hoe de ontvanger van de prikkel het ziet - je kan bvb gestraft worden, maar de voorbeelden van hoe dat averechts kan werken zijn legio.
Toegepast naar paardentraining:
-positive reinforcement:
vb "targetten" = als je een voorwerp aanraakt, krijg je een beloning (bvb een wortel)
-negative reinforcement:
hieronder vallen de meeste paardentrainingsmethodes; bvb het "set it up and wait"-principe om een paard achteruit te laten gaan op alleen teugelhulp = de teugels aannemen (="coercion"/pressure/druk) en pas lossen bij het ene goede antwoord (achteruit). Ook het traditionele op commando neerwaarts vragen van een paardenhoofd is daarop gebaseerd: pas als het paard het hoofd naar beneden doet, geeft de ruiter na. "It's the release that teaches", maar vooraf is er steeds een vorm van druk, hoe klein die ook is.
-positive punishment
- tja, daar kennen we voorbeelden genoeg van. Een paard mag niet meer weigeren voor de hindernis, en dus wordt het geslagen.
-negative punishment
= het paard probeert te bijten als je met de voederbak komt, je trekt de voederbak weer weg.
Voor de goede orde: straf NA de actie heeft tot doel dat een aktie van het paard wordt ontmoedigd. Straf TIJDENS de actie heeft tot doel dat de actie wordt afgebroken (dus ook ontmoedigd). Dat geeft naast de onaangename herinnering aan straf ook frustratie (doe ik nu iets fout of heb ik iets fout gedaan). Met name langdurige "straf" als vastgebonden laten staan, geen eten geven enz. zijn zinloze acties en hebben niet tot gevolg dat een paard snapt dat hij voortaan iets moet doen of nalaten om dit te voorkomen.
Straf kan positief zijn in de zin van toevoegen (een mep na een weigering) of negatief in de zin van weghalen (bak eten wegnemen als het paard tegen de box mept tijdens eten) in de hoop dat in de toekomst een paard de aktie en de straf associeert. Uiteindelijk kan het paard er wel iets van leren, maar het zal er nooit een bevredigend gevoel aan over houden. Het zal niet iets "willen", het zal hooguit iets wat hij eigenlijk wil, nalaten (bijv. NIET weigeren, ondanks dat hij eigenlijk bang is voor die hindernis, is hij nog banger voor de "straf").
Positief en negatief als definitie zijn dus plus, wel en min, niet.
Een positieve uitslag bij een tbc-onderzoek is dat er wel TBC is geconstateerd. De ervaringswaarde (gevoel, beoordeling) van de patient is negatief. Een negatieve uitslag bij een zwangerschapstest kan een positieve of een negatieve gevoelswaarde opleveren, maar de patient is per definitie niet zwanger! In die zin zijn positive reinforcement (R+) en negative reinforcement (R-) verwarrende termen, waar je echt plaatjes bij moet maken om ze te kunnen gebruiken naast positief in de zin van goed en negatief in de zin van slecht. R+ en R- willen gedrag stimuleren, straf wil gedrag tegengaan of elimineren. Het kost veel energie en focus om zelf bewust met deze manieren van gedragsbeinvloeding om te blijven gaan. Alles wat we doen of nalaten in onze omgang met paarden is communicatie!
Shapen
"Modifieren van operant gedrag door het reinforcen van alleen die variaties in respons, die leiden in de richting van het gedrag verlangd door de trainer (Atkinson, Atkinson, Smith & Bern)". Of om het eenvoudiger te zeggen: je bouwt dus een gedrag stukje voor stukje op door elke keer elk stukje-in-de-goede-richting ("successive aproximations") te belonen. "Shapen" is het uitlokken (naar een bepaald gedrag leiden) of "veroorzaken" van een bepaald gedrag, en dan die ruwe vorm van aangeboden gedrag gaan verfijnen tot precies dàt wat je wil.
Trial and error
Als het gewenste gedrag in (te) grote stukken wordt opgedeeld, ontstaat "trial and error"-gedrag: "Zou het dit zijn? Tiens nee. Misschien is het dit?". Het grootste nadeel is dat als het proces van "trial en error" te lang duurt, er echt frustratie bij het dier ontstaat.
Morfen
is ook zo'n typische term die betekent dat je bvb. het lichaam van een hondje gaat duwen in de vorm dat het moet aannemen, vb op z'n achterste duwen om 'm te doen zitten. Je instructeur die aan je hielen komt trekken om je te tonen waar je benen moeten liggen, is ook aan het morfen (maar dat weet hij/zij vast niet!).
Capturing from behaviour/Catching a behaviour/"Scanning"
Gewoon wachten op een gewenst gedrag: je wacht tot het hondje toevallig gaat zitten en dat beloon je dan, tot het hondje door trial and error doorheeft dat het door te gaan zitten een beloning verdient.
Targetten
Het dier leert om een "target" (een doel) aan te raken. Die target kan je hand zijn, maar ook een zweepje, of een bal, of eender wat aangeduid wordt als het "doel".
Primary reinforcer
Een "eerstelijnsversterker" is alles waar iemand voor wil werken (of iemand anders dat nu de moeite vind of niet): voedsel, aandacht, aaien, liefde, kauwgom, harde geluiden (zoals kleine jongetjes die bommetjes laten knetteren op straat) - eender wat.
Secondary reinforcer
is een signaal of stimulus dat eerst geen enkele betekenis heeft, maar uiteindelijk de plaats gaat innemen van een primary reinforcer. Die secondaire versterker wordt dus uiteindelijk een geconditioneerde versterker - op de duur hecht de leerling even veel belang aan de secondary reinforcer als eerst alleen aan de primary reinforcer. Het zijn dus aangeleerde symbolen bvb goeie punten op een rapport, papiergeld, de belletjes op een flipperkast, een fluitje, een clicker.
"Secondary" betekent dus zeker niet dat hij zou komen NA een primary reinforcer. Daarom wordt de term in training vaak vermeden - in het geval van Bridge & Target en clickertraining gaat men het hebben over een bridge, of overbruggingssignaal.
Er is conditioneren, en er is conditioneren
Bij conditioneren denken we meestal aan de honden van Pavlov, die gingen kwijlen (voor de Vlamingen: zeveren) bij het horen van een belletje. Ook mensen zijn op belletjes geconditioneerd, let maar eens op als er een GSM gaat ;-). In elk geval: wie "conditioneren" zegt krijgt visioenen van gedachteloos lopende bandwerk - en het geconditioneerde individu dat van alle eigenwaarde wordt beroofd.
Pavlov beschreef hier echter de geconditioneerde reflex, dwz: eerst het belletje, dan het eten, dan het gedrag, dat een reflex is, en niet bewust, en dus niet (meer) kan gecontroleerd worden door de hond zelf. Reflexconditioneren wordt ook wel eens "classical conditioning" genoemd.
Hier gaat het echter over operant conditioning, dwz eerst het gedrag, dan het belletje (de stem of clicker of...), en dan het eten/de beloning. Het dier (de mens) moet dus iets doen om z'n beloning te "verdienen" en kan er dus ook voor kiezen om het gedrag niet uit te voeren - de dieren worden niet aangelijnd of gehalsterd (bij wilde dieren wordt wel eerst door de tralies gewerkt, maar ook daar heeft het dier dus steeds de keuze om niet mee te doen).
In traditionele training wordt als het dier niet "meewerkt" vaak gebruik gemaakt van negative reinforcement of positive punishment, bij operant conditioning wordt (zo zou het moeten ;-) ) alleen de kans weggenomen om succesvol te zijn; er wordt op z'n ergst een time-out gegeven: de target bvb wordt even weggenomen en pas een halve minuut later opnieuw gepresenteerd zodat het paard een nieuwe kans krijgt om alsnog succesvol te zijn. Soms wordt er een delta gegeven, een "nee, dat was niet juist"-signaal - vaak inderdaad gewoon een letterlijk "nee" zeggen; het gebeurt ook wel dat de trainer gewoon geen enkele reactie vertoont, als het ware 3 seconden 'bevriest' zonder oogcontact. Verder gaat de consequentie voor het dier dus niet - het werkt volkomen vrijwillig mee, en wordt er gewoon in gerespecteerd als het dat niet wil.
Waarom zijn "conditioneren" en "leren" twee verschillende woorden?
Misschien wel omdat ze maar gedeeltelijk met elkaar te maken hebben? Voor "leren" (= een verandering in respons al gevolg van een ervaring) worden algemeen de volgende 6 opties gehanteerd:
- klassieke conditionering (oftewel type I-leren)
- operante conditionering (type II -respectievelijk
- trial-and-error-leren
- shapen
- habituation (=gewenning)
- complex learning
- latent learning
- imprinting
Ik doe niet aan conditioneren!
Dat roepen mensen vaak verschrikt, alsof het een grote zonde is. Maar: conditioneren, dat doe je wél. Zodra je een "afspraak" hebt gemaakt over iets, heb je in feite geconditioneerd. Bijvoorbeeld: kuit aandrukken = voorwaarts, druk op bit = stilstaan of nageven, binnenbeen op de singel, buiten achter = hop galop (met eventueel een tik als reinforcer): je bent aan het conditioneren.
Niet alleen conditioneer je je paard om onmiddellijk te reageren als je een hulp of aanwijzing geeft, om efficiënt te zijn moet je natuurlijk ook zelf geconditioneerd zijn: de hulpen, waar je als beginner zolang over doet om ze onder de knie te krijgen, worden op de duur ingesleten in je spiergeheugen: je bent zelf ook geconditioneerd.
Het resultaat moet nu eenmaal meetbaar, herhaalbaar zijn, en consistent onder veranderende omstandigheden. In onze relatie met paarden (én mensen!) kom je daar nu eenmaal niet onderuit. Of we moeten stoppen met rijden.
Autorijden is een mooi voorbeeld daarvan: in het begin is autorijden heel moeilijk (zoveel tegelijk!) maar geleidelijk aan leg je soms stukken weg af waarvan je je achteraf niets bewust herinnert. Je autorijden is operant geconditioneerd.
Operant conditioneren in combinatie met positive reinforcement
In grote lijnen ziet een trainingsstap er als volgt uit:
- vragen om een gedrag
- het dier voert een bepaald gedrag uit
+ precies op dat moment clicker/belletje/stem als tussenstap = overbruggingssignaal ("bridge")
- beloning, meestal een beetje eten.
De clicker/belletje/stem (vb. X) wordt tussengelast om als signaal te dienen: dat heb je goed gedaan (daar, dat, op dat precieze moment), en daar ga je een beloning voor krijgen - het duidt dus voor het dier aan "dat was goed" en is tegelijk de belofte voor een beloning.
Het laat ook toe om de tijdspanne tussen bridge en beloning groter te maken, te varieren, en uiteindelijk zowel bridge als beloning (vb. het eten) te laten wegvallen.
Toch even duidelijk stellen dat de beloning dus niet altijd voedsel hoeft te zijn!
Zoals steeds: variaties op een thema
In "operant conditioning"-technieken zijn er verschillende variaties, maar operant conditioneren als trainingsvorm werd oorspronkelijk vanuit het Skinner-labo naar praktisch dierentrainen omgezet door Marian en Bob Breland, en hun latere assitent Bob Baily. Het werd al snel opgepikt door dolfijnentrainers en daarna verspreid vooral door Karen Pryor en Gary Wilkes onder de naam "clickertraining". Zij hebben clickertraining dus niet uitgevonden, maar ze hebben het wel het best gemarketeerd; vooral Karen Pryor zou je in dat opzicht een beetje de Pat Parelli van de Positive Reinforcement kunnen noemen.
Er zijn vele varianten van positief bekrachtigingstrainen, onder meer Bridge&Target (of SATS), vb. het wereldberoemde "Slewth"-project waar zeeleeuwen in de vrije oceaan walvissen gaan filmen. Deze vormen verschillen van elkaar op een paar punten in de methodiek, en die verschillen komen voornamelijk voort uit de verschillende opvattingen over waaróm en wát je moet gaan trainen - en die vraag heeft ook het "hoe" beinvloed.
Overigens zijn er veel meer overeenkomsten dan verschillen. Ook onderling (individueel) zitten er tussen al deze trainers een heleboel gradaties. Zoals steeds: het maakt het er allemaal alleen maar boeiender op.
1. "shapen/morfen" vs. "targetten"
Clickertraining (CT) gebruikt als basisvorm vooral "shapen", in vrij grote bouwstenen.Op het gedrag wordt dan gewoon gewacht tot het zich voordoet (free shaping/catching of ook wel "opportunistic training" genoemd) of soms wordt het in al dan niet kleine onderdelen uitgelokt (soms zelfs in één geheel, vb een hele rol voor een hond), en het dier voert het gedrag eerst onbewust uit. Pas geleidelijk aan, omdat het dier altijd voor een welbepaald gedrag beloond wordt, begrijpt het waaróm het beloond wordt, en gaat dat gedrag bewust herhalen, om beloond te worden.
Op een video van Gary Wilkes is bijvoorbeeld te zien hoe hij een hond een snoepje voor de neus houdt (luring, letterlijk "lokken"). Die hond probeert het snoepje uit de hand te krijgen, en volgt met z'n neus de hand met het snoepje in. Op die manier maakt hij een volledige rol. Op het moment dat de rol af is, krijgt hij het snoepje. De hond heeft op dat moment geen idee waarom hij dat snoepje krijgt - pas nà het vaak herhalen van de hele beweging, valt z'n frank/gulden/euro. Als de hond de hele beweging kent, wordt het hele gedrag op commando gezet ("rol").
Targetting wordt ook vaak gebruikt als een manier om gedrag uit te lokken: ook daar gaat het erom dat er een gedrag als geheel wordt aangeleerd, bvb. een klassieke oefening (die heel snel gaat met R+) is de Spaanse Pas met een paard. Het paard leert met de knie een target (bvb een zweepje) te raken. Door afwisselend de ene en de andere knie te vragen, voert het paard al gauw een Spaanse Pas uit.
Targetten kan soms zelfs de basisvorm van de hele gedragstraining zijn (daarin verschilt bridge&target wat meer van 'clickertraining'): het dier leert targetten, (bvb met z'n neus), en leert op die manier eerst een aantal basisgedragingen: aanraken, blijven, gaan naar, vasthouden, duwen enz. Daarna leert het met al z'n lichaamsdelen te targetten. Uit het targetten wordt elke beweging opgebouwd, alsof het het alfabet is waarna je er zinnen mee leert schrijven.
Dat gaat dus in het begin essentieel traag: met free shaping of luring leert een dier in één keer hele "woorden" aan, terwijl je zou kunnen zeggen dat'bodyparts' targetten zich eerst alleen met de letters bezighoudt, maar daarna gewoon gaat combineren, wat dan (wegens modulair) veel sneller gaat. Meestal wordt dus geen gebruik gemaakt van "morfen". Shapen wordt dan alleen gebruikt om de kwaliteiten van een al verkregen verdrag te verbeteren (duur, afstand, snelheid, hoogte enz.).
2. stemgebruik versus clicker:
Bij CT is het overbruggings-signaal een essentieel onderdeel, en heel vaak is dat een clicker, een klein apparaatje dat klikt als je er met de duim op drukt (vergelijk met speelgoedkikkertjes enz).
Waarom een clicker? Het is een droog, altijd hetzelfde klinkend geluid. Het is een signaal dat niet verward kan worden met een ander. Het is ook heel kort, en kan dus heel exact, op de seconde bijna, het "juiste moment" markeren. Het is dus heel duidelijk voor het dier. Het ontbreken van "emotie" in de clicker is voor vele trainers een belangrijk argument: er kan geen negatieve emotie in, en het gedrag is niet afhankelijk van de trainer (in B&T kiezen trainers vaker voor een persoonlijk geluid).
Er zijn dus ook trainers die juist wél gebruik maken van de stem, precies vanwege zijn emotionele variaties. Dan wordt als bridge bijvoorbeeld "X" ("ex" van "excellent") gebruikt (ook dat is een geluid dat "anders" en kort genoeg is om duidelijk te zijn). In het Slewth-project worden de zeeleeuwen gewoon getraind met "good". Het feit dat je een stem gebruikt laat je juist toe om gradaties in het overbruggingssignaal zelf te leggen en het gaat heel gemakkelijk.
3. emotionele "warm-koud"-ondersteuning
Bovenop het stemgebruik, gebruiken trainers soms ook een zogenaamde "intermediate bridge" (een vorm van "keep going signal, zie verder) - zodra het paard in de juiste richting werkt wordt "xxxxxxxxxx" gezegd (of gewoon "jajajajaaaa") op een ondersteunende manier, gevolgd door de "X" bij het aanraken van de target. Gaat het fout, dan wordt de "xxxxx" afgebroken, net zoals bij het warm/koud-spelletje: (warm warm JAAAA) er komt al feedback tijdens de actie. Die "xxxxx" is dus meer een coaching signaal: "je bent er nog niet, maar je bent op de goeie weg".
4. Keep going-signaal
De click (de YES, de JAAA, de X), moedigt het gedrag weliswaar aan (om weer te doen), maar beeindigt ook op dat moment (er komt een beloning). En dat kan voor praktische problemen zorgen. Als je bvb galop gaat trainen met CT, en je hebt alleen de click om te zeggen "DAT is het", dan zou het kunnen dat het paard in een sliding stop gaat om op de beloning te wachten... Sommige CT-trainers hebben daarom een apart aanmoedigingssignaal (een "keep going"-signaal) ingebouwd. Dit wordt dan enkel gebruikt om een al gekend gedrag te laten voortduren, het is dus niet hetzelfde als de intermediate bridge, dat essentieel is tijdens het aanleren, dus al voor het gedrag gekend is.
5. variabele beloning:
Variabele beloning betekent gewoon dat het belonen niet consistent is. Er wordt niet altijd beloond, of er wordt niet altijd met hetzelfde beloond, of de tijdsduur tussen gedrag en beloning varieert.
Bij een nieuwe oefening komt de beloning elke keer, naarmate de oefening consistenter is wordt het interval groter en de beloning kleiner. Niet anders dus dan bij het aanleren van dressuuroefeningen bijvoorbeeld. In het begin knuffel je je paard plat als het aanspringt in galop in plaats van in galop te vallen, en op de duur wordt het normaal.
Het interval is trouwens belangrijk voor de kwaliteit van de oefening: als je elke keer beloont wordt het routine, het wordt "normaal". Als de beloning variabel is (groter/kleiner, meer/minder tijd tussen) gaat iemand harder werken. Da's trouwens waarom mensen aan een jackpot verslaafd raken ;-). Maar het is ook de motivatie tot gewoonweg willen werken naar steeds beter, zoals een balletdanser blijft werken aan z'n dans -hij werkt voor eerst de goedkeuring van z'n dansleraar en daarna voor het applaus - maar als hij dat applaus bij elke sprong zou krijgen zou de glans er snel afgaan. Integendeel, de danser krijgt zoiets van "hou nu eens op met dat applaus".
Bij CT wordt de beloning pas variabel als het gedrag echt gekend is - normaal wordt er na elke vraag onmiddellijk, en altijd beloond (er zijn variaties maar meestal wordt dit toch bij beginners als essentieel aangeleerd). Als een gedrag gekend is, valt de click weg tegelijk met de beloning. Bij sommige trainers(b&t) wordt de beloning, maar niet de "X", zo goed als onmiddellijk variabel: zodra de target een paar keer is geraakt. Er wordt dan gemiddeld maar 1 op de drie keer voedsel (of iets anders waar het dier voor wil werken) gegeven. Het hangt dus ook van het individuele dier af hoe snel en hoe variabel je variabele beloning kan zijn.
Zowiezo, als je met voedsel traint, is het natuurlijk de bedoeling zo snel mogelijk van dat eten af te komen. Na een tijdje geef je de beloning pas op het einde van een hele reeks oefeningen. Ook moet je niet elke keer voedsel gaan geven: zeker met het gebruik van de stem is ook de manier waaropbvb "X" wordt geroepen een graadmeter, en er wordt ook gewoon veel geaaid.
Bovendien bestaat er ook zoiets als "extinction burst". Stel: je krijgt het deksel niet van de confituurpot. Het deksel zit vast, en hoe hard je ook probeert, je krijgt het niet losgedraaid. Net voor je gaat opgeven, probeer je nog één keer, met oerkreet erbij en extra veel kracht, zo van "nog één keer". Beng, het deksel gaat open. Straffe trainers weten wanneer die extinction burst komt, en belonen daarop - op de supergoede uitvoering, net voor het frustratie (en opgave) wordt. Het is echter weinig trainers gegeven die extinction burst te voorspellen, maar wie het kan, gaat pijlsnel vooruit. De keerzijde van de medaille is dat als je 'm net mist, er geen tweede komt, en je de oefening voor een tijdje mag vergeten. Maar je kan dus wel degelijk je afwerkingseisen binnen een bepaalde oefening hoger stellen naarmate je paard ze kent. Maar dat geldt natuurlijk niet alleen voor deze vorm van trainen, dit geldt voor alle vormen van leren.
Het gebruik van stemcommando's
Voor de duidelijkheid: het geluidje (de click, de "X") is zélf geen stemcommando - het betekent alleen maar "dat heb je goed gedaan, en daar krijg je (straks) een beloning voor". Het klassieke voorbeeld is dat van de dolfijn die door een hoepel springt: op het exacte moment dat hij daar door de hoepel gaat, hoor je de trainers fluiten. Niet ervoor, niet erna. Dat betekent voor de dolfijnen: dat heb je goed gedaan, kom nu maar een visje halen.
Het gebruik van stemcommando's is toch wel een kenmerk van CT. Veel meer dan bij andere trainingsmethodes waar stemcommando's bvb beperkt zijn tot "hoooo" of "halt", "stap", "draf" en "galop" (bvb bij het longeren). Toch moet het niet perse een stémcommando te zijn - het kan ook gewoon wijzen naar een target zijn, of eender welk gebaar. Een stemcommando wordt pas op de oefening geplakt nadat de beweging consistent is (en overigens al verkregen kan worden, door middel van lichaamstaal bvb). Het zou anders net zoiets zijn als een paard leren longeren: het paard loopt te draven, en jij roept maar steeds "galop, galop" - het paard denkt dan dat wat hij aan het doen is, vast galop heet, terwijl jij zou willen dat hij in galop gààt. Zo werkt het dus niet - je drijft eerst het paard aan - (met lichaamsbeweging of met de klassieke longeerzweep of met een beetje zand of of of - en pas als hij in galop gaat zeg je "galop".
Moet je altijd met voedsel werken?
Nee - je werkt met eender waarvoor het dier wil werken. Voedsel werkt meestal wel het snelste en ik heb m'n oorspronkelijke weerstand daartegen overwonnen omdat het zo snel resultaat gaf, terwijl het duidelijk was dat het paard wel de beloning verwacht, maar in feite niet daarvoor werkt.
Kayce vertelde bvb dat manta's (je weet wel, die enorme vliegende onderwaterschotels) niet voor voedsel werken, wel voor... krabbelen. Een hamster werkt niet voor het eten zelf, maar om te kunnen hamsteren: nootje in z'n mond, naar de voedselplaats rennen, veilig wegstoppen, terugkomen. Orca's vinden het fantastisch om over hun tong gestreeld te worden - net zoals poezen over hun rug.
Van werken met voedsel krijg je toch opdringerige paarden?
Het is niet het werken met voedsel dat het opdringerige gedrag veroorzaakt, en ook niet het voedsel geven uit de hand. Als het paard opdringerig wordt, betekent dat alleen dat je de regels niet duidelijk hebt gesteld. Het paard toont je dus alleen maar waar je iets bent vergeten uit te leggen daarover. Gazelle (m'n experimenteerpaard) werd in het begin inderdaad even opdringerig, maar dan stel je "gewoon" de regels vast: "nee, niet zo". Dus nu loopt Gazelle de kom met worteltjes/appeltjes/whatever gewoon voorbij op weg naar de target, 5 meter verder - want de kortste weg naar een stukje wortel gaat via de target, niet via de kom.
Wat kan ik ermee onder zadel?
De manier waarop bvb. Ride With Your Mind omgaat met leren heeft voor mij veel weg van CT: een beweging wordt opgesplitst in hele kleine onderdelen, en er wordt een "andere" manier (in dit geval: een andere woordenschat, maar dat is targetting tenslotte ook) gebruikt om je van de bewegingen van je eigen lichaam bewust te laten worden, waardoor je die bewegingen ook bewuster gaat uitvoeren - omdat je erover moet nadenken hoe je ze precies uitvoert. Vele kleine beweginkjes in je eigen lichaam vormen ineens samen een perfecte wending - het einddoel overkomt je bijna.
Helpt het bij het rijden? Ik denk in grote lijnen alleen conceptueel - sommige dingen kan je op de grond al uitleggen. Het bit is de target, of je been, of je bouwt een piaffe op de grond op door te targetten met spronggewrichten; een wending om de achterhand door met schouders te targetten. Zowiezo blijft rijden altijd een mengvorm van technieken - het feit dat je met je eigen lichaam het paard hindert in z'n beweging, alleen al omdat je erop zit, veroorzaakt dat. Maar het maakt je er wel bewuster van dat je, als je op die manier over "rijhulpen" gaat nadenken (namelijk dat je het als een vorm van targetting ziet of een vorm van negative reinforcement), dat ze eerder "cues" worden en geen "hulp". De bridge voorkomt in elk geval dat je druk moet verhogen om iets gedaan te krijgen.
"Het zijn allemaal maar kunstjes, en dus dieronwaardig."
Een paard piano leren spelen, of uit een colaflesje leren drinken, of een buiging laten maken, "gewoon omdat het zo leuk is", zou ik inderdaad dieronwaardig kunnen noemen.
Maar wat doe je dan met "normale" paardentraining? Wat zijn eigenlijk de criteria om iets dieronwaardig te noemen? Als je een "kunstje" zou omschrijven als aangeleerd, maar irrelevant gedrag, wat doen we dan met bvb. dressuur? Hoe hoger bijvoorbeeld het (dressuur)niveau: hoe gevarieerder de kunstjes. Appuyementjes, zijgangen, uitstrekken etc etc: bij alle kunstjes zal je het paard duidelijk moeten maken wat je wilt. De manier waarop, is misschien van minder belang - als het maar met respect voor het wezen "paard" gebeurt. Bovendien lijkt het me sterk dat het paard zélf onderscheid zou maken - als het paard het zélf leuk vindt, wie ben ik dan om te zeggen "dit is dieronwaardig"? Voor dat ene individuele paard zou het wel eens veel dieronwaardiger kunnen zijn om 'm te doen springen, of piafferen.
Nu: je zou targetten een "kunstje" kunnen noemen. In feite is dat kunstje net zoiets als het concept "letter". Er zijn verschillende letters, als je die aan elkaar plakt heb je woorden, en als je die aan elkaar plakt heb je zinnen. Zo ook met het targetten: dat eerste kunstje (met de neus tegen een stokje bvb) is hem vertellen: kijk, zoiets is een letter. Daarna ga je woorden maken (verschillende targets aanraken, met neus/mond/knie/oor/achterste/ schouder/rug enzovoort). Na een tijdje weet het paard dat hij de target moet aanraken, hij moet er alleen achterkomen welke target, en met welk lichaamsdeel; ook je targets veranderen van afstand en uitzicht. Eens een bepaad gedrag samengesteld, verdwijnen de fysieke targets: het gedrag komt als geheel onder één stemcommando te staan. Wat mij juist zo in CT aantrekt is het belang dat wordt gehecht aan het voorbij-het-kunstje gaan: dat het paard bewust moet zijn van de beweging die hij uitvoert. Ik denk dat je dus inderdààd eerst door het "truuks"-stadium heen moet. Het "licht aangaan" van "ha, ik moet targetten" is heel leuk om te zien, maar het is niet dàt wat ik bewustzijn noem, maar het is wél het begin, omdat het vrijwillig is.
En als een koe de keuze heeft om (aan de hand van abstracte symbolen) te kunnen zeggen "vandaag wil ik wel eens met die knappe stier rollebollen" , en morgen kan ze zeggen "uh, geef mij maar de wei" (een concreet getraind project!)- dan is dat toch pas echt een begin om een dier in z'n volle waarde te kunnen laten? Natuurlijk kan je een koe tot bij de stier brengen, en kan je het aflezen aan de manier waarop ze zich gedraagt, dan weet je 't ook wel. Maar is het niet veel respectvoller om het vooraf gewoon even beleefd te vragen?
Om een praktisch voorbeeld te geven: het lijkt het mij niet zo moeilijk om een paard te leren dat ze kan zeggen: vandaag wil ik appels, geen worteltjes, door een van de twee symbolen te kiezen. Net zoals het mogelijk moet zijn om een paard de letters in de piste te leren "lezen". Net zoals autisten uit hun gesloten wereld halen (clickertraining wordt overigens gebruikt om (sommige vormen van) autisten te leren functioneren - het geeft hen beelden (ze kunnen niet in woorden denken) waar ze effectief dingen mee kunnen - het stelt hen in staat om terug te praten. En om hun mening te kunnen geven.
Excessen heb je altijd. Shows zijn misschien "dieronwaardig", maar ze tonen mensen wél dat dieren tot méér in staat zijn dan eten en voortplanten en, in het geval van paarden, ons van A neer B brengen op de manier die wij verkiezen.
Hebben gesproken woorden "zin" voor paarden?
We communiceren natuurljk al lang zonder woorden met onze paarden: wijzen met een vinger. Een vinger tegen de achterhand. Het vastnemen van het leidtouw. De manier waarop we kijken, naar voor stappen, ons omdraaien.We hebben lichaamstaal. CT is bovendien geen alomvattende trainingsmethodes. In de eerste plaats komt die lichaamstaal, en je eerlijkheid naar het paard toe. Misschien is het aanbrengen van exact omschreven woorden op deze manier toch interessant. Omdat we minder "ruis" hebben - aan onze kant, én aan hun kant. Minder "verloren" boodschappen. Het is waarschijnlijk alleen een ander/fijner werktuig voor het komen tot een begrijpelijke, gemeenschappelijke taal... De ruis (en er kan veel ruis zijn!) zo veel mogelijk elimineren. Op dezelfde manier als RWYM en Centered Riding precies die woordenschat aanbrengt, waardoor je in staat bent om de "ruis" in je eigen lichaam eerst te begrijpen, en daardoor te elimineren.
In CT worden professioneel getrainde dieren bovendien tweetalig getraind: je hebt natuurlijk de Engelse/Nederlandse woorden, maar meer geavanceerde trainers gebruiken ook een "nonsenstaal": "brok" = "pak vast", "mwéh" = "kom mee". Dat maakt dat je er zelf even hard over moet nadenken - over "taal". Een soort Esperanto :-).
Ik laat nog even Elma Middel aan het woord: "Het voordeel van uitbreiden van onze communicatietool met paarden zie ik in het weerbaarder maken, het bieden van ontwikkeling aan het dier in gevangenschap. De kans om te "studeren" in de cel of de luchtplaats, waardoor ze de box als speeltuin en de luchtplaats als balzaal gaan apprecieren. We nemen ze een heleboel af, vrijheid, spanning, keuzes maken onder stress in de natuur, en hoe groter ons onderling esperanto (in woorden, gebaren, whatever) hoe minder verwarring, hoe duidelijker de interactie, hoe minder misverstanden, hoe meer we hen ook leren 'lezen', en hoe meer mogelijkheden om belangrijk voor elkaar te worden. In die zin zie ik het als een kans en niet als een bedreiging. Het ontkennen en onthouden van de mogelijkheid dat paarden meer kunnen leren dan stap, drrrrraf, gaaaalop, braaf en voetje zou je kunnen bekijken als debiliseren van het paard en miskennen van hun potentieel. We hebben dat eerder gehad met apen, dolfijnen, slaven, vrouwen... en we doen dat nog met autistische kinderen, mensen met gehoor en gezichtsproblemen enz. Zoeken naar vormen van communicatie is echter ook altijd omstreden geweest in de kringen die vonden dat ze het al 'goed' deden, omdat verandering hoe dan ook gepaard gaat met weerstand en angst.
Wat ethisch wel en niet verantwoord is, zal vermoedelijk per persoon en horsanality verschillen. Wel een tuig op om een kar te trekken en geen hoedje? Ik weet niet of dat zo verschillend is, behalve dat het een calvinistisch 'nuttig' is en het andere 'plezier'? Als het paard er lol in heeft is dat duidelijk zicht-, merk- en voelbaar." "We hebben te maken met persoonlijkheden, feitelijk ontwikkelingsniveau, sociaal ontwikkelingsniveau en een pakket bagage uit het verleden en van daaruit kunnen we kijken hoe ver we met elkaar kunnen en willen komen. It all depends.... "
© Inge Teblick,
met dank aan Els Van der Zanden en Elma Middel |