心理職資格・大学院受験情報

試験対策用語説明-オペラント条件づけ-

SAIKORO

公認心理師及び臨床心理士試験、臨床心理士指定大学院受験を目指す人のための用語説明コーナーです。今回はオペラント条件付けについて解説していきます。

オペラント条件付けとは

 人や動物が自発的に行動したことに対して、報酬や罰を受けることで、その行動の頻度が増減する学習過程のことです。スキナーによって提唱され、道具的条件付けともいわれています。オペラント条件付けでは、自発的に生じた行動をオペラント行動といい、これに弁別刺激(行動の手掛かりとなる刺激)と強化刺激を随伴させ、反応の頻度や内容を変容させる条件付けを行います。オペラント行動の頻度が高くなることを「強化」といい。その強化刺激の「強化子」といいます。

オペラント条件付けの歴史的背景

 オペラント条件付けの基礎概念はソーンダイクによって形成されました。ソーンダイクは猫の問題箱と呼ばれる実験装置を開発し実験を行いました。問題箱は、紐を引くと扉が開く仕組みになっており、箱の中に空腹の猫を、扉の外に餌を置きました。猫は何とかして扉の外の餌を取ろうとし、偶然紐を引っ張ると扉が開き餌を取ることに成功しました。このような行動を繰り返していくと、「紐を引く」という正しい反応に到達する時間が短くなりました。このような学習を試行錯誤学習と呼びます。また、ソーンダイクは、行動に対して満足を得る状況がもたらすような場合は行動との結合が強まり、逆に不快な状況をもたらすような場合は行動との結合は弱まるという「効果の法則」を提唱しました。

 スキナーは、スキナー箱という実験装置を開発しました。スキナー箱にはラットやハトが入れられ、レバーを押すと餌が出てくるように作られていました。この実験でも、箱の中の動物が偶然レバーを押して餌を獲得できると次第にその行動頻度が高まっていくことが確認されました。また、空腹のハトの場合、発光板をつついて光が点滅した後に餌を得ると、次第に発光板をつつく頻度が増加しました。そして、発光板の点滅する光る色によって餌を出し分けてみると、ハトは発光板の色に応じて行動を変える(つつく、つつかない)ことが確認されました。この現象を弁別学習といいます。

オペラント条件付けの諸現象

・三項随伴性

人や動物の行動は、「先行条件(弁別刺激)-行動(オペラント反応)-結果(強化)」という関係で制御されるという考え方です。応用行動分析などの基盤になっています。

・強化スケジュール

 オペラント行動に対して、どのような強化子を呈示するかを指します。オペラント条件付けは、強化子の呈示方法によって反応の獲得に違いが見られます。

連続強化:目標とするオペラント行動の出現のたびに強化子を呈示する方法です。

部分強化・間歇(間欠)強化:目標とするオペラント行動の出現に対し、時々強化子を呈示する方法です。部分強化スケジュールには、以下の4つのパターンに分類されます。

1.固定比率スケジュール(FR):固定した回数比率ごとに強化子を与える強化スケジュールです。特定回数の反応ごとに強化子を与えられるもので、例えば10回反応したら1回強化子を与える等のスケジュールになります。(例:成果報酬や出来高払い)

 固定比率スケジュールでの累積反応記録は、階段状の反応パターンを示し、強化子を得た後はしばらく反応が無い状態が見られます。これを強化誤反応休止といいます。この反応休止期間が階段の水平部分となり、しばらくすると再び反応が始まります。この強化後反応休止の期間は、強化子を得るための反応数が多くなるほど長くなります。

2.変動比率スケジュール(VR):変動する回数比率毎に強化子を与える強化スケジュールのことです。固定比率スケジュールと違い、強化子を与えられる回数がランダムになります。(例:スロットやパチンコ、ソーシャルゲームのガチャなど)

 変動比率スケジュールの典型的な累積反応記録は、一本の直線に近い傾斜となる。これは反応の頻度が比較的安定していることを示しており、固定比率スケジュールに比べると強化後反応休止は極端に短い傾向にあります。強化子の呈示比率が高い場合は特に短くなり、比率が低くなるほど長くなります。

3.固定間隔スケジュール(FI):固定した時間間隔ごとに強化子を与えるスケジュールです。一定時間が経過した後に反応すると強化子が得られ、例えば強化されて24時間はいくら反応しても強化子は与えられず、24時間以上経った後に反応が行われると強化子が与えられます。(例:固定給やゲームのログインボーナス)

 固定比率スケジュールと同様に強化後反応休止が見られ、その後徐々に反応が増えていき、強化子が得られる直前になると急激に反応が増えます。累積反応記録には扇形のパターンが繰り返されます。

4.変動間隔スケジュール(VI):変動する時間間隔ごとに強化子を与えるスケジュールです。強化された後に次の強化子が得られるまでの時間間隔が強化子ごとに変動するものをいいます。(例:釣り←釣れたり釣れなかったりの時間が一定ではない)

 変動間隔スケジュールの典型的な累積反応記録では、一本の直線に近い傾斜となります。反応の頻度は安定しており、変動比率スケジュールと比べると反応率はやや低く、葉能率が上がっても強化率を上げるのにあまり役に立たない特徴があります。

・消去

 オペラント行動がとられても、強化子を呈示しないことを消去といいます。一般的に連続強化された場合より、部分強化された場合の方が消去までに時間が掛かり、消去抵抗と呼びます。

・強化と罰

 強化子を与えたのか除去したのかといった強化子の種類によって、強化は4種類に分類されます。

強化:反応の自発頻度を増加させること

罰:反応の自発頻度を低下させること

1.正の強化

 快刺激(報酬)を与えることで、その行動をより強化することです。

 例:子供がお手伝いをした→お菓子をもらった→またお手伝いをするようになった

2.正の罰

 不快刺激(嫌なこと)を与えることで、その行動頻度を減らそうとすることです。

 例:子供がいたずらをした→怒られた→いたずらをしなくなった

3.負の強化

 不快刺激を除去することで、その行動を強化することです。

 例:子供がテストで100点取ってきた→禁止されているゲームができるようになった→ゲームが再び禁止されないように勉強を頑張るようになった

4.負の罰

 快刺激を除去することで、その行動頻度を減らそうとすることです。

 例:子供が宿題をしなかった→ゲームを取り上げられた→宿題をするようになった

 正は(報酬・罰を)与えること、負は(報酬・罰を)除去すること、強化は行動を増やす、罰は行動を減らすと覚えておきましょう。

・逃避と回避

逃避学習:嫌悪刺激に直面した際にみせる逃避行動のこと。(例:椎茸を食べたが不味くと吐き出した)

回避学習:嫌悪刺激に直面する前(先行刺激の段階で)に回避行動をとること。(例:椎茸を見ただけで食べることを回避する)

 これらの学習は一般的に逃避学習の後に回避学習が行われます。

学習性無力感

 実験中の動物の様子からセリグマンが見出した現象のことです。ストレス状況からの回避が不可能な場合、状況から逃れようとする行動が見られなくなる現象のことをいいます。

SAIKORO

オペラント条件付けは、現代では応用行動分析に適用されており、臨床現場でも重要な理論になっています。強化や罰の部分は、意味を取り違えやすく、試験でも出現頻度が高いのでしっかりと頭に入れておきましょう。