본문 바로가기
카테고리 없음

조작적 조건형성 학습원리 연속적 강화 간헐적 강화

by hiddengosu 2023. 12. 31.

행동치료에서 조작적 조건형성은 특정 행동과 그 행동에 따른 결과 간의 상호 작용을 기반으로 합니다. 이는 행동이 강화 또는 처벌을 받음으로써 행동의 빈도나 확률이 증가하거나 감소한다는 학습원리를 나타냅니다. 행동치료에서는 이러한 원리를 활용하여 원치 않는 행동을 감소시키고 원하는 행동을 증가시키는데 중점을 둡니다. 

 

조작적 조건형성의 개념

조작적 조건형성의 과정에서 어떤 행동을 습득하게 되고 그 빈도를 증가시키는 과정을 강화(reinforcement)라고 합니다. 그리고 강화에는 쥐가 지렛대를 누르면 먹이를 제공하는 것처럼 학습자가 좋아하는 보상을 제공하여 행동을 증가시키는 경우와 같은 정적 강화(positive reinforcement)가 있고, 반대로 고통을 피할 수 있도록 강화해 주는 방식이 있는데 이러한 경우를 부적 강화(negative reinforcement)가 있습니다. 예를 들어 시끄러운 소음이 들리는 상자 안의 쥐가 고통스러워하다 우연히 지렛대를 눌렀고 소음이 멈췄다고 합시다. 이런 장치가 되어 있는 상자에서 쥐는 소음이 들리면 지렛대를 누르는 행동을 학습할 것입니다. 또한 강화와는 반대인 경우를 처벌(punishment)라고 합니다. 처벌은 어떤 행동을 제거하거나 빈도를 감소시킵니다.

스키너의 실험에서 먹이(결과)는 쥐가 지렛대를 누르는 반응(행동)을 강화시켰습니다. 지렛대를 누르는 반응(행동)은 먹이(결과)라는 것에 의해 강화를 받았기 때문에 반복되는 것입니다. 만약, 지렛대를 누르면 먹이가 나오는 대신 전기 자극(결과)이 주어지도록 장치된 상자가 있다면, 쥐는 반대로 지렛대를 누르는 반응(행동)의 빈도를 줄이게 될 것입니다. 이처럼 특정한 행위에 대하여 긍정적인 결과가 주어지면, 그 후 그 특정 행동의 빈도는 낮아지게 됩니다. 이와 같이 특정한 행동과 이를 수반하는 결과의 다양한 연합에 의하여 나타나게 되는 학습과정을 조작적 조건화라고 합니다.

스키너의 실험에서 행동은 결과에 따라 증가 또는 감소되는데, 보상이 뒤따르는 행동은 증가하고 처벌이 주어지는 행동은 감소된다는 것이 조작적 조건형성의 원리입니다.

 

학습원리

스키너(B.F. Skinner)는 행동주의적 관점에서 행동을 이해하고 변화시키기 위한 다양한 개념과 방법을 제시했습니다. 여기서는 스키너의 소거(Extinction), 변별자극(Discriminative Stimulus), 그리고 행동조성법(Shaping)에 대해 간단히 설명하겠습니다.

소거(Extinction)는 이전에 강화되었던 특정 행동이 더 이상 강화되지 않을 때 해당 행동이 감소하는 현상을 나타냅니다. 즉, 특정 행동에 이전에 제공되던 강화가 중단되면 해당 행동은 소거되는 경향이 있습니다. 예를 들면 동물이 레버를 눌렀을 때 음식이 나오다가 음식을 더 이상 제공하지 않으면 레버를 누르는 행동이 소거될 수 있습니다.

변별자극( Discriminative Stimulus)은 어떤 행동이 강화를 받을 수 있는 상황을 나타내는 자극입니다. 즉, 특정한 상황에서만 특정한 행동이 강화를 받을 수 있도록 하는 요소입니다. 변별자극의 예로 쥐가 특정 소리를 듣고 나면 레버를 누르면 음식을 받을 수 있는 경우, 그 소리가 변별자극이 될 수 있습니다.

행동조성법(Shaping)은 특정한 행동이 나타날 때마다 점진적으로 그 행동을 원하는 형태로 가깝게 만들어가는 과정입니다. 이는 일련의 강화를 통해 특정한 행동을 형성하고 강화하는 방법입니다. 예를 들면 쥐가 처음에는 레버를 누르지 않았지만, 레버를 다가가는 행동이 나타날 때마다 강화를 주어서 점차적으로 레버를 누르게 하는 것이 행동조성법의 예시입니다.

 

연속적 강화

연속적 강화는 특정 행동이 매번 발생할 때마다 강화가 주어지는 강화 일정을 나타냅니다. 연속적 강화의 효과로는 행동이 빠르게 학습되고 강화되며, 예측 가능한 환경에서 특정 행동과 강화 간의 연결이 강화됩니다. 단점은 지속적인 강화가 중단될 경우, 특정 행동의 강화가 더 이상 일어나지 않으면 해당 행동이 감소할 가능성이 큽니다. 이를 소거(extinction)라고 합니다. 연속적 강화는 초기 학습 단계에서 특정 행동을 빠르게 강화하고 학습하는 데 효과적입니다. 그러나 현실 세계에서는 일정한 간격으로 계속해서 강화를 제공하는 것이 어려운 경우가 많습니다. 따라서 행동이 연속적으로 강화되는 상황이 유지되지 않으면, 특정 행동이 감소하는 현상이 나타날 수 있습니다.

 

간헐적 강화

간헐적 강화는 일정한 규칙을 정하여 강화를 제공하는 빈도나 시간을 조절하여 강화를 제공하는 방식을 의미합니다. 간헐적 강화는 소거 현상에 대한 저항이 강하고 학습된 행동을 보다 지속적으로 유지하는데 유리합니다. 간헐적 강화계획은 강화를 제공하는 주기에 따라 고정강화와 변동강화로 나누어지며, 강화를 제공하는 방식에 따라 간격(시간) 강화와 비율(횟수) 강화로 구분됩니다. 간헐적 강화는 다음과 같습니다.

고정 간격 계획(Fixed Interval Schedule)은 일정 시간이 지나면 특정 행동에 대한 강화가 주어집니다. 예를 들어, 쥐가 레버를 1분마다 누를 때마다 음식이 주어지는 경우를 말합니다. 변동 간격 계획(Variable Interval Schedule)은 일정한 평균 시간이 경과한 후에 특정 행동에 대한 강화가 주어집니다. 예를 들어, 쥐가 레버를 평균적으로 3분마다 누를 때마다 음식이 주어지는 경우입니다. 고정 비율 계획(Fixed Ratio Schedule) 은 특정 행동이 발생하는 횟수가 일정한 횟수에 도달할 때마다 강화가 주어지는 강화 스케줄입니다. 고정된 횟수에 도달할 때마다 강화가 주어지므로 행동이 그 횟수에 도달할 때마다 높은 강화율을 보입니다. 예를 들어, 쥐가 레버를 5번 누를 때마다 음식이 주어지는 경우를 말합니다. 변동 비율 계획(Variable Ratio Schedule)은 일정한 평균 횟수 이후에 특정 행동에 대한 강화가 주어집니다. 예를 들어, 쥐가 레버를 평균적으로 5번 누를 때마다 음식이 주어지는 경우입니다.