도파민 시계: 뇌가 기분이 좋아질 때를 예측하는 방법
![]() |
과학자들은 도파민을 생성하는 뉴런이 보상뿐만 아니라 보상의 타이밍도 예측한다는 사실을 발견했습니다. 어떤 뉴런은 즉각적인 보상을 위해, 어떤 뉴런은 미래의 보상을 위해 활성화됩니다. 출처: Shutterstock |
뇌의 작은 영역인 복측 피개 영역(VTA)은 보상 처리 방식에 중요한 역할을 합니다. 이 영역은 맥락적 단서를 기반으로 미래의 보상을 예측하는 데 도움이 되는 신경 조절 물질인 도파민을 생성합니다. 제네바 대학교(UNIGE), 하버드 대학교, 맥길 대학교의 연구팀은 VTA가 더 나아가 예상 보상뿐만 아니라 보상이 예상되는 정확한 순간까지 인코딩한다는 것을 보여주었습니다. 머신러닝 알고리즘 덕분에 가능해진 이 발견은 인공지능과 신경과학을 결합하는 것의 가치를 보여줍니다. 이 연구는 네이처( Nature ) 저널에 게재되었습니다.
복측피개영역(VTA)은 동기 부여와 뇌의 보상 회로에 중요한 역할을 합니다. 도파민의 주요 공급원인 이 작은 뉴런 무리는 이 신경 조절 물질을 다른 뇌 영역으로 전달하여 긍정적인 자극에 대한 반응을 유발합니다.
"처음에는 VTA가 단순히 뇌의 보상 중추일 뿐이라고 생각되었습니다. 하지만 1990년대에 과학자들은 VTA가 보상 자체를 부호화하는 것이 아니라 보상에 대한 예측을 부호화한다는 사실을 발견했습니다."라고 UNIGE 의과대학 기초신경과학과 정교수인 알렉상드르 푸제는 설명합니다.
동물 실험 결과, 보상이 빛 신호에 지속적으로 뒤따를 때, VTA는 보상이 주어지는 순간이 아니라 신호가 나타나자마자 도파민을 분비하는 것으로 나타났습니다. 따라서 이러한 반응은 보상 자체가 아니라 신호와 관련된 보상에 대한 예측을 부호화합니다.
훨씬 더 정교한 기능
최소한의 감독만 필요한 이 "강화 학습"은 인간 학습의 핵심입니다. 또한 이는 훈련을 통해 성능을 향상시키는 많은 인공지능 알고리즘의 원리이기도 합니다. 바둑에서 세계 챔피언을 이긴 최초의 알고리즘인 알파고가 그 예입니다.
최근 연구에서 알렉상드르 푸제 연구팀은 하버드 대학교의 나오시게 우치다, 맥길 대학교의 폴 매셋과 협력하여 VTA의 코딩이 이전에 생각했던 것보다 훨씬 더 정교함을 보여주었습니다. "VTA는 미래 보상의 가중 합을 예측하는 대신, 보상의 시간적 변화를 예측합니다. 다시 말해, 각각의 이득은 예상되는 정확한 시점과 함께 개별적으로 표현됩니다."라고 이 연구를 이끈 UNIGE 연구원은 설명합니다.
VTA 뉴런이 시간적으로 가까운 보상을 더 먼 미래의 보상보다 우선시한다는 것을 알고 있었지만("손에 든 새가 숲 속의 새 두 마리보다 낫다"라는 원리에 따라), 우리는 뉴런마다 시간 척도가 다르다는 것을 발견했습니다. 어떤 뉴런은 몇 초 안에 가능한 보상에, 어떤 뉴런은 1분 안에 예상되는 보상에, 또 어떤 뉴런은 더 먼 미래에 있는 보상에 집중했습니다. 이러한 다양성이 보상 타이밍을 인코딩할 수 있게 합니다. 이렇게 훨씬 더 세밀해진 표현은 학습 시스템에 큰 유연성을 제공하여 개인의 목표와 우선순위에 따라 즉각적 또는 지연된 보상을 극대화하도록 적응할 수 있게 합니다.
AI와 신경과학: 양방향 도로
이러한 연구 결과는 신경과학과 인공지능 간의 유익한 대화에서 비롯되었습니다. 알렉상드르 푸제는 보상 처리 시점을 고려한 순수 수학적 알고리즘을 개발했습니다. 한편, 하버드 연구진은 보상을 경험하는 동물의 VTA 활동에 대한 광범위한 신경생리학적 데이터를 수집했습니다.
"그들은 저희 알고리즘을 자신의 데이터에 적용했고, 그 결과가 경험적 연구 결과와 완벽하게 일치한다는 것을 발견했습니다." 뇌가 AI와 머신러닝 기술에 영감을 주었지만, 이러한 결과는 알고리즘이 우리의 신경생리학적 메커니즘을 밝히는 강력한 도구로도 활용될 수 있음을 보여줍니다.
출처: https://www.sciencedaily.com/releases/2025/06/250609054401.htm
댓글 없음
아름다운 덧글로 인터넷문화를 선도해 주세요