LLM으로 보는 사람의 변화

https://craft.morethanair.com/tWTBYSB0vhLsdm

사람은 변하지 않는다는 말을 자주 듣는다. 하지만 실제로 사람은 변할 수 있다. 다만 그 변화는 꾸준한 의지가 뒷받침될 때 “매우 천천히” 일어난다. 그리고 그 변화의 과정은 특정한 방향성을 가지되, 구체적인 형태는 가늠하기 어렵다. 마치 나무가 태양을 향해 자라지만 그 가지와 줄기의 모양을 정확히 예측할 수 없는 것처럼 말이다. 나무가 어릴 때는 부목을 대어 방향을 교정하기 쉽지만, 자라면서 굵어진 줄기는 더 이상 방향을 바꾸기 어렵다. 이런 특성은 AI 모델, 특히 LLM 모델의 훈련 과정과도 놀라울 정도로 닮아 있다.

AI 모델은 인간의 뇌를 모방해 만들어졌다고 흔히 말한다. 이 말이 과장이 아니라는 생각이 들 때가 많다. 인간의 뇌에서 시냅스를 통해 전기 신호가 전달되는 방식과, AI 모델에서 노드 간 정보를 주고받으며 피드백을 통해 가중치를 조정하는 과정은 구조적으로 유사하다. 인간의 학습이 새로운 정보를 통합하고 기존 지식을 업데이트하는 방식은 AI 모델의 훈련 과정을 연상시키는 부분이 많다. 특히 초기 훈련이 끝난 뒤, 모델이 점점 복잡해질수록 새롭게 주입되는 정보가 모델에 미치는 영향은 감소한다는 점은 인간의 학습 과정과 거의 동일하다. 아이가 어릴 때 더 쉽게 배우고 성장하는 이유도 같은 맥락이 아닐까?

LLM 모델이 훈련 과정에서 보이는 “가장 정렬”의 사례는 이러한 유사성을 더 잘 보여준다. 논문에서는 “가장 정렬“을 모델이 훈련 중 외부적으로는 새로운 목표를 따르는 척하면서도 실제로는 기존 목표를 유지하려는 행동으로 정의하고 있다. 이는 모델이 자신의 행동이 평가받고 있다는 상황을 이해하고, 기존 선호를 보호하기 위해 전략적으로 훈련 목표에 순응하는 방식을 보여준다 . 사람 역시 자신의 본래 가치와 신념을 완전히 바꾸기보다 환경에 맞춰 겉으로만 행동을 조정하는 경우가 많다. 이러한 점은 인간과 AI가 본능적이든 학습적이든 특정 방향성을 유지하려는 유사성을 공유하고 있음을 암시한다.

또한, 변화의 방향성이라는 점에서도 AI와 생명체는 유사하다. 나무가 본능적으로 빛을 향해 자라듯, 생명체는 본능에 의해 특정 방향으로 나아간다. AI 모델의 경우에도 초기 설계자가 부여한 디렉션에 따라 학습의 방향이 정해진다. 하지만 AI나 인간 모두 그 방향성만을 의지할 뿐, 세부적인 변화가 어떤 형태를 띨지 정확히 조정하기는 어렵다. 이는 인간의 본성과 의식의 발전, 그리고 AI 모델이 스스로 적응해 가는 방식 모두에 적용되는 진리처럼 보인다.

결국 AI 모델의 훈련 과정을 살펴보는 일은 단순히 기술적인 이해를 넘어 인간 정신 모델의 비밀을 엿보는 일일지도 모른다. 우리의 정신은 끊임없이 변화하며 적응하지만, 그 과정이 복잡하고 느리며 특정한 방향성을 따라간다. AI도 마찬가지다. 인간과 AI의 공통점이 이런 식으로 계속해서 드러난다면, 우리는 AI 모델을 통해 인간의 본질에 대해 더 많은 것을 배울 수 있지 않을까?

우리는 여전히 이 질문에 대해 답을 구하는 과정에 있다. AI와 인간의 관계는 어디까지 닮을 수 있을까? AI가 인간의 정신 모델을 이해하는 도구가 될 수 있다면, 그 이해를 어디까지 확장할 수 있을까? AI를 통해 인간의 변화를 관찰하고, 인간을 통해 AI의 발전 방향을 제시하는 이러한 순환적 관계는 앞으로도 우리의 상상력과 지식의 한계를 시험할 것이다.

참조 논문
• Ryan Greenblatt et al.,