AI 튜터링의 현실: 효율은 2배, 하지만 지속되지 않는다
박비봉
2023년 하버드 대학에서 흥미로운 실험이 있었다. 물리학 수업에서 194명의 학생을 두 그룹으로 나눠, 한쪽은 교실에서 능동적 학습(active learning)으로, 다른 쪽은 AI 튜터로 같은 내용을 배우게 했다. 결과는 놀라웠다. AI 튜터를 사용한 학생들의 학습 성과가 2배 이상 높았고, 소요 시간은 오히려 짧았다. 참여도와 동기도 더 높게 나타났다.
이 숫자만 보면 AI 튜터링은 교육의 미래처럼 보인다. 하지만 이 연구에는 중요한 한계가 있다. 실험 기간이 2주에 불과했다는 것이다. 장기적으로 학생들이 AI 튜터를 계속 사용하는지, 배운 것을 유지하는지는 측정되지 않았다.
우리는 수학 교육 앱과 한국어 교육 앱을 직접 만들면서 이 간극을 체감했다. AI는 지식을 전달하는 데는 놀랍도록 효과적이다. 하지만 학습자가 계속 돌아오게 만드는 데는 뚜렷한 한계가 있다. 효율과 지속성 사이의 이 간극이 AI 튜터링의 진짜 과제라고 생각한다.
AI가 잘하는 것: 지식 전달
먼저 AI가 정말 잘하는 영역을 인정해야 한다. 지식을 전달하는 것, 즉 모르는 것을 알게 만드는 과정에서 AI는 탁월하다.
우리가 만든 한국어 교육 앱에서 가장 효과적이었던 기능은 회화 연습이었다. AI와 롤플레잉을 하면서 한국어 대화를 연습하는 것. 카페에서 주문하는 상황, 친구에게 약속을 잡는 상황, 병원에서 증상을 설명하는 상황 — 이런 맥락별 대화 연습에서 AI는 인간 튜터를 대체하기 어려울 만큼의 장점을 가지고 있다. 24시간 가능하고, 절대 짜증내지 않고, 학습자의 수준에 맞춰 속도를 조절한다. 틀려도 부끄럽지 않다.
수학 교육 앱에서도 마찬가지였다. 수학 문제를 풀 때 답을 바로 알려주는 대신, 소크라테스식으로 풀이 과정에서 힌트를 주는 방식을 택했다. "이 문제에서 먼저 무엇을 구해야 할까?" "지금 구한 값을 어디에 대입하면 될까?" 이렇게 단계별로 질문을 던지면서 학생 스스로 답에 도달하게 유도한다.
이 방식이 효과적인 이유가 있다. 답을 바로 보여주면 학생은 "아, 이렇게 하는 거구나"하고 넘어가지만, 실제로 문제를 푸는 사고 과정을 경험하지 못한다. 소크라테스식 힌트는 그 사고 과정을 강제한다. AI는 이 역할을 매우 잘 한다. 인간 튜터와 달리 절대 지치지 않고, 같은 유형의 문제를 수백 번이라도 다른 방식으로 힌트를 줄 수 있다.
하버드 연구의 AI 튜터도 비슷한 원칙으로 설계되었다. 한 번에 한 단계씩만 안내하고, 전체 풀이를 한꺼번에 공개하지 않고, 학생이 먼저 생각해보도록 유도했다. 이런 교육학적 원칙이 적용된 AI 튜터와, ChatGPT에 그냥 질문을 던지는 것 사이에는 큰 차이가 있다.
AI가 못하는 것: 계속 돌아오게 만드는 힘
그런데 문제가 있다. 학생들이 AI 튜터와 한두 번 좋은 경험을 해도, 꾸준히 사용하지 않는다.
이건 우리가 직접 경험한 현실이다. 초기 사용자들의 반응은 좋았다. "신기하다", "도움이 된다", "편하다". 하지만 시간이 지나면서 사용 빈도가 떨어졌다. AI가 좋은 선생님이라는 건 인정하지만, 매일 그 선생님을 찾아가게 만드는 무언가가 부족했다.
왜 그런가. 지식을 전달하는 것과 학습을 지속하게 만드는 것은 근본적으로 다른 문제이기 때문이다.
학습을 지속하게 만드는 것은 지적 자극이 아니다. 감정의 문제다. 수학 문제를 풀다가 막힐 때의 좌절감. 언어를 배우다가 발전이 안 느껴질 때의 무력감. 시험 전날 "왜 진작 안 했을까"라는 후회. 이런 감정을 관리하는 것, 작은 성취감을 느끼게 하는 것, "내가 성장하고 있다"는 실감을 주는 것 — 이것이 학습 지속의 핵심이다.
현재 대부분의 AI 튜터링은 이 부분이 약하다. 지식을 잘 전달하지만, 학습자의 감정 상태에는 별로 관심이 없다.
진짜 튜터는 심리 코치다
좋은 과외 선생님을 떠올려 보자. 그 사람이 가르치는 내용 자체는 교과서에 다 있다. 하지만 좋은 선생님이 특별한 이유는 다른 데 있다.
문제를 풀다가 막혀서 짜증이 날 때, "이 부분은 원래 어려워. 여기까지 온 것만으로도 잘하고 있어"라고 말해준다. 세 번째로 같은 유형의 문제를 틀렸을 때, "괜찮아, 이번엔 여기만 다르게 해보자"라며 좌절감을 관리해준다. 시험 전에 불안해하면 "지난달에 비해서 이만큼 늘었잖아"라며 진행 상황을 보여준다.
이 역할이 바로 AI가 해줄 수 있는, 그리고 해줘야 하는 영역이라고 생각한다.
우리가 교육 앱을 만들면서 발견한 것은, AI의 심리적 지원이 예상보다 넓은 범위에서 작동한다는 것이었다. 단순한 격려를 넘어서, 네 가지 차원에서 효과가 있었다.
좌절감 관리. 학습자가 막히는 순간을 감지하고, 좌절감이 포기로 이어지기 전에 개입한다. "이 문제는 시간이 좀 걸려도 괜찮아"라는 한마디가 학습자를 붙잡는다.
작은 성취감 제공. 한 단계를 넘길 때마다 진행을 가시화한다. 사소해 보이지만, "지난주보다 3문제 더 풀었다"는 피드백이 학습을 지속하게 만드는 연료가 된다.
학습 동기 부여. 왜 이걸 배우는지, 이게 어디에 쓰이는지를 맥락에 맞게 상기시킨다. 수학 공식의 실제 활용 사례, 한국어 표현을 실제로 쓸 상황 등.
습관 형성. 매일 같은 시간에 10분만이라도 학습하는 루틴을 잡아주는 것. 이건 지식 전달과는 완전히 다른 차원의 역할이다.
인간 과외 선생님은 이 역할을 자연스럽게 한다. 하지만 비용이 비싸고, 항상 곁에 있을 수 없다. AI는 24시간 곁에 있을 수 있다. 문제는 AI가 이 역할을 의도적으로 설계하지 않으면 하지 않는다는 점이다. 지식 전달에만 최적화된 AI 튜터는 수학 문제를 잘 설명해줄 수 있지만, 학생이 좌절해서 앱을 닫는 순간에는 아무것도 하지 않는다.
숏폼에서 배우는 교육
여기서 한 가지 직관에 반하는 이야기를 하겠다. 숏폼과 SNS 중독에 대해서.
교육계에서 틱톡이나 인스타그램 릴스를 이야기하면 대부분 부정적이다. 집중력을 해치고, 깊은 사고를 방해하고, 학생들을 수동적 소비자로 만든다. 다 맞는 이야기다.
하지만 나는 다르게 보고 있다. 숏폼 플랫폼이 수억 명의 사용자를 매일 수십 분씩 붙잡아두는 데는 이유가 있다. 그 매커니즘을 교육에 적용할 수 있지 않을까?
숏폼이 사람을 붙잡는 핵심 매커니즘은 크게 세 가지다.
짧은 단위로 나누기. 15초, 30초, 60초. 하나의 콘텐츠가 끝나는 순간 다음이 시작된다. 인지 부하가 낮고, "하나만 더"의 심리가 작동한다.
즉각적 피드백. 좋아요, 댓글, 조회수. 콘텐츠를 올리든 소비하든, 행동에 대한 반응이 즉시 온다.
사회적 연결. 혼자 보는 것 같지만, 댓글로 연결되어 있고, 친구와 공유하고, 같은 관심사의 커뮤니티가 형성된다.
이걸 교육에 그대로 가져오라는 이야기가 아니다. 하지만 교육 콘텐츠의 구조를 이 방향으로 재설계할 수 있다. 한 시간짜리 강의를 5분짜리 마이크로 레슨 12개로 쪼개고, 각 레슨을 끝낼 때마다 즉각적 피드백을 주고, 같은 과목을 공부하는 학습자끼리 연결하는 것이다.
흥미로운 관찰이 있었다. 우리 앱의 초기 사용자 중 대학원생들의 사용 패턴이 특히 눈에 띄었다. 빠르게 많은 양의 학습을 해야 하는 사람들이 AI 튜터링의 가치를 가장 먼저 체감했다. 그리고 이들의 사용 패턴을 보니, 짧은 세션을 자주 반복하는 형태였다. 한 번에 2시간 공부하는 것이 아니라, 10~15분씩 하루에 여러 번. 숏폼에 익숙한 세대의 학습 패턴과 닮아 있었다.
이건 숏폼이 교육을 망친다는 통념과 정반대의 시사점을 준다. 숏폼에 익숙한 세대의 인지 구조를 거부하는 대신, 그 구조에 맞게 교육을 설계하면 오히려 학습 효과가 높아질 수 있다.
AI 튜터링이 가야 할 방향
이 모든 이야기를 종합하면, AI 튜터링의 미래는 "더 똑똑한 지식 전달"이 아니라 "더 좋은 학습 경험 설계"에 있다고 생각한다.
구체적으로 세 가지 방향이 보인다.
첫째, 과정 중심의 교육. 답을 알려주는 것이 아니라, 답에 도달하는 과정을 돕는 것. 소크라테스식 접근이 AI에서 특히 효과적인 이유는, AI가 학생의 현재 이해 수준을 실시간으로 파악하고 그에 맞는 힌트를 줄 수 있기 때문이다. 같은 문제를 틀려도, 어디서 막히느냐에 따라 다른 힌트를 준다. 이건 30명이 앉아 있는 교실에서는 불가능한 일이다.
둘째, 심리적 동반자로서의 AI. 지식을 전달하는 역할에 더해, 학습 과정에서 발생하는 감정을 관리하는 역할. 좌절감, 불안, 무력감, 번아웃. 이런 것들이 학습을 중단시키는 진짜 이유다. AI가 이 부분을 담당하면, 지식 전달의 효율(하버드 연구의 2배)과 학습 지속성을 동시에 잡을 수 있다.
셋째, 학습의 구조를 시대에 맞게 재설계. 숏폼 세대의 인지 패턴에 맞춘 bite-sized 학습, 즉각적 피드백 루프, 커뮤니티 기반 사회적 학습. 기존 교육의 내용은 유지하되, 전달 방식을 학습자의 실제 행동 패턴에 맞추는 것이다.
마치며
하버드 연구가 보여준 것은 AI 튜터링의 잠재력이다. 2배의 학습 효율은 진짜다. 하지만 그 잠재력은 아직 잠재력에 머물러 있다. 2주 동안 2배 효율을 달성하는 것과, 1년 동안 꾸준히 학습하게 만드는 것 사이에는 거대한 간극이 있다.
그 간극을 메우는 열쇠는 기술이 아니라 설계에 있다고 생각한다. AI 모델은 이미 충분히 똑똑하다. 부족한 건 그 똑똑함을 학습자의 감정과 행동 패턴에 맞게 설계하는 것이다. 더 좋은 모델이 나오기를 기다리는 것보다, 지금의 모델로 더 좋은 학습 경험을 만드는 것이 교육 AI의 진짜 과제다.
우리도 아직 답을 다 찾지 못했다. 하지만 수학 교육 앱에서 소크라테스식 힌트가 작동하는 걸 봤고, 한국어 교육 앱에서 AI 롤플레잉이 학습자를 몰입시키는 걸 봤고, 대학원생들이 숏폼 같은 패턴으로 학습하는 걸 관찰했다. 이런 조각들이 어떤 형태로 모일지는 아직 불확실하지만, 방향은 보이기 시작했다.
AI 튜터링의 미래는 "인간 선생님을 대체하는 것"이 아니다. "인간 선생님이 해주고 싶었지만 시간과 비용 때문에 못했던 것"을 해주는 것이다. 24시간 곁에 있으면서, 막힐 때마다 다른 방식으로 힌트를 주고, 좌절할 때 다독여주고, 작은 성취를 함께 기뻐해주는 존재. 그게 AI 튜터의 진짜 역할이다.
박비봉은 (주)달빛소프트의 CEO로, 200+ 대학에 학습 관리 시스템을 제공하며 AI 기반 교육의 미래를 탐구하고 있습니다.