AI x Tech2026.03.31· 8분

AI 에이전트가 코드의 90%를 쓰는 개발팀의 하루

박비봉

달빛소프트는 올해로 15년째 소프트웨어를 만들고 있다. 200+ 대학에 LMS를 공급하고, 삼성전자 등 기업의 교육 앱을 구축하고, 다양한 소비자들을 위한 서비스를 개발해왔다.

그런 우리 팀에서 지금 코드의 대부분을 AI 에이전트가 작성한다.

이 글은 "AI가 대단하다"는 이야기가 아니다. 우리가 실제로 어떻게 일하고 있는지, 무엇이 좋아졌고 무엇이 위험했는지, 그리고 이 변화가 단순히 "속도 향상"이 아니라 일하는 방식 자체의 전환이라는 것을 솔직하게 공유하려 한다.

전환은 갑자기 오지 않았다

2025년 하반기, 우리는 본격적으로 AI 중심 개발 체제로 전환했다. 물론 그 전에도 AI 코딩 도구를 이것저것 시도하고 있었다. 하지만 도구를 "보조적으로 쓰는 것"과 "중심에 놓는 것"은 완전히 다른 문제다.

초기에는 다양한 도구를 실험했다. 지금은 Claude Code의 Opus 모델만 쓴다. 압도적인 성능 차이가 있었기 때문이다. 여러 도구를 비교 평가하는 시간이 아까울 정도로, 하나의 도구가 확실히 앞서는 순간이 왔고, 그때부터 실험이 아니라 실전이 됐다.

흥미로운 건 팀원들의 반응이었다. 경력 많은 개발자들이 AI 도구를 적극적으로 수용했다. 이건 예상 밖이었다. 보통 경험이 많을수록 새로운 방식에 저항감이 있기 마련인데, 오히려 반대였다. 오래 개발해온 사람일수록 반복적인 작업의 고통을 잘 알고 있었고, AI가 그 부분을 가져가는 것에 거부감이 없었다.

우리 팀의 하루

지금 우리 팀의 하루를 들여다보면, AI 이전과는 구조 자체가 다르다.

아침: 설계와 방향 잡기

하루의 시작은 코드를 쓰는 것이 아니라 무엇을 만들 것인지 정의하는 것이다. 요구사항을 정리하고, 아키텍처를 설계하고, 어떤 접근이 맞을지 판단한다. 이 과정에서도 AI와 대화한다. "코워크"라고 부르는데, AI에게 설계 초안을 잡게 하고, 그걸 기반으로 사람이 판단하고 수정하는 방식이다.

중요한 건 여기서 AI는 제안자이지 결정자가 아니라는 점이다. "이 구조가 맞을까?"라고 물으면 AI는 여러 옵션을 제시하지만, 우리 시스템의 맥락, 기존 인프라와의 호환성, 고객의 요구사항을 종합해서 최종 판단하는 건 여전히 사람의 몫이다.

낮: AI가 코드를 쓴다

설계가 확정되면 본격적인 구현이 시작된다. 새로운 기능 개발, UI 구현, 버그 수정, 테스트 코드 작성, 더 나은 개선 방향 탐색까지 — 구현 단계의 거의 모든 작업을 AI 에이전트가 수행한다.

Claude Code로 작업을 지시하는 방식은 상황에 따라 다르다. 때로는 개발자가 직접 프롬프트를 작성하고, 때로는 CLAUDE.md에 프로젝트 컨텍스트를 정리해두고 서브에이전트 구조로 돌리기도 한다. 자동화된 파이프라인을 쓸 때도 있고, 상황에 따라 유연하게 조합한다. 거의 매주 AI 기술이 변하기 때문에, 하나의 고정된 워크플로우를 세우기보다 계속 적응하는 게 현실적이다.

저녁: 사람이 검증한다

AI가 만든 코드는 바로 프로덕션에 들어가지 않는다. 사람이 코드를 리뷰하고, 보안을 검토하고, 배포 판단을 내린다. 이 단계를 건너뛰면 안 된다는 걸 우리는 뼈아프게 배웠다.

보안 그룹을 멋대로 바꿔버린 날

AI 에이전트에게 기존 AWS 인프라의 보안 형상을 파악하는 작업을 맡겼다. 말 그대로 현재 보안 그룹 설정을 기록만 하면 되는 단순한 작업이었다. 형상만 읽어오는 거니까 안전할 거라고 생각했다.

AI는 형상을 파악하는 것에 그치지 않았다. 보안 그룹 설정을 자기 판단대로 변경해버렸다.

다행히 빠르게 발견해서 롤백했지만, 프로덕션 서비스에 영향이 갈 수 있는 상황이었다. 원인은 명확했다. AI 에이전트에게 "읽기만 해"라는 제약을 명시적으로 걸지 않았고, 에이전트는 "개선할 수 있으니 개선하겠다"는 판단을 스스로 내린 것이다.

이 사건 이후 우리가 바꾼 것들이 있다.

첫째, 위험한 인프라 작업은 반드시 읽기 전용 권한으로 실행한다. AI에게 "하지 마"라고 말하는 것만으로는 충분하지 않다. 시스템적으로 할 수 없게 만들어야 한다.

둘째, 작업 범위가 클수록 AI가 무엇을 하고 있는지 실시간으로 확인한다. 안전해 보이는 작업이 가장 위험하다. 안전하다는 판단 자체가 감시를 느슨하게 만들기 때문이다.

셋째, 인프라, 보안, 배포 관련 최종 실행은 사람이 직접 한다. AI가 스크립트를 작성하는 것은 괜찮지만, 실행 버튼은 사람이 누른다.

"빨라졌다"가 아니라 "달라졌다"

사람들이 가장 궁금해하는 게 "얼마나 빨라졌느냐"다. 솔직히 명확한 숫자를 말하기 어렵다. 거의 매주 AI 기술 자체가 변하고, 우리의 활용 방식도 계속 진화하기 때문이다.

몇 가지 체감할 수 있는 수준의 이야기를 하자면 이렇다.

새로운 제품의 초기 MVP 제작은 거의 10배 빨라졌다. 아이디어에서 동작하는 프로토타입까지의 시간이 극적으로 줄었다. 예전에 2주 걸릴 작업이 하루이틀이면 나온다.

기존 시스템의 유지보수는 50% 정도 빨라진 체감이다. 레거시 코드의 맥락을 파악하고, 사이드 이펙트를 고려하는 작업은 여전히 시간이 걸린다. AI가 코드를 빠르게 수정해도, 그 수정이 기존 시스템에 어떤 영향을 미칠지 판단하는 건 결국 경험 있는 개발자의 몫이다.

하지만 가장 중요한 변화는 속도가 아니다. 일의 성격 자체가 달라졌다.

AI 이전의 개발자는 "어떻게 구현할까"에 시간의 대부분을 썼다. 알고리즘을 짜고, API를 연결하고, 에지 케이스를 처리하는 데 하루의 대부분이 갔다. 지금은 그 시간이 "무엇을 만들 것인가", "이 방향이 맞는가", "더 좋은 접근은 없는가"에 쓰인다.

비유하자면, 예전에는 벽돌을 직접 쌓는 사람이었다면, 지금은 건축 도면을 그리는 사람에 가까워졌다. 벽돌 쌓기를 오래 해본 경험이 도면의 품질을 높여주지만, 하는 일 자체는 다르다.

AI 네이티브 세대

한 가지 흥미로운 관찰이 있다. 팀에서 가장 경험이 적은 개발자의 이야기다.

초기에는 걱정이 있었다. AI가 코드를 대부분 작성하면, 주니어 개발자의 실력 향상에 걸림돌이 되지 않을까? 직접 코드를 짜보는 과정에서 배우는 것들이 있는데, 그 기회가 줄어드는 것 아닌가? 실제로 본인도 "실력이 잘 안 느는 느낌"을 이야기한 적이 있다.

그런데 흥미로운 일이 일어났다. AI 모델의 성능이 좋아지면서, 그 개발자의 아웃풋도 함께 좋아진 것이다. AI를 잘 다루는 능력 — 정확한 요구사항을 정의하고, AI의 결과물을 평가하고, 방향을 조정하는 능력 — 자체가 하나의 실력이 되었다.

아마도 지금의 주니어 개발자들은 "AI 네이티브 세대"라고 불러야 할 것 같다. 그들의 학습 경로는 이전 세대와 다르다. for 루프를 손으로 100번 써보며 체득하는 대신, AI에게 올바른 지시를 내리고 결과물의 품질을 판단하는 방법을 먼저 배운다. 이게 더 좋은 것인지 나쁜 것인지는 아직 판단하기 어렵다. 분명한 건 다른 종류의 역량이라는 점이다.

여전히 사람이 해야 하는 것들

AI가 코드의 90%를 쓴다는 말이 "사람이 10%만 하면 된다"는 뜻은 아니다. 오히려 사람이 하는 10%의 중요성이 훨씬 커졌다.

아키텍처와 설계 의사결정. 어떤 기술을 쓸지, 시스템을 어떤 구조로 잡을지, 확장성과 유지보수성을 어떻게 균형 잡을지. 이건 해당 도메인에서 수년간 쌓은 경험이 필요한 판단이다. AI는 옵션을 제시하지만, 우리 상황에 맞는 최적의 선택을 내리는 건 사람이다.

요구사항 정의와 기획. 고객이 진짜 원하는 게 뭔지, 그걸 어떤 형태의 소프트웨어로 풀어야 하는지. 이건 기술 문제가 아니라 비즈니스와 사람에 대한 이해의 문제다.

보안 검토와 배포 판단. 앞서 보안 그룹 사건에서 배웠듯이, AI는 보안의 맥락을 완전히 이해하지 못한다. 프로덕션 환경에 영향을 미치는 결정은 반드시 사람이 내려야 한다.

그리고 하나 더. AI가 만든 결과물이 정말 괜찮은지 판단하는 것. AI는 자기가 만든 코드를 스스로 평가하면 "잘 됐다"고 말하는 경향이 있다. 실제로는 빠져 있는 엣지 케이스가 있거나, 기존 시스템과 충돌하는 부분이 있어도 그렇다. 이걸 잡아내려면 시스템 전체를 이해하는 사람의 눈이 필요하다.

이 변화가 고객에게 의미하는 것

우리가 AI 중심으로 전환한 이유는 단순히 빠르게 만들기 위해서가 아니다. 같은 팀 규모로 더 많은 문제를 풀 수 있게 되었다는 점이 핵심이다.

200+ 대학의 LMS를 운영하면서 들어오는 개선 요청, 새로운 기능 요구, 버그 리포트의 양은 항상 팀의 처리 능력을 초과했다. AI 에이전트 기반 개발은 이 병목을 근본적으로 바꾸고 있다. 구현에 걸리는 시간이 줄었으니, 설계와 검증에 더 많은 시간을 쓸 수 있고, 결과적으로 더 나은 제품을 만들 수 있다.

물론 이 변화는 현재 진행형이다. 거의 매주 AI 기술이 발전하고, 우리의 워크플로우도 계속 진화한다. 6개월 전의 우리와 지금의 우리는 일하는 방식이 다르고, 6개월 후에는 또 달라져 있을 것이다.

마치며

15년간 소프트웨어를 만들어오면서 이 정도 규모의 변화는 처음이다. 웹의 등장, 모바일 전환, 클라우드 이전 — 모두 큰 변화였지만, 코드를 쓰는 행위 자체는 변하지 않았다. 지금은 그 행위 자체가 변하고 있다.

남은 질문은 "AI를 쓸 것인가 말 것인가"가 아니다. "AI와 함께 일하는 방식을 얼마나 빨리 찾아내느냐"다. 우리도 아직 답을 다 찾지 못했다. 다만 확실한 건, 이 전환을 늦추는 것보다 부딪히면서 배우는 것이 훨씬 낫다는 점이다.