생성형 AI는 인간의 창의성을 높여줄 것인가. ChatGPT, Claude, Midjourney 같은 도구가 일상화되면서 이 질문은 더 이상 먼 미래의 논쟁이 아니다. 글쓰기, 디자인, 광고, 음악, 영상, 교육 현장에서 AI는 이미 창작 과정에 들어와 있다. 그러나 중요한 질문은 여전히 남아 있다. AI가 창작물을 만들어준다고 해서 인간의 창의성이 자동으로 커지는가.
McGuire, De Cremer, Van de Cruys의 2024년 논문 Establishing the importance of co-creation and self-efficacy in creative collaboration with artificial intelligence는 이 질문에 정교한 답을 제시한다. 논문의 결론은 단순하다. AI와 함께 창작한다고 해서 언제나 창의성이 높아지는 것은 아니다. 오히려 AI가 먼저 결과물을 제시하고 인간이 그것을 고치는 ‘편집자’ 역할에 머물면 창의성은 낮아질 수 있다. 반대로 인간이 AI와 번갈아 창작하며 방향을 주도하는 ‘공동창작자’가 될 때, AI 협업의 창의적 효과가 살아난다.
이 논문이 중요한 이유는 생성형 AI 논쟁의 초점을 바꾼다는 데 있다. 지금까지 많은 논의는 AI 모델이 얼마나 창의적인가에 집중해왔다. AI가 인간처럼 시를 쓸 수 있는가, 이야기를 만들 수 있는가, 이미지를 생성할 수 있는가가 핵심 질문이었다. 그러나 이 연구는 질문을 바꾼다. 중요한 것은 AI가 혼자 얼마나 창의적인가가 아니라, 인간이 AI와 어떤 관계 속에서 창작하느냐다.
연구진은 인간-AI 창의적 협업에서 인간이 맡는 역할에 주목했다. 인간이 AI가 만든 초안을 받아 수정하는 ‘편집자’가 되는가, 아니면 AI와 함께 한 줄씩 창작을 이어가는 ‘공동창작자’가 되는가에 따라 결과가 달라진다는 것이다. 이 차이는 단순한 인터페이스 차이가 아니다. 인간이 창작 과정에서 자신을 어떻게 인식하는지, 자신의 창의적 능력을 얼마나 믿는지, 즉 창의적 자기효능감에 직접적인 영향을 준다.
논문의 실험 대상은 시 쓰기였다. 시는 인간 창의성의 대표적 표현 양식 중 하나다. 연구진은 두 개의 실험을 통해 인간 단독 창작, 인간-AI 협업, AI 단독 창작 또는 공동창작형 인간-AI 협업의 결과를 비교했다. 특히 창의성 평가는 참가자 본인의 자기평가에만 의존하지 않았다. 전문 시인 10명이 익명으로 시의 창의성을 평가하는 방식, 즉 창의성 연구에서 널리 쓰이는 Consensual Assessment Technique을 활용했다. 이는 연구의 신뢰도를 높이는 중요한 방법론적 장점이다.
첫 번째 연구는 101명의 참가자를 모집해 진행됐다. 최종 분석에는 주의력 검사를 통과한 96명이 포함됐다. 참가자는 두 조건 중 하나에 배정됐다. 한 집단은 아무 도움 없이 직접 8행짜리 시를 썼다. 다른 집단은 AI가 먼저 생성한 시를 받은 뒤, 이를 자유롭게 수정해 최종 시를 제출했다. 연구진은 여기에 AI가 단독으로 생성한 시 50편도 추가해 비교 기준을 만들었다.
AI 협업 조건의 인터페이스는 단순하지 않았다. 참가자는 AI가 만든 시의 각 행을 직접 수정할 수 있었고, 대체 문장 후보를 드롭다운으로 선택할 수도 있었다. 특정 행을 수정하면 그에 맞춰 다른 후보 행도 갱신됐다. 즉, 연구진은 인간-AI 협업 조건을 허술하게 설계하지 않았다. 참가자에게 꽤 높은 수준의 편집 자유를 제공했다.
그럼에도 결과는 예상과 달랐다. 참가자가 혼자 쓴 시가 인간-AI 협업 조건의 시보다 더 창의적이라는 평가를 받았다. 전문 시인들이 평가한 창의성 점수에서 인간 단독 조건은 평균 18.23점, 인간-AI 조건은 12.55점, AI 단독 조건은 9.45점이었다. 인간-AI 조건은 AI 단독보다는 높았지만, 인간 단독 창작에는 크게 미치지 못했다. 참가자의 자기평가에서도 인간 단독 조건이 인간-AI 조건보다 더 창의적이라고 평가됐다.
이 결과는 중요한 경고를 던진다. AI가 창작 과정에 들어왔다고 해서 자동으로 인간 창의성이 증강되는 것은 아니다. 오히려 AI가 먼저 결과물을 제시하고 인간이 그것을 수정하는 구조에서는 인간이 AI의 초기 결과물에 묶일 수 있다. 이를 심리학적으로는 앵커링 효과로 볼 수 있다. 처음 제시된 초안이 기준점이 되고, 사람은 그 기준점에서 충분히 벗어나지 못한다. 결과적으로 인간은 적극적 창작자가 아니라 소극적 수정자가 된다.
연구진은 이 문제를 ‘편집자 역할’의 한계로 해석한다. 편집자는 기본적으로 누군가가 만든 결과물을 평가하고 고치는 사람이다. AI가 먼저 창작물을 만들고 인간이 이를 고치는 구조에서는 AI가 창작의 방향을 선점한다. 인간은 반응하는 위치에 놓인다. 이때 인간은 자신이 창작의 주체라는 감각을 덜 느낄 수 있다. 창의성은 자유로운 탐색과 자기 확신에서 나오는데, 편집자 역할은 그 가능성을 좁힐 수 있다.
두 번째 연구는 이 한계를 극복할 수 있는지 살폈다. 참가자는 152명이었고, 세 조건으로 나뉘었다. 첫째는 인간 단독 창작 조건이다. 둘째는 첫 번째 연구와 유사하게 AI가 먼저 시를 생성하고 인간이 편집하는 인간-AI 조건이다. 셋째는 새롭게 설계된 공동창작형 인간-AI 조건이다.
공동창작형 조건의 핵심은 인간이 창작을 시작한다는 점이다. 참가자는 먼저 시의 주제가 될 세 개의 단어 묶음을 선택했다. 예를 들어 “sorrow, longing, admiration” 같은 주제어 세트를 고르는 방식이다. 이후 참가자가 첫 번째 행을 쓰면 AI가 두 번째 행을 생성하고, 다시 참가자가 세 번째 행을 쓰면 AI가 네 번째 행을 생성한다. 이런 식으로 인간과 AI가 번갈아 시를 완성한다. 참가자는 중간에 AI가 생성한 행도 수정할 수 있었다.
이 구조는 첫 번째 연구의 편집자 모델과 다르다. 인간은 AI가 완성한 결과물을 사후 수정하는 사람이 아니다. 인간이 주제를 정하고, 첫 행을 쓰고, AI의 반응을 받아 다시 이어간다. 창작은 고정된 초안에서 출발하지 않고, 인간과 AI 사이의 대화처럼 진행된다. 연구진은 이 방식이 인간의 창의적 자기효능감을 높일 것이라고 보았다.
결과는 연구진의 예측과 일치했다. 창의적 자기효능감은 인간-AI 편집 조건에서 가장 낮았다. 인간 단독 조건은 평균 4.71점, 공동창작형 인간-AI 조건은 4.62점, 일반 인간-AI 편집 조건은 3.74점이었다. 공동창작형 조건은 인간 단독 조건과 통계적으로 차이가 없었고, 편집자형 인간-AI 조건보다 유의하게 높았다.
자기평가 창의성도 비슷한 패턴을 보였다. 인간 단독 조건은 평균 23.29점, 공동창작형 인간-AI 조건은 21.16점, 편집자형 인간-AI 조건은 16.96점이었다. 공동창작형 조건은 인간 단독 조건과 유의한 차이가 없었고, 편집자형 조건보다 높았다.
전문 시인들의 평가에서도 같은 방향이 확인됐다. 인간 단독 조건은 평균 15.74점, 공동창작형 인간-AI 조건은 14.70점, 편집자형 인간-AI 조건은 12.53점이었다. 공동창작형 인간-AI 조건은 인간 단독 창작과 유의한 차이가 없었고, 편집자형 인간-AI 조건보다 유의하게 높았다. 즉, AI 협업의 창의성 결핍은 인간을 공동창작자로 배치했을 때 사라졌다.
이 논문의 핵심 개념은 창의적 자기효능감이다. 창의적 자기효능감은 자신이 창의적인 결과물을 만들어낼 수 있다는 믿음이다. 창작자는 이 믿음이 있을 때 더 적극적으로 아이디어를 내고, 실험하고, 실패를 감수하며, 낯선 표현을 시도할 수 있다. 반대로 자신이 창의적이지 않다고 느끼면 안전한 선택에 머물고, 기존 틀에서 벗어나지 못할 가능성이 커진다.
연구진은 매개분석을 통해 공동창작자 역할이 창의성 평가에 미치는 효과가 창의적 자기효능감을 통해 설명된다는 점도 확인했다. 편집자형 인간-AI 조건과 공동창작형 인간-AI 조건을 비교했을 때, 공동창작형 조건은 창의적 자기효능감을 높였고, 높아진 자기효능감은 전문가의 창의성 평가 향상으로 이어졌다. 이는 단순히 인터페이스가 편리해서 결과가 좋아진 것이 아니라, 인간이 자신을 창작 주체로 느끼게 만드는 심리적 과정이 중요했다는 뜻이다.
이 지점에서 논문은 생성형 AI 활용에 대한 통념을 비판한다. 많은 기업과 기술 리더는 AI가 초안을 만들고 인간이 최종 판단을 하면 생산성이 높아질 것이라고 말한다. 실제로 많은 AI 도구도 이 방식으로 설계되어 있다. AI가 먼저 글, 이미지, 코드, 기획안을 만들고, 인간은 이를 선택하거나 수정한다. 그러나 이 연구는 창의적 작업에서는 이 방식이 최선이 아닐 수 있음을 보여준다.
창의성은 단순히 좋은 결과물을 고르는 능력만으로 나오지 않는다. 창의성은 방향을 세우고, 가능성을 열고, 시행착오를 겪고, 스스로 의미를 부여하는 과정에서 나온다. AI가 처음부터 완성된 결과물을 제시하면 인간은 그 결과물의 틀 안에서 사고하게 된다. 반면 인간이 먼저 방향을 정하고 AI가 그 흐름에 응답하면, 인간은 자신의 창의적 통제감을 유지할 수 있다.
이 논문은 인간-AI 인터페이스 설계에 중요한 시사점을 준다. 생성형 AI 도구는 단순히 더 좋은 초안을 빠르게 제공하는 데 집중해서는 안 된다. 사용자가 창작의 방향을 잡고, 과정 중간에 개입하고, AI와 상호작용하며, 스스로 창작하고 있다는 감각을 유지하도록 설계해야 한다. 좋은 AI 창작 도구는 인간을 대체하는 도구가 아니라, 인간이 자기 능력을 더 믿게 만드는 도구여야 한다.
교육 현장에도 시사점이 크다. 학생이 AI가 만든 글을 받아 고치는 방식으로만 AI를 사용하면, 학생은 글쓰기의 주체가 되기 어렵다. 반대로 학생이 주제를 정하고, 첫 문장을 쓰고, AI의 제안을 비판적으로 받아들이며, 다시 자신의 문장으로 이어가는 구조를 만들면 AI는 학습자의 창의적 자기효능감을 높이는 도구가 될 수 있다. AI 활용 교육의 핵심은 사용 금지냐 허용이냐가 아니라, 어떤 역할 구조를 설계하느냐다.
기업의 창작 업무에도 마찬가지다. 광고, 디자인, 콘텐츠 기획, 브랜드 스토리텔링에서 AI를 활용할 때, AI에게 먼저 완성안을 만들게 하고 인간이 고치는 방식은 효율적일 수 있지만 창의성을 약화시킬 위험이 있다. 특히 초안이 강력할수록 인간은 그 안에 갇힐 수 있다. 창의적 성과를 원한다면 AI가 처음부터 답을 내놓는 구조보다, 인간이 방향을 설정하고 AI가 대화식으로 반응하는 구조가 더 적합할 수 있다.
이 논문은 최근 AI 창작 논의에서 자주 등장하는 “AI가 인간을 대체할 것인가”라는 질문에도 다른 관점을 제시한다. 핵심은 대체 여부가 아니라 역할 배치다. 인간이 편집자로 밀려나면 AI는 창작의 중심을 차지한다. 그러나 인간이 공동창작자로 남아 있으면 AI는 인간의 사고를 확장하는 파트너가 될 수 있다. 같은 AI라도 인터페이스와 과업 구조에 따라 인간의 창의성을 억제할 수도, 보완할 수도 있다.
물론 한계도 있다. 첫째, 연구는 실험실 환경에서 진행됐고, 실제 창작 현장의 복잡성을 모두 반영하지는 못한다. 현실의 창작은 마감, 팀워크, 조직 문화, 시장 요구, 클라이언트 피드백 등 다양한 요인의 영향을 받는다. 둘째, 창작 과제는 시 쓰기에 한정됐다. 시는 창의성 연구에 적합한 장르이지만, 디자인, 영상, 음악, 코딩, 기획서 작성에서도 같은 결과가 나타날지는 추가 연구가 필요하다. 셋째, 참가자의 전문성 수준이 충분히 구분되지 않았다. 초보자와 전문 작가는 AI 초안을 받아들이는 방식이 다를 수 있다.
또 하나의 한계는 사용된 AI 시스템이다. 연구에 사용된 시 생성 시스템은 전문적으로 설계된 시스템이지만, GPT-4o나 Claude 3.5 같은 최신 범용 생성형 AI와는 다를 수 있다. 최신 AI는 더 유창하고 더 다양한 결과물을 만들 수 있다. 그러나 연구진은 AI 시스템의 성능이 좋아지더라도 공동창작자 역할의 중요성은 유지될 가능성이 있다고 본다. 오히려 AI가 더 강력해질수록 인간이 수동적 편집자로 밀려나지 않도록 설계하는 일이 더 중요해질 수 있다.
이 논문은 AI 공동창작 연구에 중요한 이론적 기여를 한다. 첫째, AI 협업의 효과를 결과물 품질만이 아니라 인간의 자기효능감이라는 심리적 메커니즘으로 설명했다. 둘째, 인간-AI 협업을 하나의 단일 형태로 보지 않고, 편집자형 협업과 공동창작자형 협업을 구분했다. 셋째, 창의성 평가에 전문 시인을 활용해 연구의 평가 타당성을 높였다. 넷째, AI 도구 설계에서 인간의 역할 경험이 창의적 성과를 좌우한다는 점을 실증적으로 보여줬다.
결국 이 논문이 던지는 메시지는 분명하다. 생성형 AI는 인간의 창의성을 자동으로 증강하지 않는다. AI가 먼저 결과물을 내놓고 인간이 그것을 손보는 방식은 효율적일 수 있지만, 창의적 자기효능감을 낮추고 창의적 결과를 약화시킬 수 있다. 반대로 인간이 방향을 정하고 AI와 함께 한 단계씩 만들어가는 구조는 인간의 창의성을 보존하고 강화할 수 있다.
AI 시대의 창작에서 가장 중요한 것은 AI가 얼마나 똑똑한가만이 아니다. 인간이 그 과정에서 어떤 위치에 놓이는가다. 인간이 편집자로 남을 것인가, 공동창작자로 설 것인가. 이 차이가 창의성의 차이를 만든다.
AI가 창의성을 살리는 조건은 명확해지고 있다. 인간이 먼저 말하고, AI가 응답하며, 다시 인간이 방향을 잡는 구조다. 창작은 결과물을 고르는 일이 아니라 가능성을 열어가는 과정이다. 생성형 AI가 진정한 창의성의 도구가 되려면, 인간에게 다시 창작의 주도권을 돌려줘야 한다.
![[논문 리뷰] AI는 창의성을 높이는가](https://metax-images-bucket.s3.ap-southeast-2.amazonaws.com/defaults/research6.webp)