서울의대 VISION ROAD 비전로드

LLM의 발전과 의학 연구의 전환

인공지능(Artificial Intelligence, AI)의 역사는 계산과 추론의 자동화에서 시작되었지만, 대규모 언어모델(Large Language Model, LLM)의 등장은 그 본질을 근본적으로 바꾸었다. 특히 GPT-4 이후의 모델들은 단순한 언어 생성기를 넘어, 데이터 분석, 코드 작성, 문헌 요약, 실험 설계, 논문 작성 등 학문적 작업의 거의 모든 단계를 지원할 수 있게 되었다.이제 연구자는 복잡한 통계 명령어나 프로그래밍 언어를 몰라도 자연어로 분석을 요청하고, 결과를 표와 그림으로 확인하며, 그 의미를 토론할 수 있다. 이는 연구 수행의 기술적 장벽을 획기적으로 낮추어 학문적 창의성에 더 많은 시간을 할애할 수 있게 한다.
의학 연구와 교육에서도 이러한 변화는 이미 현실이 되었다. ChatGPT, Claude, Gemini 등 다양한 LLM이 논문 초안 작성, 데이터 해석, 연구 디자인 검토, 심지어 IRB 신청서 작성까지 보조하고 있다. 이러한 변화는 단순한 효율성의 문제가 아니라 연구 윤리, 사고 구조, 교육 철학의 문제로 확장된다. AI가 생성한 분석 결과를 그대로 인용하거나, LLM이 작성한 문장을 비판 없이 수용할 때 발생하는 왜곡과 책임의 문제는 결코 가볍지 않다. 따라서 우리는 ‘AI를 쓸 것인가, 말 것인가’의 단계가 아니라, ‘어떻게 쓸 것인가, 어떻게 가르칠 것인가’의 단계에 도달해 있다.

논문 작성의 변화: 데이터 분석과 글쓰기의 혁신 데이터 분석: 코드 해석기(Code Interpreter)의 시대

생성형 AI의 등장은 의학 연구 현장의 분석 패러다임을 근본적으로 바꾸고 있다. 과거에는 통계나 프로그래밍 언어(R, Python 등)에 대한 숙련도가 연구 수행의 전제였다. 그러나 ChatGPT의 Code Interpreter 기능을 통해 이제는 코드를 몰라도 분석이 가능한 시대가 열렸다. 사용자는 단순히 데이터 파일을 업로드하고, “이 데이터를 이용해 그룹 간 LDL-C 차이를 비교해줘” 또는 “이 변수로 Cox 회귀분석을 시행해줘”라고 요청하면 된다. 이 과정에서 ChatGPT는 통계 코드를 자동으로 생성하고 실행하며, 결과를 표나 그래프로 시각화해 준다. 연구자는 코드를 해석하거나 수정할 필요 없이, 분석의 논리적 타당성과 결과 해석에 집중할 수 있다. 다만 ChatGPT는 범용 언어모델로서 의학 통계에 특화되어 있지 않아, 동일한 분석을 반복하더라도 결과의 재현성이 일정하지 않다는 한계가 있다. 이러한 문제를 보완하기 위해 필자는 의학 연구용으로 특화된 MediStat GPTs 시리즈를 개발하였다. 이 시리즈는 각 통계 분석 목적에 맞게 구조화된 프롬프트 체계와 검증된 분석 절차를 내장하고 있어, 연구자가 보다 신뢰도 높은 결과를 얻을 수 있도록 설계되었다. 예를 들어 MediStat-KM은 Kaplan–Meier 생존분석을 수행하도록 커스터마이즈된 GPT로, 사용자는 단순히 데이터 파일을 업로드하고 grouping variable, event variable, time-to-event variable을 지정하기만 하면 된다. 모델은 자동으로 생존 곡선을 생성하고 log-rank p-value 등 주요 통계 지표를 계산하여 시각화까지 제시한다. 이를 통해 연구자는 복잡한 코드 작성 없이도 임상적 함의를 빠르게 도출할 수 있으며, 동일한 입력 조건에서는 항상 일관된 결과를 재현할 수 있다. 이러한 Custom GPT는 누구나 자신이 원하는 작업에 맞게 규칙을 정의함으로써 제작하여 사용할 수 있다.

글쓰기: 프롬프트 설계가 논리 전개의 핵심

논문 작성 단계에서도 ChatGPT는 막강한 도움을 제공한다. 그러나 “이 주제로 논문 써줘”라는 단순 지시로는 결코 수준 높은 결과물을 얻을 수 없다. AI의 본질은 ‘지시된 사고를 언어로 전개하는 시스템’이기 때문이다. 따라서 연구자가 먼저 논리적 구조를 명확히 정의해야 한다.
예를 들어, ‘Introduction’에서는 연구의 배경과 미충족 의료 필요(Unmet Healthcare Needs)를, ‘Methods’에서는 연구 설계와 분석 절차를, ‘Results’에서는 핵심 수치를 중심으로 한 결과를, ‘Discussion’에서는 임상적 의미와 한계에 대해 구체적인 내용과 논리의 흐름을 알려줘야 한다.좋은 프롬프트란 각 섹션의 역할과 논리적 연결 고리를 구체적으로 제시하는 것이다. “이 연구에서 제시하는 새로운 가설은 무엇인가?”, “어떤 데이터가 이를 뒷받침하는가?”, “임상적 함의는 무엇인가?”와 같은 질문을 포함한 프롬프트를 ChatGPT에 제공하면 훨씬 정교하고 논리적인 글을 생성할 수 있다.
즉, 프롬프트 설계는 이제 논문 작성의 새로운 문법이 되었다. 하지만 단순히 구조를 알려주는 것만으로는 충분하지 않다. 연구자는 AI가 제안한 문장 하나하나의 논리적 일관성과 근거를 검토하며, 문체와 논조, 인용 방식을 스스로 조정해야 한다. AI가 생성한 텍스트는 언제나 ‘가능한 표현’ 중 하나에 불과하다. 그것을 학문적 주장으로 전환하는 과정은 전적으로 연구자의 몫이다.
이때 필요한 것이 바로 프롬프트 리뷰(Prompt Review) 과정이다. AI가 작성한 초안을 그대로 수용하기보다, 연구자는 “이 주장의 근거가 충분한가?”, “이 문단의 논리 흐름이 결과와 일치하는가?”와 같은 질문을 던지며 수정해야 한다. 이러한 순환적 피드백은 비판적 사고를 보완하며, 결과적으로 훨씬 완성도 높은 원고를 만든다.
프롬프트 설계는 단순한 언어 지시가 아니라, 논리의 프레임을 설정하는 행위다. 어떤 문제를 중심으로 서술할지, 어떤 데이터를 강조할지, 어떤 해석의 축을 선택할지가 모두 프롬프트 설계에 의해 결정된다. 따라서 훌륭한 프롬프트를 설계하려면 주제에 대한 충분한 이해와 데이터 구조의 인식, 그리고 연구 목적을 꿰뚫는 논리적 사고가 선행되어야 한다. AI와의 대화를 반복하며 초안을 다듬는 과정은 글쓰기의 효율성을 높이는 동시에, 자신의 논리적 약점을 스스로 발견하게 한다. 결국 프롬프트 설계의 수준은 논문 품질을 결정짓는 핵심 요인이다. 무성의한 지시로는 피상적인 텍스트만 얻을 뿐이지만, 연구자의 문제의식이 반영된 정교한 프롬프트는 AI로 하여금 논리적 일관성과 학문적 설득력을 갖춘 글을 생성하게 한다. 프롬프트는 더 이상 단순한 입력문이 아니라, 논문 작성의 설계도이자 연구자의 사고 체계 그 자체다.

논문 지도의 변화: ‘빨간펜’에서 ‘프롬프트 피드백’으로

과거의 논문 지도는 학생이나 전임의가 작성한 초고를 한 줄 한 줄 수정하는, 소위 ‘빨간펜’ 중심의 방식이었다. 문장의 흐름과 어법을 다듬는 세밀한 교정은 여전히 중요하지만, 생성형 AI가 연구 작성 과정에 깊이 개입한 지금, 이러한 전통적 방식만으로는 학문적 성장을 이끌기 어렵다.
AI의 활용을 제한하는 것은 현실적으로 불가능하며, “과학은 후진하지 않는다”는 말처럼 이전 시대로 되돌아갈 수도 없다. 이제 지도자의 역할은 단순히 텍스트를 고치는 ‘편집자’가 아니라, AI를 통해 사고를 확장하고 논리를 구성하도록 돕는 ‘사고의 코치’로 바뀌어야 한다. 학생이 어떤 프롬프트를 사용했는지, 왜 그 프롬프트를 선택했는지, 그리고 그 결과를 어떻게 해석했는지를 함께 검토하는 과정이 중요하다. 즉, 논문 지도는 결과물이 아닌 사고의 과정을 지도하는 일로 전환되고 있다.
필자가 제안하는 새로운 지도 방식은, 학생이 제출한 완성된 원고뿐 아니라 원고를 작성하기 위해 사용한 프롬프트를 함께 검토하는 것이다. 프롬프트에는 작성자의 가설에 대한 호기심, 연구 설계의 이해, 데이터 해석의 방향성이 드러난다. 이를 통해 지도자는 학생이 단순히 AI의 출력을 모방했는지, 아니면 자신의 통찰을 반영했는지를 구분할 수 있다. 나아가 프롬프트와 결과물의 일관성, 논리 전개의 흐름, 용어의 선택 등을 함께 분석하면, 연구자가 어떤 수준의 비판적 사고를 발휘했는지 객관적으로 파악할 수 있다. 이러한 방식은 논문 지도의 철학 자체를 바꾼다.
과거에는 ‘정답’을 찾아내는 것이 교육의 목표였다면, 이제는 사고의 구조를 점검하고 언어화의 기술을 훈련하는 것이 핵심이다. 학생에게 “이 문장은 틀렸다”고 지적하기보다, “이 논리를 ChatGPT에 어떻게 설명했는가?”, “이 프롬프트가 결과에 어떤 영향을 주었는가?”를 묻는 것이 더 바람직하다. 이는 단순한 글쓰기 지도를 넘어, 연구자가 AI를 통해 스스로 사고를 확장하도록 돕는 ‘메타인지적 교육(Metacognitive education)’에 가깝다. AI 시대의 지도자는 ‘빨간펜’을 든 교정자가 아니라, 프롬프트와 결과물 사이의 논리적 가교를 점검하는 지적 협력자가 되어야 한다. 프롬프트를 잘 쓰는 능력은 곧 사고를 구조화하고 이를 언어로 표현하는 능력이며, 이는 AI 시대 연구자의 핵심 역량이자 새로운 학문적 문해력(AI literacy)이다.

빨간펜에서 프롬프트로

생성형 AI와 의학 연구·교육의 새로운 패러다임