ChatGPT 데이터 분석하는 법 — 엑셀 업로드부터 시각화까지 4단계

엑셀 데이터 1,000행. 수작업으로 정리하면 2시간, ChatGPT에 올리면 5분이다. 파일 업로드 한 번에 요약, 이상치 탐지, 차트 생성까지 전부 된다. 4단계만 따라 하면 끝이다.

ChatGPT 데이터 분석 4단계 썸네일

목차

Step 1: ChatGPT에 엑셀 파일 업로드하기

ChatGPT Plus 이상 플랜(월 $20)에서 파일 업로드가 된다. 무료 플랜도 제한적으로 올릴 수 있지만, 코드 실행 횟수에 한계가 있어서 데이터 분석 용도라면 Plus가 최소 조건이다.

업로드 방법은 간단하다.

  1. ChatGPT 대화창 왼쪽 하단의 클립(📎) 아이콘을 클릭한다
  2. 엑셀 파일(.xlsx) 또는 CSV 파일을 선택한다
  3. 파일이 올라가면 아래 프롬프트를 복붙한다
이 데이터의 구조를 설명해줘. 행 수, 열 이름, 각 열의 데이터 타입, 결측값 여부를 표로 정리해줘.

ChatGPT가 내부적으로 Python(pandas)을 실행해서 데이터 구조를 분석해 준다. 2026년 3월 기준 최대 512MB까지 올릴 수 있고, .xlsx·.csv·.tsv·.json 형식을 지원한다.

주의점 하나. 셀 병합이 있는 엑셀은 구조가 깨진다. 올리기 전에 병합을 풀거나, CSV로 변환해서 올리자.

ChatGPT 데이터 구조 분석 결과 — 열 이름, 데이터 타입, 결측값 정리

Step 2: 데이터 요약과 기초 분석 요청하기

구조 확인이 끝났으면 바로 기초 분석으로 들어간다. 핵심은 “분석해줘”라고만 하지 않는 거다. 목적을 명시해야 쓸 만한 결과가 나온다.

기초 분석에 쓸 프롬프트 3가지:

1. 각 열의 기초 통계량(평균, 중앙값, 최솟값, 최댓값, 표준편차)을 표로 보여줘.
2. 결측값이 있는 열을 찾고, 결측 비율을 계산해줘.
3. [매출] 열 기준으로 상위 10개 행과 하위 10개 행을 뽑아줘.

대괄호 [매출] 부분을 자기 데이터의 실제 컬럼명으로 바꾸면 된다. ChatGPT는 pandas의 describe(), isnull().sum() 같은 함수를 자동으로 돌린다. 결과가 표 형태로 깔끔하게 출력된다.

팁 하나. “기초 통계량” 프롬프트만 던져도 수치형 열과 범주형 열을 알아서 구분해 준다. 근데 날짜 열은 자동 인식이 안 될 때가 있다. 그럴 땐 이렇게 추가하자:

[날짜] 열을 datetime 형식으로 변환하고, 월별로 그룹화해서 [매출]의 합계를 구해줘.

엑셀 함수로 이걸 하려면 SUMIFS에 피벗 테이블까지 조합해야 한다. ChatGPT 데이터 분석에선 프롬프트 한 줄이면 끝이다. 엑셀 함수가 필요한 경우라면 ChatGPT로 엑셀 함수 자동 만드는 법에서 다뤘으니 참고하자. 프롬프트를 구체적으로 쓰는 공식이 궁금하다면 ChatGPT 프롬프트 잘 쓰는 법 7가지도 도움이 된다.

Step 3: 차트와 시각화 만들기

여기서부터가 ChatGPT 데이터 분석의 진짜 강점이다. 엑셀에서 차트를 만들면 데이터 범위 선택 → 차트 유형 고르기 → 서식 조정 → 라벨 편집, 이 과정이 최소 10분이다. ChatGPT에선 한 줄이면 끝난다.

월별 매출 추이를 꺾은선 그래프로 그려줘. x축은 월, y축은 매출(만원). 제목과 라벨을 한글로 표시해줘.

ChatGPT가 matplotlib 또는 seaborn 라이브러리로 차트를 생성한다. 이미지가 대화창에 바로 뜨고, 클릭하면 다운로드도 된다.

자주 쓰는 시각화 프롬프트 3개:

  • 꺾은선 그래프: “월별 [지표] 추이를 꺾은선 그래프로 그려줘”
  • 막대 그래프: “[카테고리]별 [지표]를 막대 그래프로 비교해줘”
  • 히트맵: “열 간 상관관계를 히트맵으로 보여줘. 상관계수도 표시해줘”
ChatGPT 차트 생성 3종 — 꺾은선, 막대, 히트맵 프롬프트 비교

색상이나 스타일 수정도 자유롭다. “배경을 흰색으로 바꾸고, 막대 색상을 파란색 계열로 통일해줘”라고 하면 즉시 반영된다. 엑셀에서 차트 서식을 열다섯 번 클릭할 일이 없다.

한글 폰트 문제가 가끔 생긴다. 차트 라벨이 깨져 보이면 아래 프롬프트를 추가하자:

차트에 한글이 깨지지 않도록 NanumGothic 또는 Malgun Gothic 폰트를 적용해줘.

GPT-4o 기준으로 이 요청을 넣으면 matplotlib.rcParams에 폰트를 자동 세팅해 준다.

Step 4: 인사이트 추출과 보고서 초안 뽑기

데이터 요약과 시각화까지 끝났으면, 마지막 단계다. “그래서 뭘 알 수 있는데?”에 답을 내는 구간이다.

이 데이터에서 발견되는 주요 패턴 3가지와 이상치를 찾아줘. 각 패턴에 대한 가능한 원인도 함께 분석해줘.

ChatGPT가 통계적 이상치(IQR 방식 또는 Z-score)를 자동 탐지하고, 트렌드 변화 지점도 짚어준다. 다만 이건 AI의 추론이다. 최종 판단은 사람이 해야 한다.

보고서 초안이 필요하면 이렇게 요청한다:

위 분석 결과를 바탕으로, 경영진 보고용 요약을 작성해줘.
구조:
1) 핵심 발견 3개 (각 2문장)
2) 데이터 기반 제안 2개
3) 추가 분석이 필요한 항목 1개
한국어 격식체로 써줘.

이 프롬프트 하나면 보고서 초안이 나온다. 보고서 작성 프롬프트가 더 필요하다면 AI로 업무 보고서 10분 만에 쓰는 법에서 템플릿 5개를 정리해 뒀다.

프로 팁 3가지

CSV로 변환하면 분석 속도가 2배 빨라진다

.xlsx 파일에는 셀 서식, 조건부 서식, 수식 같은 메타데이터가 붙어 있다. ChatGPT가 이걸 해석하느라 시간을 쓴다. 엑셀에서 “다른 이름으로 저장 → CSV(쉼표로 분리)”를 한 번만 해주면 업로드와 분석 모두 빨라진다.

컬럼명을 영어로 바꾸면 코드 에러가 줄어든다

ChatGPT의 Python 코드 생성은 영어 컬럼에서 정확도가 더 높다. “매출액” 대신 “revenue”, “거래처” 대신 “client”. GPT-4o 기준 한글 컬럼도 대부분 처리하지만, 컬럼명에 괄호나 슬래시가 섞이면 에러율이 확 올라간다. 깔끔한 영어 컬럼명이 가장 안정적이다.

대용량 데이터는 샘플링부터

10만 행 이상이면 전체를 한 번에 돌리지 말자. “처음 1,000행으로 먼저 분석해줘. 패턴이 확인되면 전체에 적용할게”라고 단계적으로 접근하면, 토큰도 아끼고 분석 속도도 빨라진다.

흔한 실수 4가지

  1. 병합 셀 그대로 올리기 — ChatGPT가 병합 셀을 NaN으로 읽는다. 업로드 전에 “병합 해제 → 빈 칸 채우기”를 먼저 하자.
  1. 무료 플랜으로 본격 분석 시도 — 2026년 3월 기준, 무료 플랜은 코드 실행 횟수 제한이 있다. 차트 3~4개 만들다 보면 한도에 걸린다. 데이터 분석을 자주 쓸 생각이면 Plus($20/월)로 올리는 게 현실적이다.
  1. “분석해줘” 한 마디로 끝내기 — 목적 없이 던지면 기초 통계만 보여주고 끝난다. “전월 대비 매출 감소 원인을 찾아줘”처럼 분석 목적을 명시해야 실행 가능한 인사이트가 나온다.
  1. 한 대화에 파일 여러 개 올리기 — 대화가 길어지면 앞에서 올린 파일의 맥락을 잃는다. 파일당 새 대화를 열거나, “첫 번째 파일의 [매출] 열과 두 번째 파일의 [비용] 열을 병합해줘”처럼 명시적으로 지정하자.

자주 묻는 질문

ChatGPT 무료 플랜에서도 엑셀 데이터 분석이 되나?

제한적으로 가능하다. 2026년 3월 기준, 무료 플랜에서도 파일 업로드와 코드 실행이 되지만 횟수 제한이 있다. 차트 3~4개 만들다 보면 한도에 걸린다. 데이터 분석을 주 1회 이상 쓸 계획이라면 Plus($20/월)로 올리는 게 현실적이다. 무료로 쓸 수 있는 AI 도구와 병행하는 것도 방법이다.

ChatGPT가 분석한 결과를 그대로 보고서에 써도 되나?

초안으로는 쓸 만하지만, 그대로 제출하면 위험하다. ChatGPT가 숫자를 잘못 계산하거나 이상치를 놓치는 경우가 간혹 있다. 특히 소수점 반올림, 날짜 형식 인식에서 오류가 생길 수 있다. 핵심 수치는 원본 엑셀에서 반드시 대조하고, AI 결과는 분석의 출발점으로만 활용하자.

엑셀 대신 구글 스프레드시트 파일도 분석 가능한가?

구글 스프레드시트를 직접 업로드하는 건 안 된다. 대신 구글 스프레드시트에서 “파일 → 다운로드 → CSV” 또는 “.xlsx”로 내려받은 뒤 ChatGPT에 올리면 동일하게 분석된다. CSV 변환이 분석 속도도 더 빠르다.

10만 행 이상 대용량 데이터도 분석이 되나?

업로드는 가능하지만, 한 번에 전체를 분석하면 시간이 오래 걸리고 중간에 끊기는 경우가 있다. “처음 1,000행으로 먼저 분석해줘”라고 단계적으로 접근하는 게 안정적이다. 패턴이 확인되면 전체에 적용하는 방식으로 진행하면 토큰도 아끼고 정확도도 올라간다.


  • ChatGPT Plus에서 엑셀 파일 1개를 업로드하고 데이터 구조 확인하기
  • 기초 통계량 프롬프트를 복붙해서 내 데이터에 돌려 보기
  • 차트 1개를 생성하고 PNG로 다운로드해 보기

작성 기준: ChatGPT GPT-4o, 2026년 3월 기준. 파일 업로드는 Advanced Data Analysis(구 Code Interpreter) 기능으로 동작.

참고 출처:

마지막 확인: 2026-02-25