빠른 흐름
데이터 준비
-> 첫 행에 명확한 컬럼명
-> 한 행에 한 레코드
-> 빈 행과 병합 셀 제거
분석 요청
-> 알고 싶은 질문 명시
-> 필요한 계산, 그룹, 차트 종류 지정
-> 코드와 가정 검토분석 흐름
구조화된 파일일수록 분석 품질이 안정적이다
ChatGPT Data Analysis는 업로드한 파일을 읽고 표, 차트, 요약, 계산을 만들 수 있습니다. CSV, Excel, JSON, XML, YAML, 텍스트 파일처럼 구조가 분명한 자료가 적합합니다. 스캔 PDF나 이미지 안 표처럼 값 추출이 필요한 자료는 정확도가 떨어질 수 있습니다.
좋은 입력
-> clear column headers
-> one record per row
-> no merged cells
-> no blank sections inside table정확한 값이 중요하면 이미지 기반 표보다 스프레드시트나 텍스트 기반 파일을 올려야 합니다.
질문은 분석 목적과 계산 기준을 같이 적는다
"분석해 줘"만으로도 결과를 받을 수 있지만, 중요한 업무에서는 계산 기준을 명시해야 합니다. 어떤 컬럼을 기준으로 그룹화할지, 결측값을 어떻게 처리할지, 어떤 기간을 비교할지, 어떤 차트가 필요한지 적으면 결과가 더 재현 가능해집니다.
이 CSV에서 월별 매출 합계를 구해 주세요.
환불 상태가 cancelled인 행은 제외해 주세요.
결과는 표와 line chart로 보여 주세요.
계산에 사용한 컬럼과 제외한 행 수를 함께 설명해 주세요.분석 결과를 받을 때는 표만 보지 말고 사용한 가정, 제외한 데이터, 계산식, 차트 축을 함께 확인해야 합니다.
Python 기반 분석은 코드와 출력물을 같이 검토한다
일부 Data Analysis 작업에서는 ChatGPT가 Python 코드를 작성하고 stateful notebook 환경에서 실행할 수 있습니다. 이 환경은 세션에 제공된 파일을 사용하고, 필요하면 pandas DataFrame이나 차트를 보여줄 수 있습니다.
확인할 것
-> 어떤 파일을 읽었는가
-> 어떤 컬럼을 사용했는가
-> 결측값과 이상값을 어떻게 처리했는가
-> 차트 축과 단위가 맞는가정확한 분석이 필요하면 "사용한 코드와 주요 중간 결과를 보여 달라"고 요청해야 합니다. 코드가 보이면 잘못된 컬럼 선택이나 필터 조건을 더 쉽게 잡을 수 있습니다.
차트는 정적과 인터랙티브를 구분한다
ChatGPT는 정적 차트를 이미지로 만들 수 있고, 일부 차트는 인터랙티브로 표시될 수 있습니다. 공식 문서 기준으로 bar, line, pie, scatter chart가 인터랙티브로 지원될 수 있으며, 다른 차트는 정적 이미지로 나올 수 있습니다.
비교
-> bar chart
시간 흐름
-> line chart
비율
-> pie chart
상관관계
-> scatter chart차트 종류를 ChatGPT가 자동으로 고르게 할 수 있지만, 보고서 목적이 분명하면 차트 종류와 축을 직접 지정하는 편이 안전합니다.
준비 기준
| 상황 | 먼저 할 일 |
|---|---|
| CSV·Excel 분석 | 첫 행 컬럼명 정리 |
| 여러 표가 한 시트에 있음 | 파일 분리 또는 범위 지정 |
| 이미지 기반 표 | 가능한 원본 스프레드시트 사용 |
| 외부 데이터 필요 | 파일 업로드 또는 connector 연결 |
| 특정 계산 방식 필요 | 공식·필터·그룹 기준 명시 |
| 결과 검증 필요 | 코드, 중간 결과, 제외 조건 확인 |
주의할 점
Data Analysis의 Python 환경은 외부 웹 요청이나 API 호출을 할 수 없습니다. 외부 데이터가 필요하면 파일로 업로드하거나 사용 가능한 connected source를 먼저 연결해야 합니다.
파일이 업로드되었더라도 너무 크거나 복잡하면 전체가 분석되지 않을 수 있습니다. 결과가 짧거나 이상하면 특정 sheet, row 범위, column 목록을 지정하거나 파일을 나눠 다시 분석해야 합니다.
참고 링크
1 sources