빠른 흐름
Agent 요청 전 확인
1. 목표와 완료 조건을 한 문장으로 고정한다
2. 사용할 사이트, 파일, 앱 범위를 제한한다
3. 로그인이나 결제 같은 민감 단계는 직접 takeover한다
4. 중간 결과가 이상하면 즉시 중단하거나 수정 지시한다
5. 완료 후 출처, 스크린샷, 외부 변경 사항을 확인한다실행 구조
ChatGPT agent mode는 단순 질의응답보다 긴 온라인 작업에 맞는 표면입니다. 공식 문서 기준으로 웹사이트 탐색, 업로드 파일 작업, 앱 기반 자료 접근, 양식 입력, 스프레드시트 편집 같은 작업을 조합할 수 있습니다.
Visual browser
-> 웹 페이지 탐색과 클릭
Code interpreter
-> 파일 분석과 계산
Apps
-> 이메일, 문서, 저장소 같은 외부 자료 접근
Terminal
-> 지원되는 명령 실행시작은 tools menu에서 agent를 고르거나 composer에서 /agent를 입력하는 방식입니다. 작업을 시작하면 agent가 진행하다가 필요한 경우 확인이나 추가 정보를 요청할 수 있고, 사용자는 중간에 지시를 바꾸거나 중단할 수 있습니다.
Agent 요청은 "알아서 처리해줘"보다 범위를 좁게 주는 편이 안전합니다. 예를 들어 이메일 전체를 확인하라고 하기보다, 특정 날짜 범위와 목적을 정하고 읽기 전용 조사부터 시작시키는 방식이 낫습니다.
감독 기준
| 상황 | 기준 |
|---|---|
| 웹 조사와 비교 | 원문 링크와 스크린샷 확인 |
| 앱 연결 사용 | 필요한 앱만 켜고 범위 제한 |
| 로그인 필요 | takeover mode로 직접 입력 |
| 외부 변경 가능 | 실행 전 confirmation 확인 |
| 반복 작업 전환 | Tasks와 지원 범위 확인 |
| 민감 사이트 접근 | 중단 가능성과 쿠키 정리까지 고려 |
Agent는 편의성이 크지만 외부 사이트와 계정 상태에 직접 영향을 줄 수 있습니다. 특히 앱을 연결하거나 로그인한 사이트에서 작업할 때는 읽기 작업과 쓰기 작업을 분리해야 합니다.
주의할 점
Agent가 웹과 앱을 함께 쓰면 prompt injection, 과도한 권한 사용, 의도하지 않은 외부 변경 위험이 생깁니다. 필요한 앱만 활성화하고, 결제·공유·설정 변경처럼 영향이 큰 행동은 직접 확인하세요.
또 agent의 브라우저 스크린샷과 browsing history는 대화 기록과 함께 보존될 수 있습니다. 민감한 작업 후에는 관련 대화 삭제, 앱 권한, 쿠키 정리 여부를 함께 확인해야 합니다.
참고 링크
1 sources