BananaNL Blog

ChatGPT / 4분

ChatGPT 이미지 입력 프롬프트: 스크린샷·문서·UI를 의도대로 읽히게 하기

ChatGPT 이미지 입력 프롬프트로 스크린샷, 문서 OCR, UI 리뷰를 목적에 맞게 진행하는 실무 가이드입니다. 볼 범위, 출력 형식, 추측 금지 조건까지 함께 정리합니다.

1분으로 보는 BananaNL

NotebookLM과 AI Chat에서 선택한 프롬프트가 입력창으로 들어가는 흐름을 짧게 볼 수 있습니다.

YouTube에서 보기

이미지를 올리는 것과 제대로 묻는 것은 다릅니다

ChatGPT에 이미지나 스크린샷을 첨부하면 화면 설명은 돌아와도, 실제로 필요한 판단 재료까지는 안 나오는 경우가 많습니다. 에러 원인, 글자 추출, UI 개선 중 무엇이 목적인지 먼저 말하지 않으면 답이 흐려지기 쉽습니다.

OpenAI의 ChatGPT Image Inputs FAQ는 이미지 입력이 사진, 문서, 시각 자료 분석에 유용하다고 설명하면서도, 애매한 이미지, 너무 작은 글자, 비라틴 문자, 회전된 이미지, 그래프의 색·선 차이에는 약점이 있다고 안내합니다. 그래서 보고 싶은 범위, 출력 형식, 추측하지 말아야 할 부분을 프롬프트에 넣는 것이 중요합니다.

잘 맞는 이미지 입력 프롬프트는 매번 검색하기보다 용도별로 저장해 두는 편이 더 안정적입니다.

ChatGPT 이미지 입력 프롬프트에서 볼 범위와 출력 형식을 나누는 추상 이미지

이미지 입력 프롬프트에서 먼저 정할 5가지

  1. 목적을 한 줄로 씁니다. 이미지 설명, OCR, UI 리뷰, 경쟁사 비교, 에러 원인 정리는 필요한 깊이가 다릅니다.
  2. 어디를 볼지 범위를 지정합니다. 화면 전체인지, 오른쪽 위 에러 문구인지, 표의 특정 구간인지 먼저 좁힙니다.
  3. 출력 형식을 고정합니다. 글머리표, 표, 핵심 3가지, 수정 제안, 확인 체크리스트 중 무엇이 필요한지 적습니다.
  4. 추측 금지 조건을 넣습니다. 읽히지 않는 글자나 화면 밖 정보는 보충하지 말고 `확인 필요`로 남기게 합니다.
  5. 필요하면 이미지도 손봅니다. 작은 글자는 확대하거나 잘라내고, 보고 싶은 위치는 표시를 넣으면 정확도가 좋아지기 쉽습니다.

먼저 넣을 4요소

이미지·스크린샷볼 범위출력 형식확인 필요

이 패턴이 잘 맞는 상황

스크린샷 확인에러 화면이나 설정 화면에서 보이는 사실과 추가 확인 항목을 나누고 싶을 때.
문서 OCR종이 자료, 화이트보드, PDF 스크린샷의 글자를 뽑고 정리하고 싶을 때.
UI 리뷰페이지 스크린샷으로 CTA, 여백, 읽는 순서, 불편한 지점을 점검하고 싶을 때.
업로드 실패 점검이미지가 첨부되지 않거나 분석이 잘 안 될 때 형식, 크기, 권한, 브라우저 문제를 순서대로 확인하고 싶을 때.

ChatGPT에서 써볼 이미지 입력 프롬프트

에러 화면 원인 나누기

이 스크린샷을 보고 표시된 에러 문구, 가능한 원인 후보, 다음에 확인할 항목을 나눠 주세요. 읽히지 않는 글자나 화면 밖 정보에 의존하는 내용은 추측하지 말고 `확인 필요`로 적어 주세요. 출력은 `보이는 사실`, `원인 후보`, `다음 확인 순서`의 3개 제목으로 정리해 주세요.

보이는 사실과 추론을 분리해 두면 AI가 단정적으로 말하는 위험을 줄일 수 있습니다.

이미지 속 글자를 표로 정리하기

이 이미지에 보이는 글자를 가능한 한 그대로 옮겨 적어 주세요. 그다음 `항목`, `내용`, `읽기 어려운 부분` 3개 열의 표로 정리해 주세요. 판독이 어려운 부분은 문맥으로 채우지 말고 불명으로 남겨 주세요.

OCR 결과와 불확실한 부분을 분리해 남길 수 있어 나중에 사람이 검토하기 쉽습니다.

UI 개선 우선순위 뽑기

이 웹페이지 스크린샷을 UI/UX 관점에서 검토해 주세요. CTA가 잘 보이는지, 정보 순서가 자연스러운지, 여백이 충분한지, 읽기 어려운 부분이 있는지를 보고 개선점 5가지를 우선순위 순으로 써 주세요. 화면에 보이지 않는 전환 흐름이나 성능 지표는 추측하지 말고, 스크린샷에서 판단 가능한 범위만 답해 주세요.

검토 관점과 범위를 고정해 두면 추상적인 감상보다 실제 수정으로 이어지는 답을 얻기 쉽습니다.

자주 쓰는 이미지 입력형은 BananaNL에 저장하기

이미지 입력 프롬프트는 스크린샷 확인용, OCR용, UI 리뷰용, 경쟁사 분석용처럼 용도마다 조금씩 다릅니다. 매번 같은 형식을 찾고 붙여넣기보다 자주 쓰는 패턴을 저장해 두는 편이 더 빠르고 덜 흔들립니다.

BananaNL은 선택한 프롬프트를 ChatGPT, Gemini, Grok 같은 AI Chat 입력창에 삽입하는 Chrome 확장 프로그램입니다. 자동 전송은 하지 않으므로 이미지를 첨부한 뒤 문장을 확인하고 사용할 수 있습니다. NotebookLM 사용은 무료로 시작할 수 있고, AI Chat 연동은 유료 기능입니다.

이미지 입력용 정형 프롬프트를 BananaNL에서 불러오는 추상 이미지

FAQ

ChatGPT 이미지 입력 프롬프트에서 먼저 무엇을 써야 하나요?

목적과 볼 범위입니다. 왜 이 이미지를 보여 주는지, 어디를 중점적으로 봐야 하는지 먼저 적으면 답이 훨씬 구체적해집니다.

작은 글자나 한국어·일본어 텍스트도 잘 읽나요?

항상 그렇지는 않습니다. 작은 글자와 비라틴 문자는 정확도가 떨어질 수 있으므로, 필요한 부분을 확대하거나 잘라내고 읽히지 않는 부분은 추측하지 말라고 지시하는 편이 안전합니다.

이미지 업로드가 안 될 때는 무엇부터 확인하나요?

형식과 크기, 새 채팅에서 재시도, 시크릿 모드나 확장 기능 간섭, 모바일 사진 권한, VPN이나 네트워크 문제를 순서대로 확인합니다.

프롬프트를 찾는 일이 번거롭다면 BananaNL

배운 프롬프트는 바로 쓸 수 있는 곳에 있어야 계속 사용됩니다. BananaNL로 입력창에 넣고 전송 전에 다듬어 보세요.