BananaNL Blog

ChatGPT / 4 分鐘

ChatGPT 圖片輸入提示詞:讓截圖、文件與 UI 評估更貼近你的目的

這是一篇實用的 ChatGPT 圖片輸入提示詞指南,整理如何讓截圖、文字擷取、UI 評估更貼近需求,包括觀看範圍、輸出格式與不要推測的條件。

1 分鐘看 BananaNL

快速看看 BananaNL 如何把選好的提示詞放進 NotebookLM 與 AI Chat 的輸入欄。

在 YouTube 觀看

上傳圖片,不等於問對問題

把圖片或截圖丟給 ChatGPT,常常只會得到一段泛泛的說明,卻不是你真正要的答案。如果你在意的是錯誤原因、圖片內文字,或 UI 改善點,就需要先把目的說清楚。

OpenAI 的 ChatGPT Image Inputs FAQ 說明,圖片輸入適合拿來分析照片、文件與各種視覺內容,但也提醒它在模糊圖片、太小的文字、非拉丁文字、旋轉影像與某些圖表樣式上會比較弱。因此,先指定要看的範圍、輸出格式,以及哪些地方不要推測,會更穩定。

當某個圖片輸入提示詞型有效時,把它按用途保存下來,通常比每次重新搜尋更省力。

把 ChatGPT 圖片輸入提示詞拆成觀察範圍與輸出格式的抽象圖片

圖片輸入提示詞先決定的 5 件事

  1. 先用一句話寫出目的。圖片說明、OCR、UI 評估、競品比較、錯誤排查,需要的深度與結構都不同。
  2. 指定要看的範圍。要看整個畫面、右上角錯誤訊息,還是表格中的某一段,最好先講清楚。
  3. 固定輸出格式。你要的是條列、表格、三個重點、修改建議,還是確認清單,都可以先講。
  4. 加入不要推測的規則。看不清楚的字、畫面外資訊、無法從圖片確認的原因,都應標成待確認。
  5. 必要時先整理圖片。把小字放大、裁切重點區域、加上註記,通常會讓回答更可靠。

一開始先放入的 4 個要素

圖片或截圖要看哪裡輸出格式待確認

這個型適合的情境

截圖確認想把錯誤畫面或設定畫面中看得到的事實,和還需要再查的項目分開時。
文件 OCR想從紙本資料、白板、PDF 截圖擷取文字,再整理成可用內容時。
UI 評估想根據頁面截圖檢查 CTA、留白、閱讀順序與易讀性時。
上傳失敗排查圖片無法上傳或分析異常時,想依序檢查格式、大小、權限與瀏覽器因素時。

可以在 ChatGPT 嘗試的圖片輸入提示詞

拆開錯誤截圖的原因

請看這張截圖,把畫面上看得到的錯誤訊息、可能原因候選、下一步要確認的項目分開整理。如果有看不清楚的文字,或需要依賴畫面外資訊的部分,請不要推測,直接標成待確認。輸出請用「看得到的事實」「可能原因」「下一步確認」三個標題整理。

能把看得到的事實與推論分開,降低回答過度肯定的風險。

把圖片中的文字整理成表格

請盡量忠實轉寫這張圖片中的文字,之後再整理成包含「項目」「內容」「難以辨識處」三欄的表格。不要依上下文補空白,看不清楚的地方就保留為不明。

可以把 OCR 結果與不確定部分分開保存,方便之後人工覆核。

依優先順序提出 UI 改善點

請從 UI/UX 角度檢查這張網頁截圖。觀察 CTA 是否容易找到、資訊順序是否自然、留白是否足夠,以及哪些地方不易閱讀,並依優先順序列出 5 個改善點。看不到的流程或效能數據請不要推測,只根據截圖中可判斷的內容回答。

先固定評估視角與範圍,會比抽象感想更容易轉成實際修改。

常用的圖片輸入型,可以放進 BananaNL

圖片輸入提示詞通常會依用途分化成截圖檢查、OCR、UI 評估、競品分析等不同型。把常用型保存下來,會比每次臨時重寫更快,也更穩定。

BananaNL 是一個 Chrome 擴充功能,可以把選好的提示詞插入 ChatGPT、Gemini、Grok 等 AI Chat 輸入欄。它不會自動送出,所以你可以先附上圖片、確認文字,再決定是否送出。NotebookLM 可免費開始使用,AI Chat 整合是付費功能。

從 BananaNL 呼叫可重複使用的圖片輸入提示詞的抽象圖片

FAQ

ChatGPT 圖片輸入提示詞一開始該寫什麼?

先寫目的與要看的範圍。你為什麼上傳這張圖、希望它先看哪裡,會直接影響回答品質。

小字或中文、日文、韓文文字能穩定讀出來嗎?

不一定。小字與非拉丁文字可能降低準確度,建議先放大、裁切,並明確要求它不要猜測看不清楚的內容。

如果圖片上傳失敗,第一步該檢查什麼?

先看檔案格式與大小,再試新對話、無痕模式或停用擴充功能;手機則再檢查照片權限與網路或 VPN 問題。

如果找提示詞很麻煩,可以用 BananaNL

學到的提示詞放在輸入欄附近,才會持續使用。用 BananaNL 帶到輸入欄,再送出前調整成自己的語氣。