ChatGPT / 4 分鐘
ChatGPT 圖片輸入提示詞:讓截圖、文件與 UI 評估更貼近你的目的
這是一篇實用的 ChatGPT 圖片輸入提示詞指南,整理如何讓截圖、文字擷取、UI 評估更貼近需求,包括觀看範圍、輸出格式與不要推測的條件。
在 YouTube 觀看
1 分鐘看 BananaNL
快速看看 BananaNL 如何把選好的提示詞放進 NotebookLM 與 AI Chat 的輸入欄。
在 YouTube 觀看上傳圖片,不等於問對問題
把圖片或截圖丟給 ChatGPT,常常只會得到一段泛泛的說明,卻不是你真正要的答案。如果你在意的是錯誤原因、圖片內文字,或 UI 改善點,就需要先把目的說清楚。
OpenAI 的 ChatGPT Image Inputs FAQ 說明,圖片輸入適合拿來分析照片、文件與各種視覺內容,但也提醒它在模糊圖片、太小的文字、非拉丁文字、旋轉影像與某些圖表樣式上會比較弱。因此,先指定要看的範圍、輸出格式,以及哪些地方不要推測,會更穩定。
當某個圖片輸入提示詞型有效時,把它按用途保存下來,通常比每次重新搜尋更省力。

圖片輸入提示詞先決定的 5 件事
- 先用一句話寫出目的。圖片說明、OCR、UI 評估、競品比較、錯誤排查,需要的深度與結構都不同。
- 指定要看的範圍。要看整個畫面、右上角錯誤訊息,還是表格中的某一段,最好先講清楚。
- 固定輸出格式。你要的是條列、表格、三個重點、修改建議,還是確認清單,都可以先講。
- 加入不要推測的規則。看不清楚的字、畫面外資訊、無法從圖片確認的原因,都應標成待確認。
- 必要時先整理圖片。把小字放大、裁切重點區域、加上註記,通常會讓回答更可靠。
一開始先放入的 4 個要素
這個型適合的情境
| 截圖確認 | 想把錯誤畫面或設定畫面中看得到的事實,和還需要再查的項目分開時。 |
|---|---|
| 文件 OCR | 想從紙本資料、白板、PDF 截圖擷取文字,再整理成可用內容時。 |
| UI 評估 | 想根據頁面截圖檢查 CTA、留白、閱讀順序與易讀性時。 |
| 上傳失敗排查 | 圖片無法上傳或分析異常時,想依序檢查格式、大小、權限與瀏覽器因素時。 |
可以在 ChatGPT 嘗試的圖片輸入提示詞
拆開錯誤截圖的原因
請看這張截圖,把畫面上看得到的錯誤訊息、可能原因候選、下一步要確認的項目分開整理。如果有看不清楚的文字,或需要依賴畫面外資訊的部分,請不要推測,直接標成待確認。輸出請用「看得到的事實」「可能原因」「下一步確認」三個標題整理。
能把看得到的事實與推論分開,降低回答過度肯定的風險。
把圖片中的文字整理成表格
請盡量忠實轉寫這張圖片中的文字,之後再整理成包含「項目」「內容」「難以辨識處」三欄的表格。不要依上下文補空白,看不清楚的地方就保留為不明。
可以把 OCR 結果與不確定部分分開保存,方便之後人工覆核。
依優先順序提出 UI 改善點
請從 UI/UX 角度檢查這張網頁截圖。觀察 CTA 是否容易找到、資訊順序是否自然、留白是否足夠,以及哪些地方不易閱讀,並依優先順序列出 5 個改善點。看不到的流程或效能數據請不要推測,只根據截圖中可判斷的內容回答。
先固定評估視角與範圍,會比抽象感想更容易轉成實際修改。
常用的圖片輸入型,可以放進 BananaNL
圖片輸入提示詞通常會依用途分化成截圖檢查、OCR、UI 評估、競品分析等不同型。把常用型保存下來,會比每次臨時重寫更快,也更穩定。
BananaNL 是一個 Chrome 擴充功能,可以把選好的提示詞插入 ChatGPT、Gemini、Grok 等 AI Chat 輸入欄。它不會自動送出,所以你可以先附上圖片、確認文字,再決定是否送出。NotebookLM 可免費開始使用,AI Chat 整合是付費功能。

FAQ
ChatGPT 圖片輸入提示詞一開始該寫什麼?
先寫目的與要看的範圍。你為什麼上傳這張圖、希望它先看哪裡,會直接影響回答品質。
小字或中文、日文、韓文文字能穩定讀出來嗎?
不一定。小字與非拉丁文字可能降低準確度,建議先放大、裁切,並明確要求它不要猜測看不清楚的內容。
如果圖片上傳失敗,第一步該檢查什麼?
先看檔案格式與大小,再試新對話、無痕模式或停用擴充功能;手機則再檢查照片權限與網路或 VPN 問題。
如果找提示詞很麻煩,可以用 BananaNL
學到的提示詞放在輸入欄附近,才會持續使用。用 BananaNL 帶到輸入欄,再送出前調整成自己的語氣。