ChatGPT / 4 分鐘

ChatGPT 圖片輸入提示詞：讓截圖、文件與 UI 評估更貼近你的目的

這是一篇實用的 ChatGPT 圖片輸入提示詞指南，整理如何讓截圖、文字擷取、UI 評估更貼近需求，包括觀看範圍、輸出格式與不要推測的條件。

在 YouTube 觀看

1 分鐘看 BananaNL

快速看看 BananaNL 如何把選好的提示詞放進 NotebookLM 與 AI Chat 的輸入欄。

把圖片或截圖丟給 ChatGPT，常常只會得到一段泛泛的說明，卻不是你真正要的答案。如果你在意的是錯誤原因、圖片內文字，或 UI 改善點，就需要先把目的說清楚。

OpenAI 的 ChatGPT Image Inputs FAQ 說明，圖片輸入適合拿來分析照片、文件與各種視覺內容，但也提醒它在模糊圖片、太小的文字、非拉丁文字、旋轉影像與某些圖表樣式上會比較弱。因此，先指定要看的範圍、輸出格式，以及哪些地方不要推測，會更穩定。

當某個圖片輸入提示詞型有效時，把它按用途保存下來，通常比每次重新搜尋更省力。

圖片或截圖要看哪裡輸出格式待確認

截圖確認	想把錯誤畫面或設定畫面中看得到的事實，和還需要再查的項目分開時。
文件 OCR	想從紙本資料、白板、PDF 截圖擷取文字，再整理成可用內容時。
UI 評估	想根據頁面截圖檢查 CTA、留白、閱讀順序與易讀性時。
上傳失敗排查	圖片無法上傳或分析異常時，想依序檢查格式、大小、權限與瀏覽器因素時。

請看這張截圖，把畫面上看得到的錯誤訊息、可能原因候選、下一步要確認的項目分開整理。如果有看不清楚的文字，或需要依賴畫面外資訊的部分，請不要推測，直接標成待確認。輸出請用「看得到的事實」「可能原因」「下一步確認」三個標題整理。

能把看得到的事實與推論分開，降低回答過度肯定的風險。

請盡量忠實轉寫這張圖片中的文字，之後再整理成包含「項目」「內容」「難以辨識處」三欄的表格。不要依上下文補空白，看不清楚的地方就保留為不明。

可以把 OCR 結果與不確定部分分開保存，方便之後人工覆核。

請從 UI/UX 角度檢查這張網頁截圖。觀察 CTA 是否容易找到、資訊順序是否自然、留白是否足夠，以及哪些地方不易閱讀，並依優先順序列出 5 個改善點。看不到的流程或效能數據請不要推測，只根據截圖中可判斷的內容回答。

先固定評估視角與範圍，會比抽象感想更容易轉成實際修改。

圖片輸入提示詞通常會依用途分化成截圖檢查、OCR、UI 評估、競品分析等不同型。把常用型保存下來，會比每次臨時重寫更快，也更穩定。

BananaNL 是一個 Chrome 擴充功能，可以把選好的提示詞插入 ChatGPT、Gemini、Grok 等 AI Chat 輸入欄。它不會自動送出，所以你可以先附上圖片、確認文字，再決定是否送出。NotebookLM 可免費開始使用，AI Chat 整合是付費功能。

ChatGPT 圖片輸入提示詞一開始該寫什麼？

先寫目的與要看的範圍。你為什麼上傳這張圖、希望它先看哪裡，會直接影響回答品質。

小字或中文、日文、韓文文字能穩定讀出來嗎？

不一定。小字與非拉丁文字可能降低準確度，建議先放大、裁切，並明確要求它不要猜測看不清楚的內容。

如果圖片上傳失敗，第一步該檢查什麼？

先看檔案格式與大小，再試新對話、無痕模式或停用擴充功能；手機則再檢查照片權限與網路或 VPN 問題。

學到的提示詞放在輸入欄附近，才會持續使用。用 BananaNL 帶到輸入欄，再送出前調整成自己的語氣。