在前面的測試中都是使用 Ollama 原生介面或 CLI 介面與本地模型對話, 事實上 Ollama 是一個服務軟體, 它可對多種窗口介面發送服務, 例如 CLI, 特定程式或網頁等, 本篇測試則是要在 Chrome 瀏覽器上安裝擴充元件 Page Assist 以便能用網頁介面與本地模型對話.
1. 安裝擴充元件 :
首先來安裝 Chrome 擴充元件 Page Assist, 按 Chrome 右上角的三個點按鈕, 點選 "擴充功能", 再點選 "前往 Chrome 線上應用程式商店" :
在右上角的搜尋框輸入 "Page Asist", 點選搜尋到的項目 :
按右上角的 "加入到 Chrome" 鈕 :
按 "新增擴充功能" 鈕 :
按上方 Chrome 擴充功能鈕會出現所有擴充功能項目, 按 Page Asist 那列右邊的圖釘將其固定在上方工具列上 :
這樣以後 Page Assist 按鈕就會一直出現在上方工具列, 直接按就會開啟 Page Assist 頁籤了 :
點模型框會出現已下載的模型選單供選擇 :
不過在對話前先來作操作介面設定.
2. 操作介面設定 :
按右上角的齒輪按鈕進入設定頁面 :
Page Assist 預設是英文介面, 可以在 Language 選項選擇繁體中文 :
在一般設定中常用的項目是更改 "OCR 預設語言" (預設為 English) 與 "更改主題" (預設為亮色) :
網頁搜尋設定可以選擇模型使用的搜尋引擎 (預設 DuckDuckGo) 與更改搜尋結果筆數等 :
語音轉文字部分可以設定語言 (預設 English) 等 :
系統設定部分則可以更改頁面字型大小, 匯入/匯出聊天紀錄等 :
3. 與模型對話 :
在前一篇測試中我們使用 Ollama 原生介面與 Gemma 4 多模態模型對話, 上傳圖片檔要求描述或辨識圖片內容, 此處改用 Page Assist 的網頁介面來與模型交談.
我借用程序猿技術部落格關於 Mermaid 介紹的心智圖, 截圖存檔 (jpg) 後上傳給 gemma4 模型, 要求它讀取圖片中的訊息並轉成 Markdown 格式 :
選擇 gemma4 模型後輸入提示詞 :
請將這張心智圖內容轉成 Markdown 格式
點圖片按鈕選取要上傳的心智圖後提交 :
結果如下 :
可見多模態對話還是網頁介面方便, 終於有 ChatGPT 的 Fu 了.



















沒有留言 :
張貼留言