今天下班順路去母校圖書館還下面這本書 (有人預約) :
Source : 天瓏
此書主要介紹 Stable Diffusion, Leonardo.ai 與 Midjourney 這三款 AI 生圖工具, Midjourney 以前有免費方案時我曾玩過, 須透過 Discord 進去, 坦白說我對 Discord 令人眼花撩亂的介面不太喜歡, 取消免費方案後我更不會去用 Midjourney 了. 反觀 Leonardo.ai 就很佛心, 至今仍提供免費生圖方案, 免費用戶每天會獲得 150 個免費 token, 生一張圖依尺寸大小不同會用掉 1~4 個 token, 亦即至少每天可讓免費用戶產生近 40 張大尺寸圖, 不夠再付費購買 token, 這實在很棒. 至於開放原始碼的 Stable Diffusion 本身就是免費的 AI 生圖模型, 只要有符合條件的硬體 (獨立顯卡 + 足夠 DRAM) 就可以在本機自行生圖, 或者購買 Colab 運算單元在雲端跑 WebUI 生圖.
以下是我看完第三章 Stable Diffusion 的筆記 :
1. Stable Difussion 最主要的兩個功能 :
- text2img : 文生圖
在 Prompt 區輸入區輸入圖片的正向與負向提示詞按 "Generate" 鈕即可. - img2text : 圖生圖
拖曳或上傳圖片後按 按 "Generate" 鈕即可, 也可以佐以正負向提示詞.
2. 文生圖 (text2img) :
負向提示詞用來排除不要的畫風, 物件或結構, 不論正向或負向, 排在越前面的提示詞影響力越大. 提示詞之間要用半形逗號隔開, 也可以用 + 號連接短提示詞, 或用 | 串接提示詞來表示循環繪製效果. 空格與換行在提示詞中無作用, 不會影響提示詞權重. 例如 :
8k portrait, beautiful cyborg, brown hair, intricate, elegant
若將 brown hair 改成 brown hair | yellow hair 會有棕黃相間的效果 :
8k portrait, beautiful cyborg, brown hair | yellow hair, intricate, elegant
如果想要改變提示詞權重可以這麼做 :
- 在提示詞後面串接 ":數值" 來改變其權重.
- 將提示詞用小括號 () 括起來, 這會提升其權重為 1.1 倍.
- 將提示詞用中括號 [] 括起來, 這會降低其權重為 0.9 倍
若將 beautiful cyborg 與 elegant 用雙重小括號括起來會強化美麗機器人與優雅這兩個特徵 :
8k portrait, ((beautiful cyborg)), brown hair | yellow hair, intricate, ((elegant))
若加上國家或區域名稱則會生成具有地區特色的圖像, 例如 :
8k portrait, ((beautiful cyborg)), brown hair | yellow hair, intricate, ((elegant)), Taiwan
另外為了避免生出例如六個手指的人類, 通常會給予 ((disfigured)) 的負向提示詞.
注意, 提示詞不論文生圖或圖生圖都可以用.
文生圖功能區選項欄位 :
- Sampling method (取樣方法) :
此選項影響圖像風格, 可用選項例如 Euler a, LMS, DPM2 a, DPM fast, DPM++2S a Karras, DPM++2M Karras 等. - Sampling steps (取樣步數) :
步數越大圖像品質越精緻, 但生圖時間會拉長, 一般設在 20~30 即可. - Restore face (臉部修正) :
雖然會增加算圖時間, 但此項最好要勾選, 避免生成的人臉有扭曲歪斜情況. - Hires, fix (高品質圖像) :
勾選後會生成較細緻的圖片 (但也增加生圖時間). 如果生出一張滿意的圖片, 可以設定 Seed 欄的隨機種子固定風格後勾選此項重新生成更精細的圖像. - Width, Height (圖像尺寸) :
預設生成圖片尺寸為 512*512 px, 可以視需要自行調整. - Tilting (拼接) :
勾選此項可以生成像磁磚那樣重複拼接的圖像. - Batch size (輸出張數), Batch count (輸出批次) :
Batch size 是設定每次生成幾張圖 (建議設 2 或 4), 而 Batch count 則是設定算幾次 (建議設為 1). - CFG (縮放因子) :
用來設定提示詞對生成之圖的影響力, 值越大生成之圖片越符合提示詞之描述, 值越小則模型加入的隨機性越大. - Seed (隨機種子) :預設 -1 表示不固定隨機種子, 則每次生圖的方式會因為隨機性而差異很大, 可設為任意正整數, 例如經典的 42, 這樣相同的提示詞每次生圖方式就會固定. 欄位右邊的骰子按鈕可以讓隨機種子回復預設的 -1 (完全隨機), 按最右邊的循環按鈕則會將隨機種子固定為目前的設定值.
3. 圖生圖 (img2img) :
圖生圖是以上傳的圖片為基礎擴增原圖風格來產生新圖像.
圖生圖功能區選項設定 :
- Width (寬度), Height (高度) :
可設定圖片縮放的尺寸. - Resize mode (縮放模式) :
Just resize (直接縮放) : 依寬高設定縮放, 景物基本不變
Crop and resize (剪裁縮放) : 剪裁後等比例依寬高設定縮放, 景物可能被刪減
Resize and fill (填充) : 將原尺寸與寬高設定不足之處填充, 景物會增加
Just resize-latent upscale (調整大小) : 與 Just resize 類似, 但隨機性較高 - Denoising strength (重繪幅度) :
用來設定模型圖生圖依樣畫葫蘆程度, 值越低越像上傳之圖片, 值越高則模型加入隻創意越多.
4. Stable Diffusion 模型風格 :
因 Stable Diffusion 為開源模型, 許多人會將不同風格之微調後模型上傳到 Civitai 網站 :
比較常用的 Stable Diffusion 風格模型 :
- Realistic Vision (擅長擬真的虛擬人物)
- ChilloutMix (擅長亞洲臉孔女性)
- Deliberate (擅長虛實混和的多樣化藝術風格)
- DreamShaper (擅長美版藝術圖像)
- Rev Animated (擅長美版藝術圖像, 但添加更多光影與層次細節)
- MeinaMix (擅長日版動漫風格)
- OrangeMix (擅長光感柔和之日版風格)
5. PNG Info :
可以將 Stable Diffusion 生成的圖像上傳到 PNG Info 頁籤反查所使用之提示詞與參數.
書中範例可在登入旗標網站後下載 :
沒有留言:
張貼留言