2019年12月2日 星期一

Praat 語音分析筆記 (四) : 音高分析

本篇繼續說明 SoundEitor 視窗後半部選單 Pictch (音高) 分析的操作. 本系列前面的文章參考 :

Praat 語音分析筆記 (一) : 簡介與軟體下載
Praat 語音分析筆記 (二) : 錄音與存檔匯入
Praat 語音分析筆記 (三) : SoundEditor 操作


四 Pitch 音高分析

音高是聲調 (tone) 的最主要聲學特徵 (其他還有強度與時長等), 因此聲調的聲學研究幾乎都離不開音高這個因素.


4.1 音高與基本頻率

音高 (pitch) 是指人耳對聲音音調高低感知的衡量, 在物理學上對應聲帶振動的基本頻率 (fundamental frequency, 又稱 fo), 因此所謂的男高音或女高音就是他們的聲帶較細, 振動頻率較高所致. 有別於被動的共振峰頻率, 基本頻率是主動頻率, 取決於聲帶的形狀與控制聲帶振動的肌肉運動力.

下圖為在聲帶量得之振動波形圖, 其第一諧波就是所謂的基本頻率 fo :




事實上, 音高 (pitch) 是主觀性的知覺用詞, 而基本頻率 fo 卻是客觀的物理性質, 但因為兩者密切相關, 因此經常混為一談, 久之也就習以為常了.


4.2 SoundEditor 視窗中的 Pitch 選單

Praat 的 SoundEditor 視窗整合了幾乎全部語音分析功能, 上方的 Pitch 選單提供了全部音高分析的設定, 分析, 以及資料擷取功能.

首先匯入之前從 this_is_a_book.wav 切音出來的 this.wav 檔, 並開啟 SoundEditor 視窗, 下半部圖形預設顯示聲譜圖 (spectrogram) 與音高曲線 (藍色), 左邊的縱軸刻度是聲譜圖的頻率 (預設最高 5000 Hz), 右邊的縱軸刻度則是音高的頻率 (預設最高 500 Hz) :




按上方 Pitch 選單點選 "Pitch settings" :




彈出的視窗顯示預設的音高分析設定, 其中最重要的是最上面的 Pitch range 設定, 預設是 75 Hz~500 Hz, 這對一般人的而言沒問題, 但如果發聲者是女生或小孩, 有些人的音高會大於 500 Hz, 這時就需要調整上限為 600 Hz 甚至 800 Hz; 同樣地, 對於某些嗓音較低的發聲者, 下限可能需要往下調到 50 Hz.




4.3 取得游標所在的音高頻率

SoundEditor 視窗中下半部圖形的藍色曲線為 Pitch 曲線, 代表量測到聲帶振動的部分, 通常這是母音 (韻母) 或有聲子音 (濁聲母) 等出現的區域. 將滑鼠在有 Pitch 曲線的地方點一下會出現一條垂直虛線, 代表目前由標所在的時間位置, 右邊縱軸刻度顯示此時間點音高值為 136 Hz. 按 Pitch 選單點選 "Get pitch" 功能項 :




彈出的 Info 視窗顯示 Pitch 值正是 136 Hz :




如果把游標移到無音高曲線的地方, 點選 "Get pitch" 將得到 "undefined" 結果, 表示 Praat 在此時間無法計算出音高值, 代表此時間點並無量測到聲帶振動.





4.4 取得區段中的所有音高頻率

觀察 SoundEditor 中的藍色音高曲線, 可知此曲線是由藍色的菱形點連接而成, 事實上 Praat 在計算音高時, 是將整個語音切成許多等長的小時段 (time slot, 又稱時槽), 然後透過演算法計算每一個小時段內的音高值, 如果要取得一個時間區段內所有量測到的音高頻率值, 請先選取此區段 :




然後按 Pitch 選單點選 "Pitch listing" 功能項 :




結果會列在談出的 Info 視窗中 :




上圖左側的 Time_s 就是每一個計算音高的小時段 (time slot, 時槽) 的中心時間點, 右側的 F0_Hz 欄就是該時槽所計算出來的音高 (基本頻率). 標示 "--undefined--" 的就是沒有音高的時槽, 表示這個時間點附近沒有量測到聲帶振動. 這個音高列表讓我們很方便地可以直接複製到 EXCEL 中去做計算或統計.


4.5 取得時段內的最高與最低音高 

當選取一個區段後, 按 Pitch 選單點選 "Get minimun pitch" 可取得此區段內的最低音高頻率 :





按 Pitch 選單點選 "Get maximun pitch" 可取得此區段內的最高音高頻率 :





按 Pitch 選單點選 "Move to minimun pitch" 可將游標移到此區段內最低 pitch 頻率所在時間點 0.219415 秒處 :





同理按 Pitch 選單點選 "Move to maximun pitch" 則可將游標移到此區段內最高 pitch 頻率所在時間點.


4.6 繪製音高圖形

在 SoundEditor 中的 Pitch 曲線可以輸出到 Pitcure 視窗中繪圖, 先選取一個區段按 Pitch 選單點選 "Draw visible pitch contour" 可將選取區段內的音高曲線輸出至 Pitcure 視窗 :




彈出的設定選單直接按 OK 即可 :





4.7 母音位置與基本頻率的關係

音高或基本頻率 fo 是聲調 (tone) 的主要聲學參數, 在聲調的聲學研究中觀察到, 母音的高度與音高成正比關係, 即高母音的 fo 比低母音的 fo 要高, 不過統計顯示並未達明顯差異, 因此音高或基本頻率並非母音的區別性特徵, 無法用來辨別不同之母音 :





母音的發音位置 (高低, 前後) 與頻譜中的共振峰有密切且明顯的關係, 共振峰是區別母音的最重要聲學特徵 (acoustic characteristics), 這將在共振峰分析中說明. 此外, 基本頻率 fo (音高) 也可以在窄頻頻譜中求得, 詳見頻譜分析篇.

沒有留言 :