2024年1月10日 星期三

利用 AI 工具處理耗時的逐字稿

今天的內訓課程請來中研院專家演講如何利用 AI 工具來處理耗時的工作, 其中最常見的是開會, 演講, 或上課的逐字稿, 這些在以前都是非常耗費時間的任務, 但現在透過 AI 工具都能輕鬆搞定. 以前我最討厭當會議紀錄, 因為要來回聽錄音筆內容才能確定與會者的發言內容是否正確. 其次像線上課程或直播的錄影, 逐字稿可以用來替影片掛上字幕, 還能利用翻譯功能讓回看的人選擇哪種語言的字幕, 更重要的是可以用來搜尋含有指定關鍵字的影片. 

以下是聽講重點摘要 : 

1. 逐字稿可以使用 OpenAI 的開源自動語音 whisper :

OpenAI whisper  可以下載到本機來做, 參考 :


2. 使用 pyannote.audio 做語者辨識與逐字稿切割 :

pyannote.audio 是一個以 PyTorch 為基礎的語者辨識開源專案, 參考 :


3. 使用 ChatGPT 做逐字稿內容摘要

4. buzz 與 WhisperX 是將將上述功能打包起來的軟體, 參考 :  


另外, 中研院的 YT 頻道也有許多值得看的影片 :


例如古倫維老師的 ChatGPT 演講就非常精彩 :




沒有留言:

張貼留言