今天的內訓課程請來中研院專家演講如何利用 AI 工具來處理耗時的工作, 其中最常見的是開會, 演講, 或上課的逐字稿, 這些在以前都是非常耗費時間的任務, 但現在透過 AI 工具都能輕鬆搞定. 以前我最討厭當會議紀錄, 因為要來回聽錄音筆內容才能確定與會者的發言內容是否正確. 其次像線上課程或直播的錄影, 逐字稿可以用來替影片掛上字幕, 還能利用翻譯功能讓回看的人選擇哪種語言的字幕, 更重要的是可以用來搜尋含有指定關鍵字的影片.
以下是聽講重點摘要 :
1. 逐字稿可以使用 OpenAI 的開源自動語音 whisper :
OpenAI whisper 可以下載到本機來做, 參考 :
2. 使用 pyannote.audio 做語者辨識與逐字稿切割 :
pyannote.audio 是一個以 PyTorch 為基礎的語者辨識開源專案, 參考 :
3. 使用 ChatGPT 做逐字稿內容摘要
4. buzz 與 WhisperX 是將將上述功能打包起來的軟體, 參考 :
另外, 中研院的 YT 頻道也有許多值得看的影片 :
例如古倫維老師的 ChatGPT 演講就非常精彩 :
沒有留言:
張貼留言