2023年8月9日 星期三

李宏毅老師的 Tranformer 教學

昨天內訓課程請來台大李宏毅老師講大型語言模型 (LLM), 得以一窺 ChatGPT 的本質 (以 encoder 為主體的 transformer, 文字接龍大師), 以及業界如何利用現有 LLM 取得訓練文本以監督式學習打造自有的 LLM. 課堂中李老師提到他在發布於 Youtube 的 transformer 上下兩集教學影片 :  









哇, 這麼棒的教材不好好學實在辜負李老師的用心 (作為曾經兩度台大電研所落榜者的補償, 哈哈), 先記錄下來等忙完這陣子軟體專案後再來慢慢啃, 絕對要吸飽吸滿 (吸星大法). 

沒有留言 :