2024年9月13日 星期五

如何管理 Colab 上的檔案 (上傳/下載/更名/刪除)

谷歌 Colab 平台是非常方便好用的 Python 應用執行環境, 只要連線其 Linux 虛擬機器, 即可用與本機 Jupyter Notebook 一樣的操作方式執行 Python 程式碼. 如果執行程式時需要用到外部檔案, 則必須上傳到 Colab 虛擬機器的檔案系統下才行.

本系列之前的文章參考 :

如何在 Colab 開啟終端機 (xterm)

首先開啟 Colab 的 ipynb 筆記本檔案, 如果尚未連線則要按右上角的連線按鈕 : 





連線完成會顯示 "已連線" 或 RAM/磁碟使用情形 : 




然後按左邊導覽列上的檔案系統按鈕 (已連線狀態下按此按鈕才會出現檔案管理框) : 




這時就會出現一個檔案管理框, 內建已經有一個 sample_data 資料夾, 點一下開啟它會看到裡面預設已經放了好幾個資料科學常用的 .csv 與 .json 資料集 :




點擊這些檔案會在頁面最右端顯示檔案內容, txt 或 json 會以純文字編輯器開啟, 可以在上面編輯內容 (具備自動存檔功能) :




如果是 csv 檔則以網頁表格顯示, 無法線上編輯 :




如果是圖檔也是會在網頁中顯示此圖片. 

按一下檔案管理框最上面的上一層 .. 鈕會往上跳一層到系統根目錄, 其下的 /content 就是 Colab 的預設資料夾, 如果沒有特別切會, 上傳的檔案會放在 /content 下. 

但如果是在根目錄下上傳, 檔案會被放在 /var 資料夾下, 例如我在根目錄下上傳一張車牌圖檔 333-AD.jpg, 會先出現一個提醒視窗, 表示上傳到 Colab 的任何檔案都會在連線結束時連同虛擬機器一起被清掉 (連線時間最長是 12 小時) :




上傳到根目錄的檔案會被放在 /var 資料夾下 :




如果是在預設資料夾下上傳, 則檔案會放在 /content 下 : 




點選檔案右邊的三個點按鈕可以對該檔案進行下載/刪除/改名等操作 :





注意, Colab 虛擬機器檔案系統中的檔案都會在連線終止時消失, 因此若使用 Colab 跑 Python 程式, 需注意連線逾時問題即時下載或備份至雲端硬碟, 避免產生的資料因為連線終止而消失. 

而 ipynb 筆記本檔案則是存放於雲端硬碟的 Colab Notebooks 資料夾下面, 不會隨虛擬機器連線終止而消失 : 




沒有留言:

張貼留言