由於逐一上傳 .png
和 .txt
檔案到 Google Drive 會很耗時,我建議 先在本地電腦打包成單一檔案,然後上傳到 Google Drive,接著在 Google Colab 內解壓縮。這樣可以大幅提升上傳速度,減少處理時間。
📌 可行的打包方法
以下是幾種可行的解決方案,並附上適用場景和推薦程度:
方法 | 檔案格式 | 壓縮比 | 上傳速度 | 推薦程度 |
---|---|---|---|---|
1️⃣ ZIP 壓縮 | .zip | 中等 | 快 | ⭐⭐⭐⭐⭐ |
2️⃣ TAR.GZ 壓縮 | .tar.gz | 高 | 快 | ⭐⭐⭐⭐ |
3️⃣ 7z 壓縮 | .7z | 最高 | 較慢 | ⭐⭐⭐ |
4️⃣ Google Drive 直接同步 | 無壓縮 | 無 | 最慢 | ⭐ |
🔥 推薦方案:使用 ZIP 壓縮
優勢:
- 兼容性高(Windows、Mac、Linux 都支援)
- 解壓縮快(比
.tar.gz
和.7z
更快) - 上傳時間大幅縮短
📍步驟
(1) 在本機電腦打包
Windows 用戶:
Compress-Archive -Path instance_images -DestinationPath zenmaru_dataset.zip
Mac / Linux 用戶:
zip -r zenmaru_dataset.zip instance_images/
(2) 上傳 ZIP 到 Google Drive
手動上傳到 /content/drive/MyDrive/AI/datasets/
目錄下。
(3) 在 Google Colab 解壓
import os
from google.colab import drive
# 掛載 Google Drive
drive.mount('/content/drive')
# 確保目錄存在
os.makedirs("/content/drive/MyDrive/AI/datasets/zenmaru_dataset", exist_ok=True)
# 解壓 ZIP 檔案
!unzip -o "/content/drive/MyDrive/AI/datasets/zenmaru_dataset.zip" -d "/content/drive/MyDrive/AI/datasets/zenmaru_dataset/"
🎯 其他方案比較
方案 2️⃣:TAR.GZ 壓縮(適合超大數據集)
適合 1GB 以上數據,壓縮率比 ZIP 高。
tar -czvf zenmaru_dataset.tar.gz instance_images/
Colab 解壓:
tar -xzvf "/content/drive/MyDrive/AI/datasets/zenmaru_dataset.tar.gz" -C "/content/drive/MyDrive/AI/datasets/zenmaru_dataset/"
方案 3️⃣:7z 壓縮(最高壓縮率,但上傳慢)
適合 超過 10GB 的數據集。
7z a zenmaru_dataset.7z instance_images/
Colab 解壓:
!7z x "/content/drive/MyDrive/AI/datasets/zenmaru_dataset.7z" -o"/content/drive/MyDrive/AI/datasets/zenmaru_dataset/"
💡 總結
1️⃣ 一般情況 ➝ ZIP(推薦),兼容性好,解壓縮快。
2️⃣ 大數據集(>1GB) ➝ TAR.GZ,壓縮率較高,解壓速度適中。
3️⃣ 超大數據集(>10GB) ➝ 7z,壓縮率最高,但 Colab 解壓較慢。
如果您的數據集小於 10GB,推薦使用 ZIP,它在 Google Colab 上解壓速度最快!🔥