Upload step 2000 checkpoint

Files changed (3) hide show

config.json CHANGED Viewed

@@ -117,7 +117,7 @@
     "kv_bridge_use_gate": false,
     "memory_mode": "replace",
     "memory_donor_layers": [
-      28
     ],
     "memory_share_donor_across_right_layers": true,
     "memory_reduce_strategy": "single"

     "kv_bridge_use_gate": false,
     "memory_mode": "replace",
     "memory_donor_layers": [
+      20
     ],
     "memory_share_donor_across_right_layers": true,
     "memory_reduce_strategy": "single"

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:68fa287882fb95f413fb71f587555e107524cd46be61b8cd29437a6b05d8532c
 size 725313232

 version https://git-lfs.github.com/spec/v1
+oid sha256:1dbbd77b2cd202e3e4e67413889c5d3868e57c44d40adf9d64f6e5904a617e42
 size 725313232

train_config.json CHANGED Viewed

@@ -2,14 +2,14 @@
   "lr_mp": 0.0001,
   "lr_vision_backbone": 0.0,
   "lr_language_backbone": 0.0001,
-  "lr_right_tower": 0.0,
   "lr_kv_bridge": 0.0,
   "lr_activation_bridge": 0.0,
   "batch_size": 32,
   "gradient_accumulation_steps": 4,
   "max_grad_norm": 1.0,
   "max_training_steps": 10000,
-  "stop_after_step": 4100,
   "warmup_ratio": 0.03,
   "stats_log_interval": 100,
   "precision": "bf16",

   "lr_mp": 0.0001,
   "lr_vision_backbone": 0.0,
   "lr_language_backbone": 0.0001,
+  "lr_right_tower": 0.0001,
   "lr_kv_bridge": 0.0,
   "lr_activation_bridge": 0.0,
   "batch_size": 32,
   "gradient_accumulation_steps": 4,
   "max_grad_norm": 1.0,
   "max_training_steps": 10000,
+  "stop_after_step": 5100,
   "warmup_ratio": 0.03,
   "stats_log_interval": 100,
   "precision": "bf16",