请问一下,使用megatron微调Qwen3-Next时,设置--target_modules为"all-linear"能否训练到Qwen3NextGatedDeltaNet部分?

#41
by alanayu - opened

请问一下
微调Qwen3-Next时,设置--target_modules为"all-linear",能否训练到Qwen3NextGatedDeltaNet部分?

transformers中modeling_qwen3_next.py代码中,Qwen3NextGatedDeltaNet类中存在一个self.conv1d = nn.Conv1d部分。
这个self.conv1d中的参数能否在lora训练模式下,通过设置--target_modules为"all-linear"而被训练?

Sign up or log in to comment