[Bugfix] Fix OOM tests in initialization test (vllm-project#21921)

Isotr0py · paulpak58 · commit 3ef41f7e139b · 2025-08-13T15:08:54.000Z
Signed-off-by: Isotr0py &lt;2037008807@qq.com&gt;
Signed-off-by: Paul Pak &lt;paulpak58@gmail.com&gt;
diff --git a/tests/models/test_initialization.py b/tests/models/test_initialization.py
@@ -33,12 +33,6 @@ def can_initialize(model_arch: str, monkeypatch: pytest.MonkeyPatch,
     model_info.check_available_online(on_fail="skip")
     model_info.check_transformers_version(on_fail="skip")
 
-    # FIXME: Possible memory leak in the previous tests?
-    if model_arch in ("Glm4vForConditionalGeneration",
-                      "GraniteSpeechForConditionalGeneration",
-                      "KimiVLForConditionalGeneration"):
-        pytest.skip("Avoid OOM")
-
     if model_arch in ("Llama4ForCausalLM", "EagleLlama4ForCausalLM"):
         from vllm.model_executor.models.llama4 import Llama4ForCausalLM
         from vllm.model_executor.models.registry import ModelRegistry
@@ -87,6 +81,14 @@ def hf_overrides(hf_config: PretrainedConfig) -> PretrainedConfig:
                 "num_hidden_layers": 1,
             })
 
+        # e.g.: Qwen/Qwen2-Audio-7B-Instruct
+        if hasattr(hf_config, "audio_config"):
+            hf_config.audio_config.update({
+                "num_layers": 1,
+                "num_hidden_layers": 1,
+                "encoder_layers": 1,
+            })
+
         return hf_config
 
     # Avoid calling model.forward()
diff --git a/vllm/model_executor/models/glm4_1v.py b/vllm/model_executor/models/glm4_1v.py
@@ -1275,6 +1275,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
             vllm_config=vllm_config,
             prefix=maybe_prefix(prefix, ""),
             architectures=["Glm4ForCausalLM"],
+            hf_config=self.config.get_text_config(),
         )
 
         self.make_empty_intermediate_tensors = (

Original file line number	Diff line number	Diff line change
`@@ -1275,6 +1275,7 @@ def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):`
`1275`	`1275`	`vllm_config=vllm_config,`
`1276`	`1276`	`prefix=maybe_prefix(prefix, ""),`
`1277`	`1277`	`architectures=["Glm4ForCausalLM"],`
	`1278`	`+ hf_config=self.config.get_text_config(),`
`1278`	`1279`	`)`
`1279`	`1280`
`1280`	`1281`	`self.make_empty_intermediate_tensors = (`