ARXIV:2603.28555 · VISION-LANGUAGE MODELS · SUBMITTED 31 MAR · 20:22 UTC · FRESHNESS STALE

VerifiedSource: PDF linkedVerifiedPaperPack: citation fields availablePartialProof: unverified proof status

Domain-Invariant Prompt Learning for Vision-Language Models

Arsham Gholamzadeh Khoee · Yinan Yu · Robert Feldt · arXiv

A method to improve vision-language models' ability to generalize across different visual domains by learning domain-invariant prompts.

Blocked on Code›Score4.0Evidence unverified

Opportunity summary

Pain A method to improve vision-language models' ability to generalize across different visual domains by learning domain-invariant prompts.

Evidence 5 refs | 3 sources | 50% coverage

Blocker Evidence unverified

Open Build Read PDF Signal Canvas Track

PROBLEM

A method to improve vision-language models' ability to generalize across different visual domains by learning domain-invariant prompts. Soft-prompting, such as Context Optimization (CoOp), effectively adapts these models for downstream recognition tasks by learning a…

METHOD

Full abstract

Large pre-trained vision-language models like CLIP have transformed computer vision by aligning images and text in a shared feature space, enabling robust zero-shot transfer via prompting. Soft-prompting, such as Context Optimization (CoOp), effectively adapts these models for downstream recognition tasks by learning a set of context vectors. However, CoOp lacks explicit mechanisms for handling domain shifts across unseen distributions. To address this, we propose Domain-invariant Context Optimization (DiCoOp), an extension of CoOp optimized for domain generalization. By employing an adversarial training approach, DiCoOp forces the model to learn domain-invariant prompts while preserving discriminative power for classification. Experimental results show that DiCoOp consistently surpasses CoOp in domain generalization tasks across diverse visual domains.

RESULT

ScienceToStartup currently rates this 4.0/10 on the public viability pass. Experimental results show that DiCoOp consistently surpasses CoOp in domain generalization tasks across diverse visual domains.

WHY NOW

Vision-Language Models moved forward this cycle; last verified April 2026. Public score 4.0/10.

Continue into Read for claims, analysis, references, and neighboring papers.

Opportunity summary

Score4.0

PainA method to improve vision-language models' ability to generalize across different visual domains by learning domain-invariant prompts.

Evidence5 refs | 3 sources | 50% coverage

Blockerno shell-level blocker reported

Analysis summary

A method to improve vision-language models' ability to generalize across different visual domains by learning domain-invariant prompts.

VerifiedSource: PDF linkedVerifiedPaperPack: citation fields availablePartialProof: unverified proof status

Competitive landscape

A method to improve vision-language models' ability to generalize across different visual domains by learning domain-invariant prompts.

Segment

Vision-Language Models

Adoption evidence

No public code link in the paper record yet

Commercial read

4.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

{ "contract_version": "paper-r2", "paper_id": "13f81435-5740-4731-b84c-a0bdc2ceb9a7", "arxiv_id": "2603.28555", "canonical_route": "/paper/domain-invariant-prompt-learning-for-vision-language-models", "active_tab": "synced from current hash by the drawer client", "selected_artifact": "domain-invariant-prompt-learning-for-vision-language-models", "endpoints": { "paper_pack": "/api/v1/paper/domain-invariant-prompt-learning-for-vision-language-models/paper-pack", "build_passport": "/api/v1/paper/domain-invariant-prompt-learning-for-vision-language-models/build-passport", "mcp_resource": "sciencetostartup://surfaces/paper-workspace" } }

{ "surface": "paper", "mode": "paper", "query": "Domain-Invariant Prompt Learning for Vision-Language Models", "normalized_query": "2603.28555", "route": "/paper/domain-invariant-prompt-learning-for-vision-language-models", "paper_ref": "domain-invariant-prompt-learning-for-vision-language-models", "topic_slug": null, "benchmark_ref": null, "dataset_ref": null }

{ "@context": "https://schema.org", "@graph": [ { "@type": "WebPage", "@id": "https://sciencetostartup.com/paper/domain-invariant-prompt-learning-for-vision-language-models#webpage", "url": "https://sciencetostartup.com/paper/domain-invariant-prompt-learning-for-vision-language-models", "name": "Domain-Invariant Prompt Learning for Vision-Language Models", "description": "A method to improve vision-language models' ability to generalize across different visual domains by learning domain-invariant prompts.", "isPartOf": { "@id": "https://sciencetostartup.com/#website" } }, { "@type": "ScholarlyArticle", "@id": "https://sciencetostartup.com/paper/domain-invariant-prompt-learning-for-vision-language-models#scholarlyArticle", "headline": "Domain-Invariant Prompt Learning for Vision-Language Models", "description": "A method to improve vision-language models' ability to generalize across different visual domains by learning domain-invariant prompts.", "url": "https://sciencetostartup.com/paper/domain-invariant-prompt-learning-for-vision-language-models", "sameAs": "https://arxiv.org/abs/2603.28555", "identifier": { "@type": "PropertyValue", "propertyID": "arXiv", "value": "2603.28555" }, "isAccessibleForFree": true, "isPartOf": { "@id": "https://sciencetostartup.com/#website" }, "datePublished": "2026-03-30T15:18:31.000Z", "author": [ { "@type": "Person", "name": "Arsham Gholamzadeh Khoee" }, { "@type": "Person", "name": "Yinan Yu" }, { "@type": "Person", "name": "Robert Feldt" } ], "additionalProperty": [ { "@type": "PropertyValue", "propertyID": "viabilityScore", "value": 4 }, { "@type": "PropertyValue", "propertyID": "researchDomain", "value": "Vision-Language Models" } ] }, { "@type": "BreadcrumbList", "itemListElement": [ { "@type": "ListItem", "position": 1, "name": "Home", "item": "https://sciencetostartup.com" }, { "@type": "ListItem", "position": 2, "name": "Vision-Language Models", "item": "https://sciencetostartup.com/topics" }, { "@type": "ListItem", "position": 3, "name": "Domain-Invariant Prompt Learning for Vision-Language Models", "item": "https://sciencetostartup.com/paper/domain-invariant-prompt-learning-for-vision-language-models" } ] } ] }

Competitive landscape

A method to improve vision-language models' ability to generalize across different visual domains by learning domain-invariant prompts.

Segment

Vision-Language Models

Adoption evidence

No public code link in the paper record yet

Commercial read

4.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

Domain-Invariant Prompt Learning for Vision-Language Models

Domain-Invariant Prompt Learning for Vision-Language Models

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Related Resources

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Related Resources

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline