ARXIV:2603.16737 · VISUAL REASONING · SUBMITTED 19 MAR · 20:22 UTC · FRESHNESS STALE

VerifiedSource: PDF linkedPartialPaperPack: 3 of 4 citation fields filledMissingMissing fields: authorsPartialProof: unverified proof status

Retrieving Counterfactuals Improves Visual In-Context Learning

arXiv

CIRCLES enhances vision-language models by using counterfactual examples for improved in-context learning and causal reasoning.

Blocked on Code›Score8.0Evidence unverified

Opportunity summary

Pain CIRCLES enhances vision-language models by using counterfactual examples for improved in-context learning and causal reasoning.

Evidence 0 refs | 0 sources | 50% coverage

Blocker Evidence unverified

Open Build Read PDF Signal Canvas Track

PROBLEM

CIRCLES enhances vision-language models by using counterfactual examples for improved in-context learning and causal reasoning. In-context learning (ICL) offers a promising avenue for VLMs to adapt to new tasks, but its effectiveness critically depends…

METHOD

Full abstract

Vision-language models (VLMs) have achieved impressive performance across a wide range of multimodal reasoning tasks, but they often struggle to disentangle fine-grained visual attributes and reason about underlying causal relationships. In-context learning (ICL) offers a promising avenue for VLMs to adapt to new tasks, but its effectiveness critically depends on the selection of demonstration examples. Existing retrieval-augmented approaches typically rely on passive similarity-based retrieval, which tends to select correlated but non-causal examples, amplifying spurious associations and limiting model robustness. We introduce CIRCLES (Composed Image Retrieval for Causal Learning Example Selection), a novel framework that actively constructs demonstration sets by retrieving counterfactual-style examples through targeted, attribute-guided composed image retrieval. By incorporating counterfactual-style examples, CIRCLES enables VLMs to implicitly reason about the causal relations between attributes and outcomes, moving beyond superficial correlations and fostering more robust and grounded reasoning. Comprehensive experiments on four diverse datasets demonstrate that CIRCLES consistently outperforms existing methods across multiple architectures, especially on small-scale models, with pronounced gains under information scarcity. Furthermore, CIRCLES retrieves more diverse and causally informative examples, providing qualitative insights into how models leverage in-context demonstrations for improved reasoning. Our code is available at https://github.com/gzxiong/CIRCLES.

RESULT

ScienceToStartup currently rates this 8.0/10 on the public viability pass. By incorporating counterfactual-style examples, CIRCLES enables VLMs to implicitly reason about the causal relations between attributes and outcomes, moving beyond superficial correlations and fostering…

WHY NOW

Visual Reasoning moved forward this cycle; last verified April 2026. Public score 8.0/10. Implementation evidence is present through a linked repository.

Continue into Read for claims, analysis, references, and neighboring papers.

Opportunity summary

Score8.0

PainCIRCLES enhances vision-language models by using counterfactual examples for improved in-context learning and causal reasoning.

Evidence0 refs | 0 sources | 50% coverage

Blockermissing authors

Analysis summary

CIRCLES enhances vision-language models by using counterfactual examples for improved in-context learning and causal reasoning.

VerifiedSource: PDF linkedPartialPaperPack: 3 of 4 citation fields filledMissingMissing fields: authorsPartialProof: unverified proof status

Competitive landscape

CIRCLES enhances vision-language models by using counterfactual examples for improved in-context learning and causal reasoning.

Segment

Visual Reasoning

Adoption evidence

Public code linked for build inspection

Commercial read

8.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

{ "contract_version": "paper-r2", "paper_id": "85f0fc3f-6c80-416e-972d-e3e13e2cf636", "arxiv_id": "2603.16737", "canonical_route": "/paper/retrieving-counterfactuals-improves-visual-in-context-learning", "active_tab": "synced from current hash by the drawer client", "selected_artifact": "retrieving-counterfactuals-improves-visual-in-context-learning", "endpoints": { "paper_pack": "/api/v1/paper/retrieving-counterfactuals-improves-visual-in-context-learning/paper-pack", "build_passport": "/api/v1/paper/retrieving-counterfactuals-improves-visual-in-context-learning/build-passport", "mcp_resource": "sciencetostartup://surfaces/paper-workspace" } }

{ "surface": "paper", "mode": "paper", "query": "Retrieving Counterfactuals Improves Visual In-Context Learning", "normalized_query": "2603.16737", "route": "/paper/retrieving-counterfactuals-improves-visual-in-context-learning", "paper_ref": "retrieving-counterfactuals-improves-visual-in-context-learning", "topic_slug": null, "benchmark_ref": null, "dataset_ref": null }

{ "@context": "https://schema.org", "@graph": [ { "@type": "WebPage", "@id": "https://sciencetostartup.com/paper/retrieving-counterfactuals-improves-visual-in-context-learning#webpage", "url": "https://sciencetostartup.com/paper/retrieving-counterfactuals-improves-visual-in-context-learning", "name": "Retrieving Counterfactuals Improves Visual In-Context Learning", "description": "CIRCLES enhances vision-language models by using counterfactual examples for improved in-context learning and causal reasoning.", "isPartOf": { "@id": "https://sciencetostartup.com/#website" } }, { "@type": "ScholarlyArticle", "@id": "https://sciencetostartup.com/paper/retrieving-counterfactuals-improves-visual-in-context-learning#scholarlyArticle", "headline": "Retrieving Counterfactuals Improves Visual In-Context Learning", "description": "CIRCLES enhances vision-language models by using counterfactual examples for improved in-context learning and causal reasoning.", "url": "https://sciencetostartup.com/paper/retrieving-counterfactuals-improves-visual-in-context-learning", "sameAs": "https://arxiv.org/abs/2603.16737", "identifier": { "@type": "PropertyValue", "propertyID": "arXiv", "value": "2603.16737" }, "isAccessibleForFree": true, "isPartOf": { "@id": "https://sciencetostartup.com/#website" }, "datePublished": "2026-03-17T16:18:09.000Z", "codeRepository": "https://github.com/gzxiong/", "additionalProperty": [ { "@type": "PropertyValue", "propertyID": "viabilityScore", "value": 8 }, { "@type": "PropertyValue", "propertyID": "researchDomain", "value": "Visual Reasoning" } ] }, { "@type": "SoftwareSourceCode", "@id": "https://sciencetostartup.com/paper/retrieving-counterfactuals-improves-visual-in-context-learning#software", "name": "Retrieving Counterfactuals Improves Visual In-Context Learning - Source Code", "description": "CIRCLES enhances vision-language models by using counterfactual examples for improved in-context learning and causal reasoning.", "codeRepository": "https://github.com/gzxiong/", "url": "https://github.com/gzxiong/" }, { "@type": "BreadcrumbList", "itemListElement": [ { "@type": "ListItem", "position": 1, "name": "Home", "item": "https://sciencetostartup.com" }, { "@type": "ListItem", "position": 2, "name": "Visual Reasoning", "item": "https://sciencetostartup.com/topics" }, { "@type": "ListItem", "position": 3, "name": "Retrieving Counterfactuals Improves Visual In-Context Learni", "item": "https://sciencetostartup.com/paper/retrieving-counterfactuals-improves-visual-in-context-learning" } ] }, { "@type": "FAQPage", "mainEntity": [ { "@type": "Question", "name": "What products could be built from this research?", "acceptedAnswer": { "@type": "Answer", "text": "Now is the time because VLMs are increasingly deployed in production but face reliability issues due to spurious correlations, leading to publicized failures in areas like healthcare and safety. The market demands more robust AI, and advancements in retrieval-augmented methods make this approach feasible, with growing datasets and compute enabling practical implementation." } }, { "@type": "Question", "name": "What are the practical use cases?", "acceptedAnswer": { "@type": "Answer", "text": "A medical imaging platform that uses CIRCLES to retrieve counterfactual examples (e.g., X-rays with subtle variations in attributes like tumor size or location) to help radiologists diagnose rare conditions by providing contextually relevant comparisons, enhancing diagnostic accuracy and reducing misdiagnosis rates." } } ] } ] }

Competitive landscape

CIRCLES enhances vision-language models by using counterfactual examples for improved in-context learning and causal reasoning.

Segment

Visual Reasoning

Adoption evidence

Public code linked for build inspection

Commercial read

8.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

Retrieving Counterfactuals Improves Visual In-Context Learning

Retrieving Counterfactuals Improves Visual In-Context Learning

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Related Resources

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Related Resources

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline