ARXIV:2603.17705 · MULTIMODAL REMOTE SENSING · SUBMITTED 19 MAR · 21:58 UTC · FRESHNESS STALE

VerifiedSource: PDF linkedPartialPaperPack: 3 of 4 citation fields filledMissingMissing fields: authorsPartialProof: unverified proof status

Parameter-Efficient Modality-Balanced Symmetric Fusion for Multimodal Remote Sensing Semantic Segmentation

arXiv

MoBaNet is a parameter-efficient framework for multimodal remote sensing semantic segmentation that balances modality contributions while minimizing computational overhead.

Blocked on Code›Score8.0Evidence unverified

Opportunity summary

Pain MoBaNet is a parameter-efficient framework for multimodal remote sensing semantic segmentation that balances modality contributions while minimizing computational overhead.

Evidence 0 refs | 0 sources | 50% coverage

Blocker Evidence unverified

Open Build Read PDF Signal Canvas Track

PROBLEM

MoBaNet is a parameter-efficient framework for multimodal remote sensing semantic segmentation that balances modality contributions while minimizing computational overhead. Although pretrained Vision Foundation Models (VFMs) provide strong general-purpose representations, adapting them to multimodal tasks…

METHOD

Full abstract

Multimodal remote sensing semantic segmentation enhances scene interpretation by exploiting complementary physical cues from heterogeneous data. Although pretrained Vision Foundation Models (VFMs) provide strong general-purpose representations, adapting them to multimodal tasks often incurs substantial computational overhead and is prone to modality imbalance, where the contribution of auxiliary modalities is suppressed during optimization. To address these challenges, we propose MoBaNet, a parameter-efficient and modality-balanced symmetric fusion framework. Built upon a largely frozen VFM backbone, MoBaNet adopts a symmetric dual-stream architecture to preserve generalizable representations while minimizing the number of trainable parameters. Specifically, we design a Cross-modal Prompt-Injected Adapter (CPIA) to enable deep semantic interaction by generating shared prompts and injecting them into bottleneck adapters under the frozen backbone. To obtain compact and discriminative multimodal representations for decoding, we further introduce a Difference-Guided Gated Fusion Module (DGFM), which adaptively fuses paired stage features by explicitly leveraging cross-modal discrepancy to guide feature selection. Furthermore, we propose a Modality-Conditional Random Masking (MCRM) strategy to mitigate modality imbalance by masking one modality only during training and imposing hard-pixel auxiliary supervision on modality-specific branches. Extensive experiments on the ISPRS Vaihingen and Potsdam benchmarks demonstrate that MoBaNet achieves state-of-the-art performance with significantly fewer trainable parameters than full fine-tuning, validating its effectiveness for robust and balanced multimodal fusion. The source code in this work is available at https://github.com/sauryeo/MoBaNet.

RESULT

ScienceToStartup currently rates this 8.0/10 on the public viability pass. Specifically, we design a Cross-modal Prompt-Injected Adapter (CPIA) to enable deep semantic interaction by generating shared prompts and injecting them into bottleneck adapters under…

WHY NOW

Multimodal Remote Sensing moved forward this cycle; last verified April 2026. Public score 8.0/10. Implementation evidence is present through a linked repository.

Continue into Read for claims, analysis, references, and neighboring papers.

Opportunity summary

Score8.0

PainMoBaNet is a parameter-efficient framework for multimodal remote sensing semantic segmentation that balances modality contributions while minimizing computational overhead.

Evidence0 refs | 0 sources | 50% coverage

Blockermissing authors

Analysis summary

MoBaNet is a parameter-efficient framework for multimodal remote sensing semantic segmentation that balances modality contributions while minimizing computational overhead.

VerifiedSource: PDF linkedPartialPaperPack: 3 of 4 citation fields filledMissingMissing fields: authorsPartialProof: unverified proof status

Competitive landscape

MoBaNet is a parameter-efficient framework for multimodal remote sensing semantic segmentation that balances modality contributions while minimizing computational overhead.

Segment

Multimodal Remote Sensing

Adoption evidence

Public code linked for build inspection

Commercial read

8.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

{ "contract_version": "paper-r2", "paper_id": "c0a21c15-da14-41d6-a0d7-933c4768a627", "arxiv_id": "2603.17705", "canonical_route": "/paper/parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation", "active_tab": "synced from current hash by the drawer client", "selected_artifact": "parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation", "endpoints": { "paper_pack": "/api/v1/paper/parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation/paper-pack", "build_passport": "/api/v1/paper/parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation/build-passport", "mcp_resource": "sciencetostartup://surfaces/paper-workspace" } }

{ "surface": "paper", "mode": "paper", "query": "Parameter-Efficient Modality-Balanced Symmetric Fusion for Multimodal Remote Sensing Semantic Segmentation", "normalized_query": "2603.17705", "route": "/paper/parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation", "paper_ref": "parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation", "topic_slug": null, "benchmark_ref": null, "dataset_ref": null }

{ "@context": "https://schema.org", "@graph": [ { "@type": "WebPage", "@id": "https://sciencetostartup.com/paper/parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation#webpage", "url": "https://sciencetostartup.com/paper/parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation", "name": "Parameter-Efficient Modality-Balanced Symmetric Fusion for Multimodal Remote Sensing Semantic Segmentation", "description": "MoBaNet is a parameter-efficient framework for multimodal remote sensing semantic segmentation that balances modality contributions while minimizing computational overhead.", "isPartOf": { "@id": "https://sciencetostartup.com/#website" } }, { "@type": "ScholarlyArticle", "@id": "https://sciencetostartup.com/paper/parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation#scholarlyArticle", "headline": "Parameter-Efficient Modality-Balanced Symmetric Fusion for Multimodal Remote Sensing Semantic Segmentation", "description": "MoBaNet is a parameter-efficient framework for multimodal remote sensing semantic segmentation that balances modality contributions while minimizing computational overhead.", "url": "https://sciencetostartup.com/paper/parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation", "sameAs": "https://arxiv.org/abs/2603.17705", "identifier": { "@type": "PropertyValue", "propertyID": "arXiv", "value": "2603.17705" }, "isAccessibleForFree": true, "isPartOf": { "@id": "https://sciencetostartup.com/#website" }, "datePublished": "2026-03-18T13:23:58.000Z", "codeRepository": "https://github.com/sauryeo/MoBaNet", "additionalProperty": [ { "@type": "PropertyValue", "propertyID": "viabilityScore", "value": 8 }, { "@type": "PropertyValue", "propertyID": "researchDomain", "value": "Multimodal Remote Sensing" } ] }, { "@type": "SoftwareSourceCode", "@id": "https://sciencetostartup.com/paper/parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation#software", "name": "Parameter-Efficient Modality-Balanced Symmetric Fusion for Multimodal Remote Sensing Semantic Segmentation - Source Code", "description": "MoBaNet is a parameter-efficient framework for multimodal remote sensing semantic segmentation that balances modality contributions while minimizing computational overhead.", "codeRepository": "https://github.com/sauryeo/MoBaNet", "url": "https://github.com/sauryeo/MoBaNet" }, { "@type": "BreadcrumbList", "itemListElement": [ { "@type": "ListItem", "position": 1, "name": "Home", "item": "https://sciencetostartup.com" }, { "@type": "ListItem", "position": 2, "name": "Multimodal Remote Sensing", "item": "https://sciencetostartup.com/topics" }, { "@type": "ListItem", "position": 3, "name": "Parameter-Efficient Modality-Balanced Symmetric Fusion for M", "item": "https://sciencetostartup.com/paper/parameter-efficient-modality-balanced-symmetric-fusion-for-multimodal-remote-sensing-semantic-segmentation" } ] } ] }

Competitive landscape

MoBaNet is a parameter-efficient framework for multimodal remote sensing semantic segmentation that balances modality contributions while minimizing computational overhead.

Segment

Multimodal Remote Sensing

Adoption evidence

Public code linked for build inspection

Commercial read

8.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

Parameter-Efficient Modality-Balanced Symmetric Fusion for Multimodal Remote Sensing Semantic Segmentation

Parameter-Efficient Modality-Balanced Symmetric Fusion for Multimodal Remote Sensing Semantic Segmentation

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline