ARXIV:2603.11798 · MULTI-DOCUMENT QUESTION ANSWERING · SUBMITTED 17 MAR · 21:43 UTC · FRESHNESS STALE

VerifiedSource: PDF linkedPartialPaperPack: 3 of 4 citation fields filledMissingMissing fields: authorsErrorProof: failed

DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

arXiv

DocSage is an advanced framework for multi-document multi-entity question answering that enhances relational reasoning and information extraction.

Blocked on Code›Score8.0Evidence failed

Opportunity summary

Pain DocSage is an advanced framework for multi-document multi-entity question answering that enhances relational reasoning and information extraction.

Evidence 0 refs | 0 sources | 33% coverage

Blocker Evidence failed

Open Build Read PDF Signal Canvas Track

PROBLEM

DocSage is an advanced framework for multi-document multi-entity question answering that enhances relational reasoning and information extraction. However, existing Large Language Models (LLMs) and Retrieval-Augmented Generation (RAG) frameworks suffer from critical limitations: standard RAG's…

METHOD

Full abstract

Multi-document Multi-entity Question Answering inherently demands models to track implicit logic between multiple entities across scattered documents. However, existing Large Language Models (LLMs) and Retrieval-Augmented Generation (RAG) frameworks suffer from critical limitations: standard RAG's vector similarity-based coarse-grained retrieval often omits critical facts, graph-based RAG fails to efficiently integrate fragmented complex relationship networks, and both lack schema awareness, leading to inadequate cross-document evidence chain construction and inaccurate entity relationship deduction. To address these challenges, we propose DocSage, an end-to-end agentic framework that integrates dynamic schema discovery, structured information extraction, and schema-aware relational reasoning with error guarantees. DocSage operates through three core modules: (1) A schema discovery module dynamically infers query-specific minimal joinable schemas to capture essential entities and relationships; (2) An extraction module transforms unstructured text into semantically coherent relational tables, enhanced by error-aware correction mechanisms to reduce extraction errors; (3) A reasoning module performs multi-hop relational reasoning over structured tables, leveraging schema awareness to efficiently align cross-document entities and aggregate evidence. This agentic design offers three key advantages: precise fact localization via SQL-powered indexing, natural support for cross-document entity joins through relational tables, and mitigated LLM attention diffusion via structured representation. Evaluations on two MDMEQA benchmarks demonstrate that DocSage significantly outperforms state-of-the-art long-context LLMs and RAG systems, achieving more than 27% accuracy improvements respectively.

RESULT

ScienceToStartup currently rates this 8.0/10 on the public viability pass. This agentic design offers three key advantages: precise fact localization via SQL-powered indexing, natural support for cross-document entity joins through relational tables, and mitigated…

WHY NOW

Multi-Document Question Answering moved forward this cycle; last verified April 2026. Public score 8.0/10.

Continue into Read for claims, analysis, references, and neighboring papers.

Opportunity summary

Score8.0

PainDocSage is an advanced framework for multi-document multi-entity question answering that enhances relational reasoning and information extraction.

Evidence0 refs | 0 sources | 33% coverage

Blockermissing authors

Analysis summary

DocSage is an advanced framework for multi-document multi-entity question answering that enhances relational reasoning and information extraction.

VerifiedSource: PDF linkedPartialPaperPack: 3 of 4 citation fields filledMissingMissing fields: authorsErrorProof: failed

Competitive landscape

DocSage is an advanced framework for multi-document multi-entity question answering that enhances relational reasoning and information extraction.

Segment

Multi-Document Question Answering

Adoption evidence

No public code link in the paper record yet

Commercial read

8.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

{ "contract_version": "paper-r2", "paper_id": "cb4f3bca-c711-4ce9-bb96-9366c99998f8", "arxiv_id": "2603.11798", "canonical_route": "/paper/docsage-an-information-structuring-agent-for-multi-doc-multi-entity-question-answering", "active_tab": "synced from current hash by the drawer client", "selected_artifact": "docsage-an-information-structuring-agent-for-multi-doc-multi-entity-question-answering", "endpoints": { "paper_pack": "/api/v1/paper/docsage-an-information-structuring-agent-for-multi-doc-multi-entity-question-answering/paper-pack", "build_passport": "/api/v1/paper/docsage-an-information-structuring-agent-for-multi-doc-multi-entity-question-answering/build-passport", "mcp_resource": "sciencetostartup://surfaces/paper-workspace" } }

{ "surface": "paper", "mode": "paper", "query": "DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering", "normalized_query": "2603.11798", "route": "/paper/docsage-an-information-structuring-agent-for-multi-doc-multi-entity-question-answering", "paper_ref": "docsage-an-information-structuring-agent-for-multi-doc-multi-entity-question-answering", "topic_slug": null, "benchmark_ref": null, "dataset_ref": null }

{ "@context": "https://schema.org", "@graph": [ { "@type": "WebPage", "@id": "https://sciencetostartup.com/paper/docsage-an-information-structuring-agent-for-multi-doc-multi-entity-question-answering#webpage", "url": "https://sciencetostartup.com/paper/docsage-an-information-structuring-agent-for-multi-doc-multi-entity-question-answering", "name": "DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering", "description": "DocSage is an advanced framework for multi-document multi-entity question answering that enhances relational reasoning and information extraction.", "isPartOf": { "@id": "https://sciencetostartup.com/#website" } }, { "@type": "ScholarlyArticle", "@id": "https://sciencetostartup.com/paper/docsage-an-information-structuring-agent-for-multi-doc-multi-entity-question-answering#scholarlyArticle", "headline": "DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering", "description": "DocSage is an advanced framework for multi-document multi-entity question answering that enhances relational reasoning and information extraction.", "url": "https://sciencetostartup.com/paper/docsage-an-information-structuring-agent-for-multi-doc-multi-entity-question-answering", "sameAs": "https://arxiv.org/abs/2603.11798", "identifier": { "@type": "PropertyValue", "propertyID": "arXiv", "value": "2603.11798" }, "isAccessibleForFree": true, "isPartOf": { "@id": "https://sciencetostartup.com/#website" }, "datePublished": "2026-03-12T11:00:09.000Z", "additionalProperty": [ { "@type": "PropertyValue", "propertyID": "viabilityScore", "value": 8 }, { "@type": "PropertyValue", "propertyID": "researchDomain", "value": "Multi-Document Question Answering" } ] }, { "@type": "BreadcrumbList", "itemListElement": [ { "@type": "ListItem", "position": 1, "name": "Home", "item": "https://sciencetostartup.com" }, { "@type": "ListItem", "position": 2, "name": "Multi-Document Question Answering", "item": "https://sciencetostartup.com/topics" }, { "@type": "ListItem", "position": 3, "name": "DocSage: An Information Structuring Agent for Multi-Doc Mult", "item": "https://sciencetostartup.com/paper/docsage-an-information-structuring-agent-for-multi-doc-multi-entity-question-answering" } ] } ] }

Competitive landscape

DocSage is an advanced framework for multi-document multi-entity question answering that enhances relational reasoning and information extraction.

Segment

Multi-Document Question Answering

Adoption evidence

No public code link in the paper record yet

Commercial read

8.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline