ARXIV:2605.12895 · MEDICAL AI · SUBMITTED 14 MAY · 20:10 UTC · FRESHNESS FRESH

VerifiedSource: PDF linkedVerifiedPaperPack: citation fields availablePartialProof: unverified proof status

RISED: A Pre-Deployment Safety Evaluation Framework for Clinical AI Decision-Support Systems

Rohith Reddy Bellibatlu · arXiv

A Python package for pre-deployment safety evaluation of clinical AI decision-support systems, addressing reliability, inclusivity, sensitivity, equity, and deployability.

Ship in 2-4 weeks›Score7.0Evidence unverified

Opportunity summary

Pain A Python package for pre-deployment safety evaluation of clinical AI decision-support systems, addressing reliability, inclusivity, sensitivity, equity, and deployability.

Evidence 0 refs | 0 sources | 0% coverage

Blocker Evidence unverified

Open Build Read PDF Signal Canvas Track

PROBLEM

A Python package for pre-deployment safety evaluation of clinical AI decision-support systems, addressing reliability, inclusivity, sensitivity, equity, and deployability. We propose the RISED Framework: a five-dimension pre-deployment evaluation covering Reliability, Inclusivity, Sensitivity, Equity, and…

METHOD

Full abstract

Aggregate accuracy metrics dominate the evaluation of clinical AI decision-support systems but do not detect deployment-phase failures of input reliability, subgroup equity, threshold sensitivity, or operational feasibility. We propose the RISED Framework: a five-dimension pre-deployment evaluation covering Reliability, Inclusivity, Sensitivity, Equity, and Deployability, in which each dimension is operationalized through formal sub-criteria, pre-specified pass/fail thresholds, and bias-corrected accelerated (BCa) bootstrap 95% confidence intervals combined under a Holm-Bonferroni family-wise error correction. A central demonstration is that a classifier satisfying conventional high-discrimination benchmarks can simultaneously fail input-encoding stability and threshold-shift sensitivity checks, while subgroup AUC parity remains statistically inconclusive, pointing to deployment risks that aggregate evaluation alone cannot detect. We validate this differential pass/fail pattern on a synthetic cohort and three publicly available real-world cohorts spanning 35 years of clinical data vintage, from a 1980s cardiology dataset to a 2024 nationally representative health survey, where failing dimensions differ across cohorts, providing preliminary evidence of construct validity. The Equity dimension is reframed as a proxy-dependence diagnostic rather than a stand-alone gate: any need-based fairness verdict computed against a utilization-derived proxy carries a construct-validity problem the framework surfaces explicitly, triggering a procurement requirement for an outcome-independent need measure before the gate is binding. RISED is released as an open-source Python package that supplies the quantitative verdicts existing clinical AI reporting standards require, providing a principled gateway between in-silico model validation and silent-trial clinical evaluation.

RESULT

ScienceToStartup currently rates this 7.0/10 on the public viability pass. Aggregate accuracy metrics dominate the evaluation of clinical AI decision-support systems but do not detect deployment-phase failures of input reliability, subgroup equity, threshold sensitivity,…

WHY NOW

Medical AI moved forward this cycle; last verified May 2026. Public score 7.0/10. Implementation evidence is present through a linked repository.

Continue into Read for claims, analysis, references, and neighboring papers.

Opportunity summary

Score7.0

PainA Python package for pre-deployment safety evaluation of clinical AI decision-support systems, addressing reliability, inclusivity, sensitivity, equity, and deployability.

Evidence0 refs | 0 sources | 0% coverage

Blockerno shell-level blocker reported

Analysis summary

A Python package for pre-deployment safety evaluation of clinical AI decision-support systems, addressing reliability, inclusivity, sensitivity, equity, and deployability.

VerifiedSource: PDF linkedVerifiedPaperPack: citation fields availablePartialProof: unverified proof status

Competitive landscape

A Python package for pre-deployment safety evaluation of clinical AI decision-support systems, addressing reliability, inclusivity, sensitivity, equity, and deployability.

Segment

Medical AI

Adoption evidence

Public code linked for build inspection

Commercial read

7.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

{ "contract_version": "paper-r2", "paper_id": "9252481e-d654-43e4-8e23-563be7cb6060", "arxiv_id": "2605.12895", "canonical_route": "/paper/rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems", "active_tab": "synced from current hash by the drawer client", "selected_artifact": "rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems", "endpoints": { "paper_pack": "/api/v1/paper/rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems/paper-pack", "build_passport": "/api/v1/paper/rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems/build-passport", "mcp_resource": "sciencetostartup://surfaces/paper-workspace" } }

{ "surface": "paper", "mode": "paper", "query": "RISED: A Pre-Deployment Safety Evaluation Framework for Clinical AI Decision-Support Systems", "normalized_query": "2605.12895", "route": "/paper/rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems", "paper_ref": "rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems", "topic_slug": null, "benchmark_ref": null, "dataset_ref": null }

{ "@context": "https://schema.org", "@graph": [ { "@type": "WebPage", "@id": "https://sciencetostartup.com/paper/rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems#webpage", "url": "https://sciencetostartup.com/paper/rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems", "name": "RISED: A Pre-Deployment Safety Evaluation Framework for Clinical AI Decision-Support Systems", "description": "A Python package for pre-deployment safety evaluation of clinical AI decision-support systems, addressing reliability, inclusivity, sensitivity, equity, and deployability.", "isPartOf": { "@id": "https://sciencetostartup.com/#website" } }, { "@type": "ScholarlyArticle", "@id": "https://sciencetostartup.com/paper/rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems#scholarlyArticle", "headline": "RISED: A Pre-Deployment Safety Evaluation Framework for Clinical AI Decision-Support Systems", "description": "A Python package for pre-deployment safety evaluation of clinical AI decision-support systems, addressing reliability, inclusivity, sensitivity, equity, and deployability.", "url": "https://sciencetostartup.com/paper/rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems", "sameAs": "https://arxiv.org/abs/2605.12895", "identifier": { "@type": "PropertyValue", "propertyID": "arXiv", "value": "2605.12895" }, "isAccessibleForFree": true, "isPartOf": { "@id": "https://sciencetostartup.com/#website" }, "datePublished": "2026-05-13T02:17:13.000Z", "author": [ { "@type": "Person", "name": "Rohith Reddy Bellibatlu" } ], "codeRepository": "https://github.com/rohithreddybc/rised-healthcare-eval", "additionalProperty": [ { "@type": "PropertyValue", "propertyID": "viabilityScore", "value": 7 }, { "@type": "PropertyValue", "propertyID": "researchDomain", "value": "Medical AI" }, { "@type": "PropertyValue", "propertyID": "commercialReadiness", "value": "code, repo url" } ] }, { "@type": "SoftwareSourceCode", "@id": "https://sciencetostartup.com/paper/rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems#software", "name": "RISED: A Pre-Deployment Safety Evaluation Framework for Clinical AI Decision-Support Systems - Source Code", "description": "A Python package for pre-deployment safety evaluation of clinical AI decision-support systems, addressing reliability, inclusivity, sensitivity, equity, and deployability.", "codeRepository": "https://github.com/rohithreddybc/rised-healthcare-eval", "url": "https://github.com/rohithreddybc/rised-healthcare-eval" }, { "@type": "BreadcrumbList", "itemListElement": [ { "@type": "ListItem", "position": 1, "name": "Home", "item": "https://sciencetostartup.com" }, { "@type": "ListItem", "position": 2, "name": "Medical AI", "item": "https://sciencetostartup.com/topics" }, { "@type": "ListItem", "position": 3, "name": "RISED: A Pre-Deployment Safety Evaluation Framework for Clin", "item": "https://sciencetostartup.com/paper/rised-a-pre-deployment-safety-evaluation-framework-for-clinical-ai-decision-support-systems" } ] } ] }

Competitive landscape

A Python package for pre-deployment safety evaluation of clinical AI decision-support systems, addressing reliability, inclusivity, sensitivity, equity, and deployability.

Segment

Medical AI

Adoption evidence

Public code linked for build inspection

Commercial read

7.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

RISED: A Pre-Deployment Safety Evaluation Framework for Clinical AI Decision-Support Systems

RISED: A Pre-Deployment Safety Evaluation Framework for Clinical AI Decision-Support Systems

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Related Resources

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Related Resources

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline