ARXIV:2604.25109 · AGENT SECURITY · SUBMITTED 29 APR · 02:31 UTC · FRESHNESS STALE

VerifiedSource: PDF linkedVerifiedPaperPack: citation fields availablePartialProof: unverified proof status

Structured Security Auditing and Robustness Enhancement for Untrusted Agent Skills

Lijia Lv · Xuehai Tang · Jie Wen · Jizhong Han · Songlin Hu · arXiv

SkillGuard-Robust is a novel system for auditing untrusted agent skills, improving security review consistency and robustness against semantic-preserving rewrites.

Blocked on Code›Score4.0Evidence unverified

Opportunity summary

Pain SkillGuard-Robust is a novel system for auditing untrusted agent skills, improving security review consistency and robustness against semantic-preserving rewrites.

Evidence 0 refs | 3 sources | 50% coverage

Blocker Evidence unverified

Open Build Read PDF Signal Canvas Track

PROBLEM

SkillGuard-Robust is a novel system for auditing untrusted agent skills, improving security review consistency and robustness against semantic-preserving rewrites. Existing guardrails often flag risk but recover malicious intent inconsistently under semantics-preserving rewrites.

METHOD

Full abstract

Agent Skills package SKILL.md files, scripts, reference documents, and repository context into reusable capability units, turning pre-load auditing from single-prompt filtering into cross-file security review. Existing guardrails often flag risk but recover malicious intent inconsistently under semantics-preserving rewrites. This paper formulates pre-load auditing for untrusted Agent Skills as a robust three-way classification task and introduces SkillGuard-Robust, which combines role-aware evidence extraction, selective semantic verification, and consistency-preserving adjudication. We evaluate SkillGuard-Robust on SkillGuardBench and two public-ecosystem extensions through five large evaluation views ranging from 254 to 404 packages. On the 404-package held-out aggregate, SkillGuard-Robust reaches 97.30% overall exact match, 98.33% malicious-risk recall, and 98.89% attack exact consistency. On the 254-package external-ecosystem view, it reaches 99.66%, 100.00%, and 100.00%, respectively. These results support a bounded conclusion: factorized package auditing materially improves frozen and public-ecosystem robustness, while harsher external-source transfer remains an open challenge.

RESULT

ScienceToStartup currently rates this 4.0/10 on the public viability pass. These results support a bounded conclusion: factorized package auditing materially improves frozen and public-ecosystem robustness, while harsher external-source transfer remains an open challenge.

WHY NOW

Agent Security moved forward this cycle; last verified April 2026. Public score 4.0/10.

Continue into Read for claims, analysis, references, and neighboring papers.

Opportunity summary

Score4.0

PainSkillGuard-Robust is a novel system for auditing untrusted agent skills, improving security review consistency and robustness against semantic-preserving rewrites.

Evidence0 refs | 3 sources | 50% coverage

Blockerno shell-level blocker reported

Analysis summary

SkillGuard-Robust is a novel system for auditing untrusted agent skills, improving security review consistency and robustness against semantic-preserving rewrites.

VerifiedSource: PDF linkedVerifiedPaperPack: citation fields availablePartialProof: unverified proof status

Competitive landscape

SkillGuard-Robust is a novel system for auditing untrusted agent skills, improving security review consistency and robustness against semantic-preserving rewrites.

Segment

Agent Security

Adoption evidence

No public code link in the paper record yet

Commercial read

4.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

{ "contract_version": "paper-r2", "paper_id": "e0a8c9e9-f0e5-48f9-9334-da07d07783fa", "arxiv_id": "2604.25109", "canonical_route": "/paper/structured-security-auditing-and-robustness-enhancement-for-untrusted-agent-skills", "active_tab": "synced from current hash by the drawer client", "selected_artifact": "structured-security-auditing-and-robustness-enhancement-for-untrusted-agent-skills", "endpoints": { "paper_pack": "/api/v1/paper/structured-security-auditing-and-robustness-enhancement-for-untrusted-agent-skills/paper-pack", "build_passport": "/api/v1/paper/structured-security-auditing-and-robustness-enhancement-for-untrusted-agent-skills/build-passport", "mcp_resource": "sciencetostartup://surfaces/paper-workspace" } }

{ "surface": "paper", "mode": "paper", "query": "Structured Security Auditing and Robustness Enhancement for Untrusted Agent Skills", "normalized_query": "2604.25109", "route": "/paper/structured-security-auditing-and-robustness-enhancement-for-untrusted-agent-skills", "paper_ref": "structured-security-auditing-and-robustness-enhancement-for-untrusted-agent-skills", "topic_slug": null, "benchmark_ref": null, "dataset_ref": null }

{ "@context": "https://schema.org", "@graph": [ { "@type": "WebPage", "@id": "https://sciencetostartup.com/paper/structured-security-auditing-and-robustness-enhancement-for-untrusted-agent-skills#webpage", "url": "https://sciencetostartup.com/paper/structured-security-auditing-and-robustness-enhancement-for-untrusted-agent-skills", "name": "Structured Security Auditing and Robustness Enhancement for Untrusted Agent Skills", "description": "SkillGuard-Robust is a novel system for auditing untrusted agent skills, improving security review consistency and robustness against semantic-preserving rewrites.", "isPartOf": { "@id": "https://sciencetostartup.com/#website" } }, { "@type": "ScholarlyArticle", "@id": "https://sciencetostartup.com/paper/structured-security-auditing-and-robustness-enhancement-for-untrusted-agent-skills#scholarlyArticle", "headline": "Structured Security Auditing and Robustness Enhancement for Untrusted Agent Skills", "description": "SkillGuard-Robust is a novel system for auditing untrusted agent skills, improving security review consistency and robustness against semantic-preserving rewrites.", "url": "https://sciencetostartup.com/paper/structured-security-auditing-and-robustness-enhancement-for-untrusted-agent-skills", "sameAs": "https://arxiv.org/abs/2604.25109", "identifier": { "@type": "PropertyValue", "propertyID": "arXiv", "value": "2604.25109" }, "isAccessibleForFree": true, "isPartOf": { "@id": "https://sciencetostartup.com/#website" }, "datePublished": "2026-04-28T01:32:27.000Z", "author": [ { "@type": "Person", "name": "Lijia Lv" }, { "@type": "Person", "name": "Xuehai Tang" }, { "@type": "Person", "name": "Jie Wen" }, { "@type": "Person", "name": "Jizhong Han" }, { "@type": "Person", "name": "Songlin Hu" } ], "additionalProperty": [ { "@type": "PropertyValue", "propertyID": "viabilityScore", "value": 4 }, { "@type": "PropertyValue", "propertyID": "researchDomain", "value": "Agent Security" } ] }, { "@type": "BreadcrumbList", "itemListElement": [ { "@type": "ListItem", "position": 1, "name": "Home", "item": "https://sciencetostartup.com" }, { "@type": "ListItem", "position": 2, "name": "Agent Security", "item": "https://sciencetostartup.com/topics" }, { "@type": "ListItem", "position": 3, "name": "Structured Security Auditing and Robustness Enhancement for ", "item": "https://sciencetostartup.com/paper/structured-security-auditing-and-robustness-enhancement-for-untrusted-agent-skills" } ] } ] }

Competitive landscape

SkillGuard-Robust is a novel system for auditing untrusted agent skills, improving security review consistency and robustness against semantic-preserving rewrites.

Segment

Agent Security

Adoption evidence

No public code link in the paper record yet

Commercial read

4.0/10 public viability

Direct

not classified

Adjacent

not classified

Substitute

not classified

Unknown

not classified

Structured Security Auditing and Robustness Enhancement for Untrusted Agent Skills

Structured Security Auditing and Robustness Enhancement for Untrusted Agent Skills

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Related Resources

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline

Claim map

Constellation map

Competitive landscape

Buzz

PDF

REFERENCES

Related Papers

Related Resources

Subscribe to the weekly brief

Build artifacts

Brief

Experiment plan

Validation checklist

Scientific founder

Translational engineer

Domain operator

GTM lead

Regulatory/clinical advisor

Timeline