Self-Supervised On-Policy Reinforcement Learning via Contrastive Proximal Policy Optimisation

Self-Supervised On-Policy Reinforcement Learning via Contrastive Proximal Policy Optimisation | Signal Canvas | ScienceToStartup

Page Freshness

Signal Canvas proof surface

Canonical route: /signal-canvas/self-supervised-on-policy-reinforcement-learning-via-contrastive-proximal-policy-optimisation

stale

Proof freshness: fresh
Proof status: unverified
Display score: 4/10
Last proof check: 2026-05-14
Score updated: 2026-05-14
Score fresh until: 2026-06-13
References: 0
Source count: 0
Coverage: 0%

This page is showing the last landed evidence receipt and score bundle because the latest proof data is outside the freshness window.

Agent Handoff

Canonical ID self-supervised-on-policy-reinforcement-learning-via-contrastive-proximal-policy-optimisation | Route /signal-canvas/self-supervised-on-policy-reinforcement-learning-via-contrastive-proximal-policy-optimisation

REST example

curl https://sciencetostartup.com/api/v1/agent-handoff/signal-canvas/self-supervised-on-policy-reinforcement-learning-via-contrastive-proximal-policy-optimisation

MCP example

{
  "tool": "search_signal_canvas",
  "arguments": {
    "mode": "paper",
    "paper_ref": "self-supervised-on-policy-reinforcement-learning-via-contrastive-proximal-policy-optimisation",
    "query_text": "Summarize Self-Supervised On-Policy Reinforcement Learning via Contrastive Proximal Policy Optimisation"
  }
}

source_context

{
  "surface": "signal_canvas",
  "mode": "paper",
  "query": "Self-Supervised On-Policy Reinforcement Learning via Contrastive Proximal Policy Optimisation",
  "normalized_query": "2605.13554",
  "route": "/signal-canvas/self-supervised-on-policy-reinforcement-learning-via-contrastive-proximal-policy-optimisation",
  "paper_ref": "self-supervised-on-policy-reinforcement-learning-via-contrastive-proximal-policy-optimisation",
  "topic_slug": null,
  "benchmark_ref": null,
  "dataset_ref": null
}

Evidence Receipt

Route status: building

Claims: 0

References: Pending verification

Proof: Verification pending

Freshness state: computing

Source paper: Self-Supervised On-Policy Reinforcement Learning via Contrastive Proximal Policy Optimisation

PDF: https://arxiv.org/pdf/2605.13554v1

Source count: Pending verification

Coverage: 0%

Last proof check: 2026-05-14T20:10:28.671Z

Signal Canvas receipt window

Not build-ready: Self-Supervised On-Policy Reinforcement Learning via Contrastive Proximal Policy Optimisation

/buildability/self-supervised-on-policy-reinforcement-learning-via-contrastive-proximal-policy-optimisation

Ignoreblocked

Subject: Self-Supervised On-Policy Reinforcement Learning via Contrastive Proximal Policy Optimisation

Verdict

Ignore

Verdict is Ignore because current viability and proof state do not clear the buildability gate.

Self-Supervised On-Policy Reinforcement Learning via Contrastive Proximal Policy Optimisation

Use Signal Canvas as the narrative proof surface

Use this Signal Canvas via API or MCP

Signal Canvas proof surface