agent - a yjgYJG Collection

yjgYJG 's Collections

agent

agent

updated 3 days ago

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published 18 days ago • 191
ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas

Paper • 2601.21558 • Published 8 days ago • 56
Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

Paper • 2601.22975 • Published 7 days ago • 80