Ru Peng's picture

10

Ru Peng

RuPeng

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

Energy-based Automated Model Evaluation

upvoted a paper 3 months ago

Group Sequence Policy Optimization

upvoted a paper 3 months ago

Agentic Reinforced Policy Optimization

View all activity

Organizations

None yet

upvoted a paper about 1 month ago

Energy-based Automated Model Evaluation

Paper • 2401.12689 • Published Jan 23, 2024 • 1

upvoted 2 papers 3 months ago

Group Sequence Policy Optimization

Paper • 2507.18071 • Published Jul 24 • 315

Agentic Reinforced Policy Optimization

Paper • 2507.19849 • Published Jul 26 • 158

upvoted 2 papers 4 months ago

Reinforcement Learning with Rubric Anchors

Paper • 2508.12790 • Published Aug 18 • 13

DataMan: Data Manager for Pre-training Large Language Models

Paper • 2502.19363 • Published Feb 26 • 1

upvoted a paper 5 months ago

RefineX: Learning to Refine Pre-training Data at Scale from Expert-Guided Programs

Paper • 2507.03253 • Published Jul 4 • 18

upvoted a paper 9 months ago

START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published Mar 6 • 113

upvoted a paper 12 months ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 376

upvoted 2 papers over 1 year ago

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15, 2024 • 167

DotaMath: Decomposition of Thought with Code Assistance and Self-correction for Mathematical Reasoning

Paper • 2407.04078 • Published Jul 4, 2024 • 21