OpenRubrics

AI & ML interests

None defined yet.

Recent Activity

lliutianc submitted a paper 3 days ago

Personalization as Inverse Planning: Learning Latent Design Intents for Agentic Slide Generation via Structural Denoising

haoyuw authored a paper about 1 month ago

RUBRIC-ARROW: Alternating Pointwise Rubric Reward Modeling for LLM Post-training in Non-verifiable Domains

Dazzlinglights updated a model about 1 month ago

OpenRubrics/RubricARROW-8B-Rubric

View all activity

Papers

RUBRIC-ARROW: Alternating Pointwise Rubric Reward Modeling for LLM Post-training in Non-verifiable Domains

Alternating Reinforcement Learning for Rubric-Based Reward Modeling in Non-Verifiable LLM Post-Training

View all Papers

lliutianc

submitted a paper to Daily Papers 3 days ago

Personalization as Inverse Planning: Learning Latent Design Intents for Agentic Slide Generation via Structural Denoising

Paper • 2607.00407 • Published 4 days ago • 4

haoyuw

authored a paper about 1 month ago

RUBRIC-ARROW: Alternating Pointwise Rubric Reward Modeling for LLM Post-training in Non-verifiable Domains

Paper • 2605.29156 • Published May 27 • 14

Dazzlinglights

updated a model about 1 month ago

OpenRubrics/RubricARROW-8B-Rubric

Text Generation • 308k • Updated May 30 • 56 • 1

Dazzlinglights

in OpenRubrics/RubricARROW-Judge-SFT about 1 month ago

Add link to paper and task category metadata

#2 opened about 1 month ago by

nielsr

Dazzlinglights

in OpenRubrics/RubricARROW-8B-Judge about 1 month ago

Add metadata and link to paper

#1 opened about 1 month ago by

nielsr

Dazzlinglights

in OpenRubrics/RubricARROW-8B-Rubric about 1 month ago

Add metadata and link to paper

#1 opened about 1 month ago by

nielsr

lliutianc

updated 2 models about 1 month ago

OpenRubrics/RubricARROW-8B-Rubric

Text Generation • 308k • Updated May 30 • 56 • 1

OpenRubrics/RubricARROW-8B-Judge

Text Generation • 308k • Updated May 30 • 50

lliutianc

authored 2 papers about 1 month ago

PEANuT: Parameter-Efficient Adaptation with Weight-aware Neural Tweakers

Paper • 2410.01870 • Published Nov 24, 2025

RUBRIC-ARROW: Alternating Pointwise Rubric Reward Modeling for LLM Post-training in Non-verifiable Domains

Paper • 2605.29156 • Published May 27 • 14

lliutianc

submitted a paper to Daily Papers about 1 month ago

RUBRIC-ARROW: Alternating Pointwise Rubric Reward Modeling for LLM Post-training in Non-verifiable Domains

Paper • 2605.29156 • Published May 27 • 14

Dazzlinglights

updated a dataset about 1 month ago

OpenRubrics/RubricARROW-Judge-SFT

Viewer • Updated May 30 • 119k • 180 • 5

Dazzlinglights

published a dataset about 1 month ago

OpenRubrics/RubricARROW-Judge-SFT

Viewer • Updated May 30 • 119k • 180 • 5

Dazzlinglights

updated a collection about 1 month ago

RubricARROW

Collection

2 items • Updated May 27 • 1

Dazzlinglights

updated a model about 1 month ago

OpenRubrics/RubricARROW-8B-Judge

Text Generation • 308k • Updated May 30 • 50

Dazzlinglights

published 2 models about 1 month ago

OpenRubrics/RubricARROW-8B-Judge

Text Generation • 308k • Updated May 30 • 50

OpenRubrics/RubricARROW-8B-Rubric

Text Generation • 308k • Updated May 30 • 56 • 1

lliutianc

updated 2 models 3 months ago

OpenRubrics/RubricRM-4B-Rubric

196k • Updated Apr 6 • 9

OpenRubrics/RubricRM-4B-Judge

196k • Updated Apr 6 • 3

AI & ML interests

Recent Activity

Papers

Team members 4

OpenRubrics's activity

Add link to paper and task category metadata

Add metadata and link to paper

Add metadata and link to paper