2 568

Lei Wang

demolei

https://demoleiwang.github.io/HomePage/

AI & ML interests

LLMs

Recent Activity

upvoted a paper about 20 hours ago

Omni-WorldBench: Towards a Comprehensive Interaction-Centric Evaluation for World Models

upvoted a paper 2 days ago

HopChain: Multi-Hop Data Synthesis for Generalizable Vision-Language Reasoning

upvoted a paper 3 days ago

ProRL Agent: Rollout-as-a-Service for RL Training of Multi-Turn LLM Agents

View all activity

Organizations

upvoted a paper about 20 hours ago

Omni-WorldBench: Towards a Comprehensive Interaction-Centric Evaluation for World Models

Paper • 2603.22212 • Published 1 day ago • 114

upvoted a paper 2 days ago

HopChain: Multi-Hop Data Synthesis for Generalizable Vision-Language Reasoning

Paper • 2603.17024 • Published 8 days ago • 100

upvoted 3 papers 3 days ago

ProRL Agent: Rollout-as-a-Service for RL Training of Multi-Turn LLM Agents

Paper • 2603.18815 • Published 6 days ago • 10

Memento-Skills: Let Agents Design Agents

Paper • 2603.18743 • Published 6 days ago • 50

Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation

Paper • 2603.19220 • Published 6 days ago • 57

upvoted a paper 7 days ago

MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification

Paper • 2603.15726 • Published 9 days ago • 179

upvoted 3 papers 8 days ago

EvoScientist: Towards Multi-Agent Evolving AI Scientists for End-to-End Scientific Discovery

Paper • 2603.08127 • Published 16 days ago • 15

daVinci-Env: Open SWE Environment Synthesis at Scale

Paper • 2603.13023 • Published 12 days ago • 29

Attention Residuals

Paper • 2603.15031 • Published 9 days ago • 159

upvoted a paper 9 days ago

IndexCache: Accelerating Sparse Attention via Cross-Layer Index Reuse

Paper • 2603.12201 • Published 13 days ago • 52

upvoted an article 10 days ago

Article

Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries

15 days ago

•

upvoted a paper 14 days ago

MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data

Paper • 2603.09206 • Published 15 days ago • 52

upvoted a collection 14 days ago

MiroThinker-1.7

Collection

2 items • Updated 14 days ago • 52

upvoted 4 papers 18 days ago

On-Policy Self-Distillation for Reasoning Compression

Paper • 2603.05433 • Published 20 days ago • 6

Interactive Benchmarks

Paper • 2603.04737 • Published 20 days ago • 18

AgentVista: Evaluating Multimodal Agents in Ultra-Challenging Realistic Visual Scenarios

Paper • 2602.23166 • Published 27 days ago • 44

SkillNet: Create, Evaluate, and Connect AI Skills

Paper • 2603.04448 • Published 27 days ago • 91

upvoted 2 papers 19 days ago

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published 22 days ago • 188

MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

Paper • 2603.03756 • Published 21 days ago • 89

upvoted a paper 22 days ago

dLLM: Simple Diffusion Language Modeling

Paper • 2602.22661 • Published 27 days ago • 149

Lei Wang

AI & ML interests

Recent Activity

Organizations

demolei's activity

Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries