13 17 74

Yang

jacklanda

AI & ML interests

Reasoning, Mech Interp, Semantics

Recent Activity

new activity 2 days ago

RuleReasoner/RuleCollection-32K:Update README

new activity 2 days ago

RuleReasoner/RuleCollection-32K:Update README.md

liked a Space 3 days ago

JoaquinVanschoren/croissant-checker

View all activity

Organizations

New activity in RuleReasoner/RuleCollection-32K 2 days ago

Update README

#6 opened 2 days ago by

jacklanda

Update README.md

#5 opened 2 days ago by

jacklanda

liked a Space 3 days ago

Croissant Checker - Dev

🔎

Validate Croissant dataset files for NeurIPS submissions

updated a dataset 16 days ago

jacklanda/SemanticQA

Updated 16 days ago • 45

published a dataset 16 days ago

jacklanda/SemanticQA

Updated 16 days ago • 45

authored a paper 19 days ago

Revisiting a Pain in the Neck: A Semantic Reasoning Benchmark for Language Models

Paper • 2604.16593 • Published 23 days ago • 6

updated 2 collections 19 days ago

Semantics

Collection

My Research work on (Lexical) Semantics. • 4 items • Updated 19 days ago

Evaluations

Collection

Evals for Language Agents • 4 items • Updated 19 days ago

upvoted a paper 19 days ago

Revisiting a Pain in the Neck: A Semantic Reasoning Benchmark for Language Models

Paper • 2604.16593 • Published 23 days ago • 6

submitted a paper to Daily Papers 19 days ago

Revisiting a Pain in the Neck: A Semantic Reasoning Benchmark for Language Models

Paper • 2604.16593 • Published 23 days ago • 6

updated a collection about 1 month ago

Evaluations

Collection

Evals for Language Agents • 4 items • Updated 19 days ago

updated a dataset 2 months ago

humanlaya-data-lab/OneMillion-Bench

Viewer • Updated Mar 11 • 400 • 235 • 11

commented a paper 2 months ago

\$OneMillion-Bench: How Far are Language Agents from Human Experts?

Paper • 2603.07980 • Published Mar 9 • 27 •

authored a paper 2 months ago

\$OneMillion-Bench: How Far are Language Agents from Human Experts?

Paper • 2603.07980 • Published Mar 9 • 27

upvoted a paper 2 months ago

\$OneMillion-Bench: How Far are Language Agents from Human Experts?

Paper • 2603.07980 • Published Mar 9 • 27

submitted a paper to Daily Papers 2 months ago

\$OneMillion-Bench: How Far are Language Agents from Human Experts?

Paper • 2603.07980 • Published Mar 9 • 27

liked a dataset 2 months ago

humanlaya-data-lab/OneMillion-Bench

Viewer • Updated Mar 11 • 400 • 235 • 11

published a dataset 2 months ago

humanlaya-data-lab/OneMillion-Bench

Viewer • Updated Mar 11 • 400 • 235 • 11

Yang

AI & ML interests

Recent Activity

Organizations

jacklanda's activity

Update README

Update README.md

Croissant Checker - Dev