Dongfu Jiang's picture

Dongfu Jiang

DongfuJiang

·

https://jdf-prog.github.io/

AI & ML interests

Large Language Model, Modality Reasoning and their evaluation

Recent Activity

upvoted a paper about 12 hours ago

ClawBench: Can AI Agents Complete Everyday Online Tasks?

upvoted a paper 3 days ago

Watch Before You Answer: Learning from Visually Grounded Post-Training

upvoted a paper 8 days ago

ImagenWorld: Stress-Testing Image Generation Models with Explainable Human Evaluation on Open-ended Real-World Tasks

View all activity

Organizations

upvoted a paper about 12 hours ago

ClawBench: Can AI Agents Complete Everyday Online Tasks?

Paper • 2604.08523 • Published 3 days ago • 98

upvoted a paper 3 days ago

Watch Before You Answer: Learning from Visually Grounded Post-Training

Paper • 2604.05117 • Published 6 days ago • 31

upvoted a paper 8 days ago

ImagenWorld: Stress-Testing Image Generation Models with Explainable Human Evaluation on Open-ended Real-World Tasks

Paper • 2603.27862 • Published 13 days ago • 30

authored 3 papers 17 days ago

EvolveCoder: Evolving Test Cases via Adversarial Verification for Code Reinforcement Learning

Paper • 2603.12698 • Published 29 days ago • 1

Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation

Paper • 2603.19220 • Published 23 days ago • 66

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Paper • 2603.20278 • Published 25 days ago • 94

upvoted a paper 18 days ago

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Paper • 2603.20278 • Published 25 days ago • 94

New activity in nvidia/Nemotron-Cascade-2-30B-A3B 19 days ago

Add documentation on how to use with vLLM to README.md

#7 opened 20 days ago by

liked a model 22 days ago

nvidia/Nemotron-Cascade-2-30B-A3B

Text Generation • 32B • Updated 1 day ago • 256k • 469

upvoted a paper 22 days ago

Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation

Paper • 2603.19220 • Published 23 days ago • 66

upvoted a paper 25 days ago

Attention Residuals

Paper • 2603.15031 • Published 26 days ago • 178

liked a dataset 28 days ago

stepfun-ai/Step-3.5-Flash-SFT

Viewer • Updated 28 days ago • 1.62M • 60.7k • 313

liked a model about 1 month ago

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-BF16

Text Generation • 124B • Updated about 16 hours ago • 435k • 324

upvoted a paper about 1 month ago

VisPhyWorld: Probing Physical Reasoning via Code-Driven Video Reconstruction

Paper • 2602.13294 • Published Feb 9 • 13

liked 2 models about 2 months ago

Qwen/Qwen3.5-397B-A17B

Image-Text-to-Text • 403B • Updated 27 days ago • 815k • • 1.43k

Qwen/Qwen3.5-35B-A3B

Image-Text-to-Text • 36B • Updated Feb 27 • 3.53M • • 1.36k

liked a dataset about 2 months ago

OpenResearcher/OpenResearcher-Dataset

Viewer • Updated 17 days ago • 97.6k • 5.96k • 119

liked 2 models 2 months ago

moonshotai/Kimi-K2.5

Image-Text-to-Text • 1.1T • Updated Feb 27 • 5.98M • • 2.45k

stepfun-ai/Step-3.5-Flash

Text Generation • 199B • Updated 25 days ago • 126k • • 771

updated a model 2 months ago

DongfuJiang/nano_v3_search_incorrect_only_347_steps

32B • Updated Jan 28