billyenrizky
/

FS-DFM-1.3B-ESPO-mu8

Reinforcement Learning

discrete-flow-matching

web-action-planning

sequence-level-rl

Model card Files Files and versions

FS-DFM-1.3B-ESPO-mu8

15.9 MB

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

billyenrizky's picture

Update research title to: Concentrate or Collapse

28ca7c9 verified 2 months ago