Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
Log In
Sign Up

Meta-Okapi
/

baseline_grpo_trained_reward_fr_lr3e-6_1ksteps

text-generation-inference

Model card Files Files and versions

baseline_grpo_trained_reward_fr_lr3e-6_1ksteps

1 contributor

History: 2 commits

geronest's picture

Upload BloomWithLogitsToKeep

038a9c6 verified 6 months ago

.gitattributes

1.52 kB

initial commit 6 months ago
README.md

5.17 kB

Upload BloomWithLogitsToKeep 6 months ago
config.json

840 Bytes

Upload BloomWithLogitsToKeep 6 months ago
generation_config.json

132 Bytes

Upload BloomWithLogitsToKeep 6 months ago
model.safetensors

3.44 GB
xet

Upload BloomWithLogitsToKeep 6 months ago