Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

2,106

Base only

Active filters: deep-rl-course

mttpv/LunarLander-v2-ppo

Reinforcement Learning • Updated Mar 2

vinh406/ppo-LunarLander-v2-self-implemented

Reinforcement Learning • Updated Mar 4

nebhailema/Unit8-PI-LunarLander-v2

Reinforcement Learning • Updated Mar 9

Kostyade/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 27 • 18

qb1t/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 17 • 9

Tass-k/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 25 • 3

Shabbarzz/LunarLander-V2-Unit8-Part1

Reinforcement Learning • Updated Mar 17

qb1t/ppo-CartPole-v1

Reinforcement Learning • Updated Mar 17

qb1t/lander-vnew

Reinforcement Learning • Updated Mar 18

rohit23/reinforce-Pixelcopter-PLE-v0-version001

Reinforcement Learning • Updated Mar 26

andyv237/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 3 • 3

rohit23/ppo-scratch-lunarlander-version001

Reinforcement Learning • Updated Mar 26

rohit23/reinforce-Pixelcopter-PLE-v0-version003

Reinforcement Learning • Updated Mar 27

rohit23/reinforce-Pixelcopter-PLE-v0-version002

Reinforcement Learning • Updated Mar 27

rohit23/reinforce-Pixelcopter-PLE-v0-version004

Reinforcement Learning • Updated Mar 27

rohit23/reinforce-Pixelcopter-PLE-v0-version005

Reinforcement Learning • Updated Mar 28

rohit23/reinforce-Pixelcopter-PLE-v0-version006

Reinforcement Learning • Updated Mar 29

Rebixa/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 31

oguzkaganbilici/q-taxi-v3

Reinforcement Learning • Updated Apr 3

andyv237/ppo-CartPole-v1

Reinforcement Learning • Updated Apr 3

Woako/ppo-LunarLander-v2-cleanrl

Reinforcement Learning • Updated Apr 6

DoctorPingu/ppo-LunarLander-v2-cleanrl

Reinforcement Learning • Updated Apr 7

PhoenixA/ppo-LunarLander-v2-v2

Reinforcement Learning • Updated Apr 8

OlejnikM/LunarLander-v1

Reinforcement Learning • Updated Apr 10

Dash10107/LunarLander-v2

Reinforcement Learning • Updated Apr 12 • 3

J-76gbjhdfs/ppo-LunarLander-v3-custom

Reinforcement Learning • Updated Apr 13

alexillovsky/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated Apr 15

gusainanurag58/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 20

Kaushik23/LunarLander-v2

Reinforcement Learning • Updated Apr 20

HamzaChera/ppo-CartPole-v1

Reinforcement Learning • Updated Apr 24