Julian Schulz's picture

2

Julian Schulz

wuschelschulz

·

wuschel_1

AI & ML interests

None yet

Organizations

None yet

models 33

wuschelschulz/gemma_12b_reasoning_reward_hacking_SFT

Updated Dec 16, 2025

wuschelschulz/gemma_1_reasoning_reward_hacking_SFT_debug

Updated Dec 16, 2025

wuschelschulz/gemma-3-12b-reasoning

Updated Dec 15, 2025

wuschelschulz/debug_gemma-3-12b-reasoning

Updated Dec 15, 2025

wuschelschulz/gemma_1_reasoning_reward_hacking_SFT

Updated Dec 11, 2025

wuschelschulz/gemma_1_reasoning_model_only

Updated Dec 11, 2025

wuschelschulz/debug_gemma_1_reasoning_reward_hacking_SFT

Updated Dec 10, 2025

wuschelschulz/gemma-3-1b-persona-ab-grpo

Text Generation • Updated Dec 4, 2025

wuschelschulz/gemma-3-1b-persona-ab-sft

Text Generation • Updated Dec 4, 2025

wuschelschulz/SFT_reasoning_Gemma_3_1B_unsloth_reward_hacking_SFT

Updated Nov 26, 2025

datasets 3

wuschelschulz/mbpp_reward_hacking_and_normal_completions

Viewer • Updated Dec 16, 2025 • 492 • 25

wuschelschulz/mbpp_paired_reward_hacky_normal_cots

Viewer • Updated Dec 11, 2025 • 487 • 8

wuschelschulz/debug_mbpp_paired_reward_hacky_normal_cots

Viewer • Updated Dec 11, 2025 • 5 • 9