University of Southern Denmark (SDU)

university

https://www.sdu.dk/en

AI & ML interests

None defined yet.

Recent Activity

filo362 submitted a paper 1 day ago

The Arbiter Agent: Continually Monitoring Multi-Agent Conversations to Detect Emergent Misalignment

giannor submitted a paper 7 days ago

PsychoSafe: Eliciting Psychologically-Informed Refusals in Large Language Models

giannor submitted a paper 7 days ago

BrainSurgery: Reproducible and Reliable Declarative Weight Manipulations for Model Editing and Upcycling

View all activity

Papers

The Arbiter Agent: Continually Monitoring Multi-Agent Conversations to Detect Emergent Misalignment

BrainSurgery: Reproducible and Reliable Declarative Weight Manipulations for Model Editing and Upcycling

View all Papers

models 0

None public yet

datasets 0

None public yet