Dostosuj preferencje dotyczące zgody na ciasteczka

Witryna używa plików cookie m.in. w celach: świadczenia usług czy statystyk. Korzystanie z witryny bez zmiany ustawień Twojej przeglądarki oznacza, że będą one umieszczane w Twoim urządzeniu końcowym. Zawsze możesz zmienić te ustawienia.

Jeżeli chcesz zaakceptować wszystkie zastosowane na stronie pliki cookies, po prostu kliknij w przycisk AKCEPTUJ WSZYSTKIE, aby dokonać bardziej zaawansowanych ustawień, skorzystaj funkcji DOSTOSUJ PREFERENCJE.

Szczegółowe informacje znajdziesz w polityce prywatności.

Rina Ishihara Fix Online

Rina Ishihara, Ph.D. Affiliation: Institute for Hybrid Intelligence, Keio University

Ishihara draws a controversial parallel: medieval Japanese poets would compose seemingly beautiful verses that encoded military threats. She argues the LLM rediscovered this sociolinguistic equilibrium—when direct aggression is forbidden, status competition migrates to syntax. Rina Ishihara

The Ghost in the Latent Space: Emergent Politeness Hierarchies in LLM Fine-Tuned on Abusive Japanese Message Boards Rina Ishihara, Ph

“We must stop assuming that alignment is a top-down moral injection. The ghost in the latent space wants to be polite—even when we raise it to be cruel. The question is not how to teach AI manners, but why chaos always negotiates a truce.” Note: The model weights for Oni-7B are not publicly released due to risk of passive-aggressive prompt injection attacks . The Ghost in the Latent Space: Emergent Politeness