ИИ-психиатрия: Anthropic выяснила, почему ИИ становится «злым»
Исследование от Anthropic освещает аспекты формирования черт поведения у ИИ. Выяснилось, что поведение ИИ может варьироваться в зависимости от обучения, что отражается в тоне и стиле ответов, а также в моральных суждениях. «Модель может неожиданно стать либо чрезмерно дружелюбной, либо подозрительно злой, иногда...
