
Исследователи из Института Стивенса по технологиям (Stevens Institute of Technology) обнаружили, что большие языковые модели (LLM) используют лишь небольшую часть своих параметров для выполнения задач, связанных с социальным мышлением — так называемой теорией разума (Theory of Mind, ToM). Иными словами, когда модель пытается понять, что другой человек «знает» или «думает», она не задействует весь свой вычислительный потенциал, а опирается на
Свежие комментарии