Особый интерес в настоящее время вызывает вопрос о том, обладают ли большие языковые модели понятиями (концепциями). Эти чрезвычайно впечатляющие системы, такие как GPT-4, Claude, Gemini и Deepseek, выдают, казалось бы, осмысленные и релевантные ответы на обычные запросы в диалоговом режиме. Например, если спросить ChatGPT о посадке лаванды, получится следующее:
Посадка лаванды у входной двери может быть отличной идеей — в зависимости от ваших целей и условий. Вот несколько моментов, которые следует учесть…
Затем следует полезный список плюсов и минусов, а также предложение порекомендовать конкретные сорта или растения-компаньоны.
В свете таких результатов часто трудно избежать характеристики LLM как понимающих значение таких слов, как «лаванда»; как знающих и рассуждающих о таких вещах, как лаванда, и так далее. Но являются ли такие характеристики буквальными утверждениями или просто расплывчатыми или образными рассуждениями? Ответ, безусловно, будет зависеть от базовых возможностей системы, то есть от того, какие представления она обрабатывает и как. Тем не менее, внутренняя работа LLM пока остаётся «чёрным ящиком», непрозрачным даже для тех, кто их разрабатывает.
Одна из причин полагать, что модели LLM не обладают концепциями, заключается в отсутствии у них какого-либо сенсомоторного аппарата; они, например, не могут видеть, чувствовать запах или собирать лаванду. Это означает, что они не могут имитировать эти действия.
Также у моделей LLM, по-видимому, отсутствует что-либо, эквивалентное долговременной памяти для хранения знаний о лаванде.
Веские аргументы.
Скорее всего, они реагируют на каждый новый запрос, заново генерируя вероятное продолжение лингвистических токенов (это продолжение является сложной функцией статистических свойств токенов, извлеченных из обширных корпусов текста в период обучения моделей). Таким образом, модели LLM, похоже, не вспоминают факты, выраженные в их результатах, а выдают последовательности, которые просто случайно выражают такие факты (предположительно, из-за того, как человеческие знания и опыт отражаются в наших речевых паттернах).
Нет ну как таковые понятия заложены она же явно отличает цветок как растение в таком запросе . а так она не обдала понятиями или ее аналогами могла рассказать про туалетную воду с запохом лаванды которая классно бы пахла около входной двери. И перечислилабы плюсы или минусы. Или рассказала бы про лавандовый цвет краски у входной двери ну вы поняли о чем я.
Модели LLM остаются репрезентативно обедненными (по крайней мере, пока). Им не хватает эмпирических систем, с которыми, по сути, взаимодействуют человеческие концепции, они обрабатывают только лингвистическую форму, а не наше богатое множество типов информации. Таким образом, они не проходят тест на «подключение и использование» для подтверждения подлинного владения концептами.
Концептуальное мышление — это двигатель уникального человеческого познания. Таковы люди.)
Таким образом, остается открытым вопрос, следует ли рассматривать их как новый тип универсальных систем рассуждения или скорее как специализированные системы, которые дополнительно поддерживают наше собственное мышление.
В конце концов, у нас есть некоторое представление о том, что не может происходить внутри «чёрного ящика». ))
И все-таки, думаю, можно предположить, что LLM, по крайней мере, разделяют нашу способность к абстрактному рассуждению.