Обладают ли большие языковые модели понятиями?

Особый интерес в настоящее время вызывает вопрос о том, обладают ли большие языковые модели понятиями (концепциями). Эти чрезвычайно впечатляющие системы, такие как GPT-4, Claude, Gemini и Deepseek, выдают, казалось бы, осмысленные и релевантные ответы на обычные запросы в диалоговом режиме. Например, если спросить ChatGPT о посадке лаванды, получится следующее:

Посадка лаванды у входной двери может быть отличной идеей — в зависимости от ваших целей и условий. Вот несколько моментов, которые следует учесть…

Затем следует полезный список плюсов и минусов, а также предложение порекомендовать конкретные сорта или растения-компаньоны.

В свете таких результатов часто трудно избежать характеристики LLM как понимающих значение таких слов, как «лаванда»; как знающих и рассуждающих о таких вещах, как лаванда, и так далее. Но являются ли такие характеристики буквальными утверждениями или просто расплывчатыми или образными рассуждениями? Ответ, безусловно, будет зависеть от базовых возможностей системы, то есть от того, какие представления она обрабатывает и как. Тем не менее, внутренняя работа LLM пока остаётся «чёрным ящиком», непрозрачным даже для тех, кто их разрабатывает.

30

Посмотрели: 131

Автор публикации

не в сети 2 дня

holliday

1 803

Комментарии: 99Публикации: 76Регистрация: 20-04-2021

: люди и технологии, мыслительный процесс, точка зрения

Предыдущая запись Мы связываем время не таким, какое оно есть, а таким, каким мы хотим, чтобы оно было Следующая запись Нулевые игры

Эти энергетические паттерны несовместимы

24.11.2022

Искусство в эпоху ИИ

02.08.2025

Когда мы привыкаем к чему-то, нам требуется меньше нейронов

20.07.2024

10

Отправить ответ

Войти с помощью:

Участник

Kant

Одна из причин полагать, что модели LLM не обладают концепциями, заключается в отсутствии у них какого-либо сенсомоторного аппарата; они, например, не могут видеть, чувствовать запах или собирать лаванду. Это означает, что они не могут имитировать эти действия.

0

Участник

Patron

Также у моделей LLM, по-видимому, отсутствует что-либо, эквивалентное долговременной памяти для хранения знаний о лаванде.

0

Участник

mechanic

Веские аргументы.

0

Участник

Razorblade

Скорее всего, они реагируют на каждый новый запрос, заново генерируя вероятное продолжение лингвистических токенов (это продолжение является сложной функцией статистических свойств токенов, извлеченных из обширных корпусов текста в период обучения моделей). Таким образом, модели LLM, похоже, не вспоминают факты, выраженные в их результатах, а выдают последовательности, которые просто случайно выражают такие факты (предположительно, из-за того, как человеческие знания и опыт отражаются в наших речевых паттернах).

0

Участник

Dede

Нет ну как таковые понятия заложены она же явно отличает цветок как растение в таком запросе . а так она не обдала понятиями или ее аналогами могла рассказать про туалетную воду с запохом лаванды которая классно бы пахла около входной двери. И перечислилабы плюсы или минусы. Или рассказала бы про лавандовый цвет краски у входной двери ну вы поняли о чем я.

0

Участник

Ancel

Модели LLM остаются репрезентативно обедненными (по крайней мере, пока). Им не хватает эмпирических систем, с которыми, по сути, взаимодействуют человеческие концепции, они обрабатывают только лингвистическую форму, а не наше богатое множество типов информации. Таким образом, они не проходят тест на «подключение и использование» для подтверждения подлинного владения концептами.

0

Участник

Zorro

Концептуальное мышление — это двигатель уникального человеческого познания. Таковы люди.)

0

Участник

ZagaDka

Таким образом, остается открытым вопрос, следует ли рассматривать их как новый тип универсальных систем рассуждения или скорее как специализированные системы, которые дополнительно поддерживают наше собственное мышление.

0

Участник

TeRMinaToR

В конце концов, у нас есть некоторое представление о том, что не может происходить внутри «чёрного ящика». ))

0

Участник

Волшебник В

И все-таки, думаю, можно предположить, что LLM, по крайней мере, разделяют нашу способность к абстрактному рассуждению.

0

Пн	Вт	Ср	Чт	Пт	Сб	Вс
« Июл
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Обладают ли большие языковые модели понятиями?

Автор публикации

holliday

Похожие статьи

Эти энергетические паттерны несовместимы

Искусство в эпоху ИИ

Когда мы привыкаем к чему-то, нам требуется меньше нейронов

10 Отправить ответ

10

Отправить ответ