ИИ на грани: как устранять "галлюцинации" ChatGPT

ИИ на грани: как устранять "галлюцинации" ChatGPT

Не смотря на все достижения в области искусственного интеллекта, модели, подобные ChatGPT, по-прежнему находятся в зачаточном состоянии. Основная проблема заключается в том, что при обработке данных или неправильном понимании вопроса они начинают "галлюцинировать", т.е. представлять ложную информацию вполне логически и убедительно, так что пользователи могут не заметить, что сталкиваются с выдуманными ответами. Ситуация усугубляется тем, что крупные языковые модели (Large Language Models, LLM) вроде Google Bard или ChatGPT могут даже выдумывать несуществующие факты и источники. Какие-то ошибки в их ответах кажутся объяснимыми, ведь они лишь интерпретируют статистику и данные обучения, но иногда результаты кажутся полностью высосанными из пальца. В компании Couchbase выделили три эффективные меры борьбы с галлюцинациями LLM, которые могут значительно повысить точность и надежность работы ChatGPT и ему подобных.

1. Дообучение модели

Один из наиболее очевидных подходов к решению проблемы неверной выдачи информации — дообучение модели на специфических данных, релевантных для конкретного применения LLM. Это может помочь уменьшить предвзятость, но метод требует значительных временных и финансовых вложений, и не всегда его можно реализовать. К тому же, дообучение — это процесс. Без постоянного повторения тренировочные данные могут устареть.

2. Инженерия запросов

Более прямой подход по сравнению с дообучением — оптимизация текстовых запросов, вводимых в LLM. Чем более контекстуализирован и точен вводимый запрос, тем меньше будет ошибок и недопонимания в выдаче результата. Инженерия запросов также включает в себя многоступенчатые инструкции, которые позволяют уточнять выдачу и минимизировать риск получения галлюцинаторного ответа от искусственного интеллекта.

3. Модель с обогащением информационной выдачей (Retrieval Augmented Generation, RAG)

RAG является перспективной технологией в борьбе с галлюцинациями LLM, направленной на непрерывное обеспечение моделей актуальными данными. Предприятия могут систематически обновлять свои модели домен-специфичной и контекстно релевантной информацией для точных результатов и сведения к минимуму возможных искажений.

Комментарии

Отлично! Вы успешно зарегистрировались.

Welcome back! You've successfully signed in.

You've successfully subscribed to GPTalk | AI Новости.

Проверьте свою электронную почту для личной ссылки для входа.

Ваша платежная информация была обновлена.

Ваш счет не был обновлен.