Дообучение нейросетей и настройка ИИ под ваши задачи - урок №8

Как проходить урок?

Время выполнения Д/З 
1 день

Время урока 
10 минут

В этом уроке мы разберём, как обучить нейросеть для постоянного выполнения задач для вашей жизни/работы.

3. После выполнения ДЗ - переходите к следующему уроку

2. Внизу будет домашнее задание для выполнения (займет от 10 до 20 минут)

1. Читайте текст урока

В прошлых уроках мы разобрали основы промптинга и научились давать нейросети команды, чтобы получать нужный результат.
Но на практике этого часто недостаточно. Если вы хотите, чтобы ИИ регулярно помогал вам в работе или обучении, его нужно правильно настроить под ваши задачи.
Здесь важно понимать одну вещь:
большинство пользователей не обучают нейросети с нуля.

Они настраивают её поведение с помощью контекста, инструкций и примеров.
Это и называют дообучением в повседневной работе с ИИ.

В чём разница между обучением и файнтюнингом

Представьте: вы берёте на работу нового сотрудника. И есть два варианта.

Вариант 1: обучение с нуля.
Сотрудник умный, но пока не знает ничего: ни вашей сферы, ни терминов, ни как вы работаете. Вам придётся обучить его с азов. В мире ИИ это называется обучение с нуля — модель получают «чистой» и загружают в неё огромные массивы данных. Это долго, дорого и требует мощной инфраструктуры.

Вариант 2: файнтюнинг.
А теперь представьте, что вы взяли опытного специалиста, который уже знает профессию. Вам остаётся только рассказать, как всё делается у вас: какие стандарты, стиль общения с клиентами, особенности ваших продуктов. Это и есть файнтюнинг или дообучение уже готовой модели под ваши конкретные задачи.

Зачем «учить» ИИ, если он и так «всё знает»

Даже самые мощные нейросети не знают ваш контекст.
Они не знают:

чем ваши продукты отличаются от конкурентов
как вы общаетесь с клиентами
какие стандарты приняты в вашей компании
какие документы вы используете.

Поэтому чем больше контекста вы даёте модели - тем точнее будут ответы.

Есть важное уточнение.
Когда вы загружаете документы в ChatGPT или пишете инструкции для проекта - это не настоящее обучение модели.
На самом деле вы просто даёте нейросети дополнительный контекст, на основе которого она формирует ответы.
Но на практике такой подход работает почти так же эффективно, как дообучение.

Принцип №1 - один чат - одна задача

Итак, самый базовый принцип - какой бы вы нейросетью вы не пользовались - один чат - одна задача.
Для каждой задачи мы создаем свой чат и не смешивает чаты друг с другом.

В идеале, если у вас платная подписка на ChatGPT, создавай отдельные проекты под каждое направление своей жизни и работы.

Вот личный пример:

Один проект у меня посвящён обучению психологии. Здесь нейросеть помогает мне изучать психологию, обрабатывать литературу и формировать выводы.
Другой проект полностью заточен под написание email-рассылок и сообщений для моей основной работы (это экспертный центр по промышленной безопасности).
Третий проект помогает мне с вопросами фитнеса, питания и общего здоровья.

Такой подход позволит нейросети максимально чётко понимать контекст и давать максимально релевантные ответы.

пример моего чата

Создавая проект под конкретную задачу, обязательно загрузите в него файлы и материалы, которые помогут нейросети разобраться в теме.

Это могут быть PDF-документы, книги, методички, учебные программы или любые другие релевантные материалы.

Например, если вы создаёте проект для изучения психологии, вы можете загрузить туда купленную литературу, рефераты или программу твоего учебного курса. Так нейросеть будет иметь перед глазами все необходимые детали и сможет опираться на них в своих ответах.

Следующий важный шаг - создание подробного промпта-инструкции. В прошлом уроке мы подробно разбирали, как это делать, поэтому здесь кратко напомню главное:

Промпт - это это подробная инструкция для нейросети. Например:
«Ты мой личный помощник в изучении психологии. Помогай мне разбираться в теоретических концепциях, делай короткие и понятные конспекты, отвечай доступно и профессионально, избегая излишней научности. Всегда подкрепляй свои ответы примерами из реальной жизни и давай мне небольшие задания для закрепления темы».

Такой промпт поможет нейросети чётко понять, что именно от неё требуется.

Важно: все данные, которые вы "заливайте в нейросеть" должны быть очищены. В них не должно быть лишней информации. Только то - что относится к работе.

Принцип №2 - общаемся с моделью

Теперь переходим к практике. Создаём новый чат в нашем проекте и вводим первый, основной промпт. После этого обязательно даём нейросети примеры того, как именно вы хотите видеть ответы.

Ниже пример.

После первого полученного ответа - сразу же пишете свой отзыв.

Допустим, нейросеть ответила сухо и академично, а вы хотите более живой стиль. Тогда пишете:
«Это слишком сухо. Сделайте ответ живее, добавь примеры из жизни и объясни, как это применить на практике».
Нейросеть быстро адаптируется и начнёт выдавать ответы в нужном стиле.

Каждый раз давая такую обратную связь, вы будете буквально воспитывать нейросеть под свои задачи и потребности.

Дообучение нейросети это постоянная работа.

Чем чаще и регулярнее вы взаимодействуете с ИИ, корректируете его и задаёте правильные ориентиры, тем лучше и точнее он будет работать именно под ваши задачи.
Приведу ещё одну бытовую аналогию. Представьте, что вы учите готовить нового повара.

Если раз в месяц объяснять ему по-быстрому рецепт, вряд ли он когда-нибудь станет мастером. Но если регулярно объяснять детали, поправлять ошибки и показывать, как правильно, то он очень скоро станет незаменимым помощником на кухне.

Важно!
После каждого ответа нейросети - корректируем.
Пишем ей, что исправить.

В идеале используем Chain-of-Thought.
По примеру: вот что получилось - вот как нужно. Исправь вот это_____

Немного о технологии RAG

Есть ещё один важный подход, который широко используется в современных AI-системах.
Он называется RAG (Retrieval Augmented Generation).

Суть технологии проста:
1) нейросеть ищет нужную информацию в базе документов
2) извлекает релевантные данные
3) использует их при генерации ответа.

Таким образом модель не просто генерирует текст, а опирается на реальные данные. И дообучение становится минимальным.
RAG широко применяется:

в корпоративных чат-ботах
в системах поддержки клиентов
в аналитических инструментах
в AI-агентах.

Мы подробно разберём эту технологию в отдельном уроке про ИИ-агентов.
Заливая документы в Chatgtp -

Запишите первый запрос в ИИ и начните дообучение, чтобы улучшить качество выдаваемых ответов.

Домашнее задание

Перейти к следующему уроку

Нажмите на кнопку, чтобы перейти к следующему занятию нашего курса

ПРОДОЛЖИТЬ ОБУЧЕНИЕ