Как работает ИИ (нейросети) - Урок №4

Как проходить урок?

Время выполнения Д/З 
1 день

Время урока 
15 минут

В этом уроке мы разберём, как работает искусственный интеллект и узнаем как эту логику работы использовать.

3. После выполнения ДЗ - переходите к следующему уроку

2. Внизу будет домашнее задание для выполнения (займет от 10 до 20 минут)

1. Читайте текст урока

В прошлом уроке мы говорили о разных видах искусственного интеллекта. Многие из них могут выступать как универсальные помощники - например ChatGPT. Но мы пока не обсудили, как же ИИ вообще работает. А это очень важно.

Многие представляют искусственный интеллект как нечто вроде человеческого мозга, как будто это живой компьютер, который думает, чувствует и выдаёт «своё мнение». На самом деле это не так. Текущие технологии ещё далеки от настоящего сверхинтеллекта. То, что мы называем искусственным интеллектом сегодня, устроено совсем иначе.

А как работают ИИ?

Чтобы объяснить принцип работы ИИ, давайте возьмём простую и близкую многим метафору — кухню. Представьте, что у вас есть ресторан, и вы наняли туда робота-повара. Вы хотите, чтобы он умел готовить вкусный борщ без вашего постоянного контроля.

Что нужно сделать?
Сначала вы даёте ему очень много примеров: рецепты, фото готовых блюд, видео приготовления, последовательность шагов. Робот наблюдает, замечает закономерности: что и когда нарезать, сколько варить, в какой момент солить. После этого он уже может приготовить борщ сам, опираясь на выявленные шаблоны.

С ИИ всё примерно так же. Правильно говорить, что искусственный интеллект это общее понятие, под которым часто подразумевают нейросети. Эти модели обучаются на огромных массивах данных — текстах, изображениях, аудио. Они не хранят готовые ответы и не «вспоминают» информацию, как человек. Вместо этого они выявляют закономерности в обучающих данных, а затем синтезируют новый ответ, который с наибольшей вероятностью соответствует вашему запросу.

И тут важный момент: если «робота-повара» обучали только на вегетарианских рецептах, он просто не будет знать, что такое мясо, и всегда предложит вегетарианский борщ. Точно так же и ИИ: если в обучающем наборе нет определённых фактов или примеров, модель их не выдумает «из памяти» - она построит ответ только из того, что встречала в данных, и того, как вы сформулировали запрос.

Однако (важное примечание): если в обучающих данных нет точной информации, модель может построить правдоподобный, но неточный ответ. Такое явление называют галлюцинацией и мы в будущем разберем как с ней работать.

Пример из жизни.

На вопрос «почему небо синее?» хорошо обученная модель выдаст объяснение про рассеяние света в атмосфере. Не потому что «вспомнила статью», а потому что в обучении такие объяснения встречались и они высоковероятны для такого запроса.

Таким образом, нейросеть, увы, не волшебство. А система шаблонов и закономерностей, и работает она на четырех основных принципах:

1) Данные
Представьте кухню. Данные же это ваши ингредиенты. Чем они качественнее и разнообразнее, тем вкуснее и точнее получится «блюдо» (ответ ИИ). Если продукты однотипные, модель будет «готовить» одно и то же, без креатива. Если в данных есть перекос , то ИИ будет выдавать предвзятую картину.
Пример: если модель видела больше англоязычных текстов, чем русскоязычных, она будет увереннее и богаче отвечать на английском.

2) Модель (архитектура) и алгоритм обучения
Модель это то, как данные обрабатываются: что с чем смешать, что выкинуть, а что оставить. Алгоритм обучения - это набор правил, по которым модель учится находить закономерности. У разных архитектур разные сильные стороны: одни лучше работают с текстами (например, трансформеры), другие — с изображениями (например, диффузионные сети).

3) Обучение, а именно многократные прогоны данных через модель
Тут всё как у повара: чем больше он готовит одно и то же блюдо, тем лучше оно получается. Модель тоже «набивает руку», подбирая оптимальные параметры, чтобы выдавать более точные ответы. Но это процесс ресурсоёмкий: нужны мощные серверы и недели, а то и месяцы работы.

4) Файнтюнинг (дообучение модели)
Обучение с нуля - это создание модели «с чистого листа» на гигантских массивах данных. Этим занимаются компании вроде OpenAI, Google или Яндекса - а это годы работы, команды специалистов, десятки миллионов долларов.
Файнтюнинг - это когда уже готовую модель «дотренировывают» под конкретную задачу, стиль или тематику.

Важное примечание.

В работе вы будете использовать уже готовые модели (LLM), а при необходимости — дообученные под ваши внутренние задачи, чтобы они говорили на вашем «корпоративном языке» и учитывали нюансы вашей работы. Такое дообучение - называется файнтюнингом.

Представьте, что вы хотите, чтобы ИИ умел варить отличный кофе.
Вы «кормите» его миллионами рецептов, отзывов и описаний про кофе. Модель начинает искать закономерности и замечает, что слово «кофе» очень часто идёт рядом со словом «молоко».
И вот вы спрашиваете: «Какой кофе самый вкусный?»
ИИ почти всегда отвечает: «Кофе с молоком». Не потому, что это абсолютная истина, а потому, что в обучающих данных таких примеров было больше всего.

Это и есть баяс (или bias по английски), а по-русски предвзятость модели. Если в её «прошлом опыте» один вариант встречался чаще, она будет склонна считать его «нормой» и предлагать именно его.
Тот же принцип работает и в других темах. Задайте вопрос: «Что лучше - Android или iPhone?», и ответ будет зависеть от того, каких отзывов и статей в обучающих данных было больше.

Теперь представьте, что вы берёте такую «кофейную» модель и проводите файнтюнинг - дообучаете её под свои приоритеты. Например, добавляете много рецептов чёрного кофе без молока, с упором на его вкус и пользу. После такого дообучения модель начнёт чаще предлагать именно этот вариант, а не потому, что «разлюбила» молоко, а потому что в её новых данных приоритеты изменились.

И немного продвинутого объяснения

Если хотите чуть глубже понять, что происходит «под капотом» у ИИ - давайте разберёмся без сложной математики, но уже ближе к языку специалистов.

Большинство современных моделей, включая ChatGPT, относятся к типу LLM - Large Language Model («большая языковая модель»). Их главный принцип работы - предсказание следующего токена.
Токен - это кусочек информации. Для текстов это могут быть слова или части слова, для картинок - пиксели или группы пикселей, для музыки — ноты или фрагменты звука.

Как это работает на словах: модель смотрит на цепочку слов, которую вы ей дали, и на каждом шаге вычисляет, какое слово с наибольшей вероятностью должно быть следующим.
Чтобы при этом понимать смысл и не выдавать «кашу из слов», модель использует механизм attention («внимание»).

Это значит, что она «взвешивает», какие слова или фразы в вашем запросе важнее, и строит ответ с опорой именно на них, а не просто идёт слева направо.

Пример.
Вы пишете: «Замени в письме слово интересно на синонимы».
Модель просчитывает варианты и выдаёт, например: познавательно, увлекательно, занимательно. Почему именно так? Потому что эти слова в похожих контекстах встречались чаще и имели высокую вероятность в её «опыте».

LLM предсказательная модель

В работе с LLM можно управлять так называемыми настройками генерации — temperature, top-p (nucleus sampling), frequency и presence penalties.
- Temperature регулирует креативность: чем выше, тем более неожиданные и «смелые» ответы.
- Top-p сужает круг возможных вариантов, чтобы убрать «шум» из ответа.
- Остальные параметры помогают избежать повторов и сделать текст более разнообразным.
Мы разберём их подробно в отдельном занятии.

Важный момент.
Нейросеть не «знает» ничего в привычном нам смысле. У неё нет энциклопедии или памяти, как у человека. Она просто была обучена на огромном массиве данных, уловила закономерности и теперь статистически «собирает» ответ, который выглядел бы логичным в данном контексте.
Если коротко: это не логика и не размышление - это генерация на основе вероятностей.

Именно поэтому так важен хороший промпт (или по-русски - команда). Чем чётче и конкретнее задача, тем меньше поле вариантов и тем ближе ответ к тому, что вам нужно.

Придумайте первый вопрос, который вы хотите задать искусственному интеллекту. Просто то, что вам реально интересно или полезно.

Запишите этот вопрос себе — на листочек, в заметки на телефоне или в компьютер.

Домашнее задание

Перейти к следующему уроку

Нажмите на кнопку, чтобы перейти к следующему занятию нашего курса

ПРОДОЛЖИТЬ ОБУЧЕНИЕ