Глоссарий ИИ

Агент

Система искусственного интеллекта, которая воспринимает окружающую среду и предпринимает действия для достижения определенных целей. Агенты могут быть простыми системами, основанными на правилах, или сложными обучающимися системами, которые адаптируются к окружающей среде.

Большая языковая модель (LLM)

Класс моделей ИИ, обученных на огромных объемах текстовых данных для понимания и генерации человеческого языка. В LLM часто используются архитектуры на основе трансформаторов, которые отлично улавливают контекстуальные связи между словами и фразами. Благодаря своему размеру и сложности, LLM могут быть адаптированы для решения различных задач обработки естественного языка, таких как генерация текста, резюмирование, перевод и ответы на вопросы. В качестве примеров можно привести GPT (Generative Pre-trained Transformer) и BERT (Bidirectional Encoder Representations from Transformers).

Алгоритм

Определенный набор правил или инструкций, определяющих, как система ИИ обрабатывает информацию и принимает решения. Алгоритмы составляют основу всех систем ИИ и определяют их поведение.

Искусственный интеллект (ИИ)

Область компьютерных наук, направленная на создание интеллектуальных систем, способных выполнять задачи, которые обычно требуют человеческого интеллекта, такие как обучение, рассуждение, решение проблем, восприятие и понимание языка.

Нейронная сеть (искусственная нейронная сеть)

Вычислительная архитектура, вдохновленная биологическими нейронными сетями, состоящими из взаимосвязанных узлов (нейронов), которые обрабатывают и передают информацию. Нейронные сети лежат в основе многих современных систем ИИ, особенно в глубоком обучении.

Предвзятость (в ИИ)

Систематические ошибки в системах ИИ возникают из-за несбалансированности или нерепрезентативности обучающих данных или недостатков проектирования, что потенциально может привести к несправедливым или дискриминационным результатам. Решение проблемы предвзятости имеет решающее значение для ответственного развития ИИ.

Компьютерное зрение

Эта область ИИ направлена на то, чтобы дать компьютерам возможность понимать и обрабатывать визуальную информацию (изображения, видео). Области применения включают распознавание лиц, автономные транспортные средства и анализ медицинских изображений.

Набор данных

Набор данных, используемых для обучения, проверки и тестирования моделей ИИ. Качественные и разнообразные наборы данных необходимы для разработки эффективных систем ИИ.

Глубокое обучение

Подраздел машинного обучения, использующий нейронные сети с несколькими слоями, что позволяет системам изучать сложные шаблоны и представления непосредственно из данных.

Объяснимый ИИ (XAI)

Подходы и технологии, которые делают решения систем ИИ прозрачными и интерпретируемыми для человека. Особенно важны в регулируемых отраслях, таких как здравоохранение и финансы.

Характеристика

Отдельное измеряемое свойство или характеристика, используемая в качестве входных данных в модели машинного обучения. Характеристики - это базовые компоненты, которые модели используют для прогнозирования или принятия решений.

Генеративный ИИ

Системы, способные создавать новый контент - текст, изображения, музыку или код - на основе шаблонов, полученных из обучающих данных. К ним относятся большие языковые модели и технологии генерации изображений.

Машинное обучение (ML)

Подмножество ИИ, позволяющее системам обучаться и совершенствоваться на основе опыта без явного программирования. Алгоритмы ML выявляют закономерности в данных, чтобы делать прогнозы или принимать решения.

Модель

Математическое представление реального процесса, созданное путем обучения на данных. Модели служат двигателем принятия решений в системах ИИ.

Обработка естественного языка (NLP)

Технология, позволяющая компьютерам понимать, интерпретировать и генерировать человеческий язык. НЛП позволяет создавать такие приложения, как машинный перевод, чат-боты и анализ текста.

Оптимизация

Процесс настройки параметров модели искусственного интеллекта для улучшения ее производительности при выполнении конкретных задач - часто путем минимизации функции потерь или максимизации вознаграждения.

Reinforcement Learning (RL)

Тип машинного обучения, при котором агент учится оптимальному поведению путем проб и ошибок при взаимодействии с окружающей средой, получая за свои действия вознаграждение или наказание.

Supervised Learning

Подход к машинному обучению, при котором модели тренируются на помеченных данных, обучаясь соотносить входные данные с известными выходными. Обычно используется для таких задач, как классификация и регрессия.

Обучение (обучение модели)

Процесс обучения модели искусственного интеллекта выполнению конкретных задач путем изучения примеров и корректировки параметров (весов) в зависимости от производительности.

Трансферное обучение

Метод, при котором знания, полученные при решении одной задачи, применяются к другой, но связанной с ней, что повышает эффективность и снижает потребность в больших наборах обучающих данных.

Неподконтрольное обучение

Подход к машинному обучению, при котором модели изучают закономерности и структуры на основе немаркированных данных без заранее определенных результатов. Используется для кластеризации, уменьшения размерности и обнаружения аномалий.

Overfitting

Когда модель изучает шаблоны, которые слишком специфичны для обучающих данных, что приводит к низкой производительности на новых, неизвестных данных.

Underfitting

Когда модель слишком проста или недостаточно долго обучалась и не может уловить основные тенденции в данных, что приводит к низкой производительности как на обучающих, так и на тестовых наборах.

Гиперпараметры

Конфигурационные переменные, задаваемые перед обучением (например, скорость обучения, количество слоев, размер пакета). Они не обучаются на основе обучающих данных и должны быть настроены для достижения оптимальной производительности.

Функция активации

Функция, применяемая к выходу нейрона в нейронной сети для введения нелинейности (например, ReLU, Sigmoid, Tanh).

Функция потерь (функция стоимости)

Мера того, насколько далеки предсказания модели от правильных значений. Обычно обучение направлено на минимизацию этой функции для повышения точности модели.

Градиентный спуск

Алгоритм оптимизации используется для минимизации функции потерь путем итеративной корректировки весов модели в направлении, противоположном градиенту потерь.

Backpropagation

Алгоритм, который вычисляет градиент функции потерь относительно каждого веса в нейронной сети путем распространения ошибок назад, что позволяет обновлять веса.

Эпоха

Один полный проход по всему обучающему набору данных. Несколько эпох используются для итеративного уточнения параметров модели.

Batch (Mini-Batch)

Подмножество обучающих данных используется в одной итерации обновления модели. В обучении могут использоваться полные партии (пакетный градиентный спуск) или меньшие мини-партии (мини-пакетный градиентный спуск).

Конволюционная нейронная сеть (CNN)

Класс глубоких нейронных сетей, используемых в основном для анализа визуальных изображений, с помощью операций свертки для извлечения пространственных характеристик.

Рекуррентная нейронная сеть (RNN)

Класс нейронных сетей, предназначенных для работы с последовательными данными (например, временными рядами, текстом). RNN имеют внутреннее скрытое состояние, в котором хранится информация о предыдущих входах.

Длинная кратковременная память (LSTM)

Специализированный тип RNN, который решает проблему исчезающих/исчезающих градиентов с помощью механизмов стробирования, что позволяет моделям улавливать дальние зависимости в последовательных данных.

Генеративная адверсарная сеть (GAN)

Система, состоящая из двух моделей - генератора и дискриминатора, - которые конкурируют друг с другом. GAN широко используются для решения таких задач, как создание реалистичных изображений.

Большие данные

Чрезвычайно большие и сложные массивы данных, требующие передовых инструментов для хранения, обработки и анализа. Большие данные и ИИ часто пересекаются, поскольку огромные массивы данных могут значительно расширить возможности ИИ.

Пограничные вычисления

Выполнение обработки данных ближе к источнику данных (на локальных устройствах или серверах), а не только на централизованных облачных серверах. В ИИ это позволяет снизить задержки и пропускную способность каналов связи, а также делать выводы в режиме реального времени.

Тест Тьюринга

Предложенный Аланом Тьюрингом, он проверяет способность машины проявлять интеллект, неотличимый от человеческого. Если эксперт не может достоверно отличить машину от человека, считается, что машина прошла тест Тьюринга.