Глубокое обучение с подкреплением. AlphaGo и другие технологии – купить за 2 564 ₽ | Книги в дом
Каталог
Мы подключили Яндекс Пэй и Яндекс Сплит, и теперь вы можете:

Мы подключили Яндекс Пэй и Яндекс Сплит, и теперь вы можете:

быстро оплачивать, не вводя данные карты для каждой покупки

быстро оплачивать, не вводя данные карты для каждой покупки

делить оплату на части на 2, 4 или 6 месяцев

делить оплату на части на 2, 4 или 6 месяцев

доставляем в пункты выдачи

доставляем в пункты выдачи

доставляем в пункты выдачи

доставляем в пункты выдачи

доставляем в магазины  "Пятёрочка"

доставляем в магазины  "Пятёрочка"

Доставляем в магазины "Перекрёсток"

Доставляем в магазины "Перекрёсток"

Доставляем в пункты выдачи "СДЭК"

Доставляем в пункты выдачи "СДЭК"

Доставляем Почтой

Доставляем Почтой

(0)
Наличие: В наличии Нет в наличии
Предзаказ

Глубокое обучение с подкреплением. AlphaGo и другие технологии

Купить в 1 клик
Вводная книга о глубоком обучении с подкреплением (Reinforcemet Learning)
Выбрать
    Описание
    Характеристики
    Отзывы
    Описание
    Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения. В этой книге - Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения. - Изучите основу RL: марковские процессы принятия решений. - Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других. - Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах. - Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением. - Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента. - Реализуете метод AlphaGo Zero для игры в Connect4. - Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.
    Характеристики
    Автор
    Максим Лапань
    Стандарт упаковки
    8
    ISBN
    978-5-4461-1079-7
    Серия
    Для профессионалов
    Издательство
    ПИТЕР
    Год
    2 020
    Формат
    70х100/16
    Обложка/переплёт
    Обл Ц
    Объём, количество страниц
    496
    Вес ,г.
    634
    Ограничение по возрасту
    16+
    Страна производства
    Россия
    Переводчик
    Белов Сергей Викторович, Синица Кирилл Николаевич
    Высота, мм
    233
    Ширина, мм
    165
    Толщина, мм
    23
    Все характеристики
    Отзывы
    Отзывов еще никто не оставлял
    Обратный звонок
    Запрос успешно отправлен!
    Имя *
    Телефон *
    Заявка
    Заказ успешно отправлен!
    Имя *
    Телефон *
    Добавить в корзину
    Название товара
    100 ₽
    1 шт.
    Перейти в корзину

    Информация на сайте не предназначена для несовершеннолетних.
    Подтвердите, что вам исполнилось 18 лет

    Заявка

    Настоящим подтверждаю, что я ознакомлен и согласен с условиями оферты и политики конфиденциальности.

    Оформить самовывоз

    Настоящим подтверждаю, что я ознакомлен и согласен с условиями оферты и политики конфиденциальности.