도전은 계쏙1 HungryCat강화학습3 - BC + DQN 알고리즘 (with ML-Agent) 개요 이번에는 전문가가 직접 플레이한 샘플을 인공지능이 학습하도록 하는 BC 알고리즘을 사용해 보았다. 하지만 결과는 여전히 첫번째 파이프를 못넘었기 때문에 추가적으로 이 학습된 모델을 load하여 DQN 알고리즘으로 추가적으로 학습시켜 보았다. BC알고리즘 파이토치 구현 import numpy as np import random import copy import datetime import platform import torch from torch import nn import torch.nn.functional as F from torch.utils.tensorboard import SummaryWriter from collections import deque from mlagents_envs.env.. 2023. 8. 5. 이전 1 다음