본문 바로가기

분류 전체보기140

Fundamental of Reinforcement Learning 공부 정리!!(1) 강화학습 : 에이전트(Agent)가 환경(Environment)의 현재 상태(Current State)를 인식해 취한 행동(Action)의 결과를 보상(Reward)으로 학습하는 것. 특징 1 : Trial and Error : 실행하지 않고 예측하는것이 아닌 직접 실행하며 얻는 결과로부터 학습함.특징 2 : Delayed Reward : 강화학습은 기본적으로 '시간의 순서'를 가진 문제를 해결하기 때문에 행동의 결과가 나타나기까지 시간간격이 벌어질수 있다. 이 특징은 강화학습의 중요한 문제이므로 꼭 체크해보자. 강화학습의 요소 : 에이전트(Agent), 상태(State), 행동(Action), 포상(Reward), 정책(Policy) 강화학습의 출발. Trial and ErrorOptimal contr.. 2017. 9. 25.
Load Balancing Algorithm 그림 ProGReGA ProGReGA-KH ProGReGA-KF BFBCT 2017. 6. 12.
2회차 A Scalable 구글번역 3장 우리는 NS 서버 S1, S2, ..., SNS로 구성된 다중 서버 DVE 시스템을 고려합니다. 시스템이 유지하는 VE는 공간적으로 (논리적으로) NC 직사각형 모양의 셀 C1, C2, ... 및 CNC (NS 2017. 6. 7.
1회차 : Game traffic analysis: An MMORPG Perspective 제목 : Game traffic analysis: An MMORPG Perspective게임 트래픽 분석 : MMORPG 관점에서. Abstract : 온라인 게임의 장르중에서 MMORPG는 인터넷 가상 세계에서 동시에 플레이하는 수백만의 사용자가 모인다. 선저우 온라인 이라는 MMORPG에서 1억 3천 6백만 패킷을 분석했다. 거의 최초의 MMORPG 서버 분석의 사례이다. MMORPG와 FPS는 작은 패킷을 생성하고 낮은 대역폭을 필요로 하는 공통점이 있다.MMORPG의 트래픽에서 관찰되는 특징은 강한 주기성, 시간적 지역성, 불규칙성, 자기 유사성이다. 주기성 : 게임 구현에서 일반적인 관행으로 인한 특성, 게임 상태 업데이트가 전송전에 고정 시간창에 누적되기 때문.시간적 지역성 : 게임의 성격에 .. 2017. 6. 6.