본문 바로가기

분류 전체보기103

[네트워크] 1.4 패킷 교환 네트워크에서의 지연, 손실, 처리율 1.4.1 패킷 교환 네트워크에서의 지연 개요 패킷은 경로를 따라 한 노드(호스트, 라우터)에서 다음 노드(호스트, 라우터)로 전달되므로, 그 패킷은 경로 상의 각 노드에서 다양한 지연을 겪게 된다. 출발지와 목적지 사이 종단 간 경로의 일부로서, 한 패킷이 업스트림 노드 --> 라우터 A --> 라우터 B로 보내진다. 라우터 A는 라우터 B에 이르는 하나의 출력(outgoing) 링크를 갖는데, 이 링크 앞에 큐(queue, 버퍼(buffer))가 있다. 패킷이 업스트림 노드로부터 라우터 A에 도착하면, 라우터 A는 그 패킷에 대한 적당한 출력 링크를 결정하기 위해 패킷 헤더를 조사하고, 선택된 링크로 그 패킷을 보낸다. 패킷은 링크에 현재 전송되는 다른 패킷이 없고, 큐에 자신보다 앞선 패킷들이 없으.. 2023. 9. 10.
[네트워크] 1.3 네트워크 코어 1.3.1 패킷 교환(packet switching) 출발지 종단 시스템에서 목적지 종단 시스템으로 메시지를 보내기 위해, 송신 시스템은 긴 메시지를 패킷(packet)이라고 하는 작은 덩어리로 분할한다. 송신 측과 수신 측 사이에서 각 패킷은 통신 링크, 패킷 스위치(packet switch)를 거치게 된다. 패킷 스위치(packet switch): 라우터(router), 링크 계층 스위치(link-layer switch) 패킷의 전송 속도 = 링크의 최대 전송률 속도 --> 출발지의 종단 시스템/패킷 스위치가 R비트/sec의 속도로 링크에서 L비트의 패킷을 송신한다면, 그 패킷을 전송하는 데 걸리는 시간 = L/R초 저장-후-전달 전송(store-and-forward transmission) 패킷 스.. 2023. 9. 9.
[네트워크] 1.2 네트워크의 가장자리 ▶ 종단 시스템 : 인터넷에 연결되는 컴퓨터와 그 밖의 장치 데스크톱 컴퓨터, 서버, 이동 컴퓨터 등 종단 시스템 = 호스트(host) - 클라이언트(client) - 서버(server) 1.2.1 접속 네트워크(access network) : 종단 시스템을 그 종단 시스템으로부터 먼 거리에 있는 다른 종단 시스템까지의 경로상에 있는 첫 번째 라우터(가장자리 라우터; edge router)에 연결하는 네트워크 가정 접속: DSL, 케이블, FTTH, 5G 고정 무선 ▶ DSL(digital subscriber line) 가장 널리 보급된 광대역 가정 접속 유형 일반적으로 가정은 유선 로컬 전화 서비스를 제공하는 같은 지역 전화 회사(telco)로부터 DSL 인터넷 접속 서비스를 받는다. 따라서 DSL을 .. 2023. 9. 5.
[네트워크] 1.1 인터넷이란 무엇인가? 1.1.1 구성요소로 본 인터넷 ▶ 종단 시스템 종단 시스템은 통신 링크(communication link), 패킷 스위치(packet switch)의 네트워크로 연결된다. 통신 링크(communication link)는 다양한 물리 매체(physical media)로 구성된다: 동축케이블, 구리선, 광케이블, 라디오 스펙트럼 등 각각의 링크들은 다양한 전송률(transmission rate, 링크 대역폭)을 이용하여 데이터를 전송한다. --> 전송률: bps(bit per second) 한 종단 시스템이 다른 종단 시스템으로 보낼 데이터를 갖고 있을 때, 송신 종단 시스템은 그 데이터를 세그먼트(segment)로 나누고, 각 세그먼트에 헤더(header)를 붙인다: 패킷(packet) --> 패킷은 목.. 2023. 9. 5.
GPU를 위한 프로파일링 기반 페이스 예측 및 적응형 워프 스케줄러 AbstractTo improve the GPGPU performance, many researchers proposed warp scheduling policies. Problem: However, various warp scheduling policies show differenct performance on differenct kernels, since each kernels shows differenct characteristics. Solution: To address this problem, this paper proposes adaptive warp scheduling policy based on profiling information. 1. 서론GPGPU 워크로드의 성능을 향상시키기 위하여.. 2023. 9. 3.
워프 스케쥴링 기법에 따른 GPU 성능 분석 요약GPU에서 실제 연산을 담당하는 세이더코어는 다수의 워프를 동시에 할당받아 수행함으로써, 연산자원 활용률을 극대화한다. 세이더코어가 할당받은 다수의 워프들 중에서 어떠한 워프를 선택하여 수행하는지에 따라 GPU의 성능은 달라질 것으로 예상된다. 효과적인 워프 스케줄링 기법을 개발하기 위해서는 워프 스케줄링 기법의 특성 분석이 선행되어야 한다. 본 논문에서는 워프 스케줄링 기법에 따른 GPU의 성는을 분석하고자 한다. 무작위 스케쥴링, 라운드로빈 스케쥴링, 그리고 선입선처리 스케쥴링 기법을 분석 대상으로 사용한다. 실험 결과에 따르면, 분기 명령어를 포함하지 않는 응용프로그램을 수행하는 경우에는 스케쥴링 기법에 따른 성능 차이가 거의 없는 반면에, 분기 명령어를 다수 포함하는 응용프로그램을 수행하는 경.. 2023. 9. 3.
효율적인 GPU 메모리 컨트롤러 설계를 위한 GPU 메모리 성능 분석 연구 요약CPU와 GPU의 동작 특성이 다르기 때문에 각각이 메모리 컨트롤러에 요구하는 특성은 다르다. CPU는 메모리의 latency가 중요하고, GPU는 대역폭이 중요하다. 따라서 이 논문에서는 GPU 메모리 컨트롤러의 효율적인 설계 방향을 제시하기 위해 CPU와 GPU 메모리의 동작 특성을 비교 분석하였다. 실험 결과 latency는 Row Buffer Locality(RBL)에 의존하고, 대역폭은 Bank Level Parallelism(BLP)에 의존함을 밝혔다. 따라서 대역폭이 중요한 GPU 메모리는 높은 Bank Level Parallelism(BLP)가 의미하는 뱅크간 높은 병렬성을 갖도록 하는 설계가 필요하다. 1. 서론GPU의 수행능력을 요구하는 응용 프로그램은 CPU와는 다르다.CPU: 적.. 2023. 8. 31.
2차원 구조 대비 3차원 구조 GPU의 메모리 접근 효율성 분석 요약최근 반도체 공정 기술이 발달함에 따라 단일 프로세서에 적재되는 코어의 수가 크게 증가하였고, 이는 프로세서의 성능을 급격하게 향상시키는 계기가 되고 있다. 특히, 많은 수의 코어들로 구성된 GPU(Graphics Processing Unit)는 대규모 병렬성을 활용하여 연산처리 성능을 크게 향상시키고 있다. Problem: 하지만 주 메모리 접근 지연시간이 GPU의 성능 향상을 제약하는 심각한 요인 중 하나로 제기되는 상황이다. Solution: 본 논문에서는 3차원 구조를 통한 GPU의 메모리 접근 효율성 향상에 대한 정량적 분석과, 3차원 구조 적용 시 발생 가능한 문제점에 대해 살펴보고자 한다.일반적으로 메모리 명령어 비율은 평균적으로 전체 명령어의 30%를 차지하고, 메모리 명령어 중에서 주.. 2023. 8. 31.
GPU 공유 메모리 크기에 따른 최적화 기법 요약GPU는 코어 수를 비약적으로 증가시키고, 병렬 처리를 강화하는 등 발전하였다.Problem: 하지만 GPU를 효율적으로 활용하는 것에 대해서는 단순히 쓰레드 개수만 증가시킬 뿐, GPU에 관한 연구는 진행이 더딘 편이다.Solution: GPU의 장점인 공유 메모리 크기에 따른 분석과 실험 결과를 통해 본 논문에서 제시하는 방법이 효율적임을 확인한다. 1. 서론그래픽 카드의 성능 중에서 병렬 처리를 하는데 필요한 공유 메모리 크기에 따른 최적화 기법을 연구하고, 향후 효율적인 GPU 활용에 대한 기준점을 제시한다. 2. 관련 연구2.1 CPU와 GPU CPU와 GPU는 트랜지스터를 집적시켜 연산을 처리하는 반도체라는 점에서 유사하지만, 근본적으로 하는 일이 다르다.CPU: 순차 코드의 성능을 최적화.. 2023. 8. 31.