본문 바로가기

분류 전체보기103

SIMT 구조 GP-GPU의 명령어 처리 성능 향상을 위한 Dispatch Unit과 Operand Selection Unit 설계 요약본 논문은 그래픽 처리 뿐 아니라 범용 연산의 가속화를 지원하기 위한 SIMT 구조 GP-GPU의 DIspatch Unit과 Operand Selection Unit을 제안한다. Problem : Warp Schedular로부터 발행된 명령어에서 사용되는 Operand의 모든 정보를 Decoding하면 불필요한 Operand Load가 발생하여 레지스터 부하가 발생한다.Solution : 이러한 문제점을 해결하기 위해 Pre-decoding 방법을 사용하여 Operand의 정보만을 먼저 Decoding하여 Operand Load를 줄이고, 레지스터의 부하를 줄일 수 있는 방법을 제안한다.제안하는 Dispatch Unit에서 나온 Operand 정보들을 레지스터 뱅크 충돌을 방지하는 방법을 적용한 Op.. 2023. 8. 24.
GPU Register File의 Bank Conflict 분석 AbstractA modern GPU runs tens of thousands threads simultaneously to achieve high throughput and hiding latency. In order to effectively execute the threads, a large amount of a register file, typically organized into multiple banks, is essential. However, if bank conflict occurs, the register file throughput is reduced, thus its results in performance loss. In this paper, as the number of bank.. 2023. 8. 24.
GCN 아키텍쳐 상에서의 OpenCL을 이용한 GPGPU 성능향상 기법 연구 초록현재 프로그램이 운용되는 시스템은 기존의 싱글코어 및 멀티코어 환경을 넘어서 매니코어, 부가 프로세스 및 이기종 환경까지 그 영역이 확장되고 있는 중이다. 하지만 기존 연구의 경우 NVIDIA 벤더에서 나온 아키텍쳐 및 CUDA로의 병렬화가 주로 이루어졌고, AMD에서 나온 범용 GPU 아키텍쳐인 GCN 아키텍쳐에 대한 성능향상에 관한 연구는 제한적으로 이루어졌다. 이런 점을 고려해 본 논문에서는 GCN 아키텍쳐의 GPGPU 환경인 OpenCL 내에서의 성능향상 기법에 대해 연구하고, 실질적인 성능 향상을 보였다. 구체적으로, 행렬 곱셈과 컨볼루션을 적용한 GPGPU 프로그램을 본 논문에서 제시한 성능향상 기법을 통해 최대 30% 이상의 실행시간을 감소시켰으며, 커널 이용률 또한 40% 이상 높였다... 2023. 8. 22.
CASH-RF: A Compiler-Assisted Hierarchical Register File in GPUs Abstract▶ STT-MRAM(Spin-transfer torque magnetic random-access memory) : STT-MRAM is an emerging nonvolatile(비휘발성의) memory technology that has been received significant attention over SRAM. One compelling(주목할만한) use cas is to employ STT-MRAM as a graphics processing unit (GPU) register file (RF) to reduce its massive energy consumption.Problem 1) The problem of STT-MRAM : One critical challenge .. 2023. 8. 22.
GPU 컴퓨팅에서 빠른 데이터 전송을 위한 메모리 피닝 자동 관리 요약엔비디아 CUDA 프로그래밍 모델은 CPU 호스트에서 GPU에서 실행될 인풋 데이터를 만들어 GPU로 보낸다. 이 불가피한 CPU-GPU 데이터 전송에 소요되는 시간이 실제 커널이 돌아가는 시간에 비해 너무 그 비중이 크다. 이 커뮤니케이션 시간을 최소화하기 위해 pinned 메모리를 이용한 해결책이 제시되어 있지만 그 활용법은 사용자가 직접 pinned 메모리를 지정해주어야 하는 수준에 머무르고 있다. 이전 연구에서 밝혀진 어느 정도 이상의 데이터 전송일 때 메모리 pinning이 이점을 가지는지에 대한 데이터들은 최신 아키텍처에서는 더이상 맞지 않아 사용자들의 pinned 메모리 활용을 더욱 힘들게 하고 있다. 본 연구에서는 pinned 메모리를 활용하면 TitanV 모델에서는 기존의 16MB의 .. 2023. 8. 21.
[모두의 네트워크] 9장 - 무선 랜 이해하기 35. 무선 랜의 구조 무선 랜 ▶ 유선 랜: 컴퓨터들을 랜 케이블로 연결하여 통신한다. ▶ 무선 랜: 랜 케이블을 사용하지 않고 눈에 보이지 않는 전파를 이용하여 무선으로 컴퓨터들을 서로 연결한다. --> 컴퓨터(무선 클라이언트)가 무선 액세스 포인트와 통신하려면 무선 랜 칩(chip)과 무선 랜 어댑터(adapter)가 필요하다. 무선 랜 칩(chip) 무선 랜 어댑터(adapter): USB 메모리 방식 어댑터, 컴퓨터 카드 방식 어댑터 무선 공유기: 무선 액세스 포인트 기능 인프라스트럭처 방식, 애드혹 방식 인프라스트럭처(infrastructure) 방식: 무선 액세스 포인트를 통해 통신하는 방식 애드혹(Ad Hoc) 방식: 무선 클라이언트끼리 직접 통신하는 방식 무선 랜 규격 Lesson 35 .. 2023. 8. 16.
[모두의 네트워크] 8장 - 네트워크의 전체 흐름 살펴보기 웹 사이트에 방문했을 때 이루어지는 전체적인 데이터 처리 과정 32. 랜(LAN) 카드에서의 데이터 전달과 처리 네트워크의 구성 ※ OSI 모델 응용 계층: 애플리케이션 등에서 사용하는 데이터를 송수신하는데 필요하다. 전송 계층: 목적지에 데이터를 정확하게 전달하는데 필요하다. 네트워크 계층: 다른 네트워크에 있는 목적지에 데이터를 전달하는데 필요하다. 데이터 링크 계층: 랜(LAN)에서 데이터를 송수신하는데 필요하다. 물리 계층: 데이터를 전기 신호로 변환하는데 필요하다. 컴퓨터의 데이터가 전기 신호로 변환되는 과정 컴퓨터: 웹 브라우저(client)에 URL을 입력하여 접속한다. '세그먼트' 네트워크 계층: + IP 헤더(출발지 IP 주소, 목적지 IP 주소) --> 'IP 패킷' 데이터 링크 계층:.. 2023. 8. 16.
[모두의 네트워크] 7장 - 응용 계층: 애플리케이션에 데이터 전송하기 28. 응용 계층의 역할 ▶ 클라이언트(client): 서비스를 요청하는 측 예) 웹 브라우저, 메일 프로그램 등 ▶ 서버(server): 서비스를 제공하는 측 예) 웹 서버 프로그램, 메일 서버 프로그램 ※ OSI 모델 응용 계층 전송 계층 네트워크 계층 데이터 링크 계층 물리 계층 --> 응용 계층: 사용자측(클라이언트)의 요청을 전달하기 위해 통신 대상(서버 등)이 이해할 수 있는 메시지(데이터)로 변환하고, 전송계층으로 전달하는 역할 ▷ 응용 계층 프로토콜 : 클라이언트 측 애플리케이션(웹 브라우저, 메일 프로그램 등)이 서버 측 애플리케이션(웹 서버 프로그램, 메일 서버 프로그램 등)과 통신하려면, 응용 계층의 프로토콜을 사용해야 한다. HTTP(Hyper Text Transfer Protoco.. 2023. 8. 16.
[모두의 네트워크] 6장 - 전송 계층: 신뢰할 수 있는 데이터 전송하기 23. 전송 계층의 역할 전송 계층의 두 가지 역할 ※ OSI 모델의 전송 계층 응용 계층 전송 계층 네트워크 계층 데이터 링크 계층 물리 계층 다른 네트워크로 데이터를 전송하려면 라우터(router)가 필요하고, 라우터의 라우팅(routing) 기능을 사용하여 전송할 수 있다. 그러나 라우팅 정보가 잘못될 수 있고, 많은 라우터를 경유하는 도중에 라우터에 문제가 생기거나 패킷이 손상된다면 라우터의 라우팅 기능을 통해 데이터를 전송하더라도 목적지에 도착하지 못할 수 있다. ▶ 전송 계층: 목적지에 신뢰할 수 있는 데이터를 전달한다. 오류 점검 기능: 오류가 발생하면 데이터를 재전송하도록 요청한다. 전송된 데이터의 목적지가 어떤 애플리케이션인지 식별하는 기능 연결형 통신과 비연결형 통신 ▶ 연결형 통신: .. 2023. 8. 16.