본문 바로가기
컴퓨터구조

[혼자 공부하는 컴퓨터구조] 02. 데이터

by Lizardee 2023. 7. 27.
02-1. 0과 1로 숫자를 표현하는 방법
정보 단위
  • 1비트(1bit): 0과 1을 나타내는 가장 작은 정보 단위 --> 2^1 개의 정보 표현 가능
  • 1바이트(1byte): 8비트 --> 2^8 개의 정보 표현 가능
  • 1킬로바이트(1kB): 1,000바이트(1,000byte)
  • 1메가바이트(1MB): 1,000킬로바이트(1,000kB)
  • 1기가바이트(1GB): 1,000메가바이트(1,000MB)
  • 1테라바이트(1TB): 1,000기가바이트(1,000GB)
  • 워드(word): CPU가 한 번에 처리할 수 있는 데이터 크기

 

이진법(binary)

: 0과 1만으로 모든 숫자를 표현하는 방법

 

▶ 이진수의 음수 표현

  • 2의 보수(two's complement): 모든 0과 1 뒤집기 --> 1 더하기 

 

십육진법

: 0 1 2 3 4 5 6 7 8 9 A B C D E F

 

▶ 십육진수를 이진수로 변환하기

: 십육진수 하나 당 4비트를 할당한다.

 

▶ 이진수를 십육진수로 변환하기

: 4비트로 끊어서 변환한다.

 


02-2. 0과 1로 문자를 표현하는 방법
문자 집합과 인코딩
  • 문자 집합(character set): 컴퓨터가 인식하고 표현할 수 있는 문자의 모음
  • 문자 인코딩(character encoding): 문자를 0과 1로 변환하는 과정
  • 문자 디코딩(character decoding): 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있는 문자로 변환하는 과정

▶ 아스키 코드(ASCII; American Standard Code for Information Interchange)

: 아스키 문자 집합에 0~127까지의 수가 할당되어 아스키 코드로 인코딩된다.

 

▶ EUC-KR

: 한글을 2바이트 크기로 인코딩할 수 있는 완성형 인코딩 방식이다.

  • 완성형 인코딩: 초성, 중성, 종성의 조합으로 이루어진 완성된 하나의 글자에 고유한 코드를 부여하는 인코딩 방식
  • 조합형 인코딩: 초성을 위한 비트열, 중성을 위한 비트열, 종성을 위한 비트열을 할당하여, 그것들의 조합으로 하나의 글자 코드를 완성하는 인코딩 방식

 

▶ 유니코드(unicode)와 UTF-8

: 유니코드는 여러 나라의 문자들을 광범위하게 표현할 수 있는 문자 집합이며, UTF-8, UTF-16, UTF-32는 유니코드 문자의 인코딩 방식이다.