-
Harvard CS50_ASCII 코드Study/Coursera 2018. 10. 6. 17:07반응형
Harvard CS50 Class
※ Chapter 1. 컴퓨터와 컴퓨팅
5. ASCII 코드
※ Intro
- 우리가 컴퓨터로 주로 작성하는 것은 숫자가 아니라 문자임
- 0과 1만 이해할 수 있는 컴퓨터가 우리가 사용하는 문자(text)는 어떻게 이해할 수 있을까?
※ 핵심 단어
- ASCII
- ASCII 표
- 인코딩
- 유니코드
※ ASCII 코드
- 컴퓨터는 텍스트를 비롯한 다양한 형태의 정보를 저장
- 하지만 컴퓨터가 0과 1로된 데이터만 저장할 수 있기 때문에, 0과 1을 이용해 텍스트 문자로 나타내야함
- ASCII (아스키) : 문자를 컴퓨터가 이해할 수 있는 이진 데이터(0 또는 1)로, 혹은 그 반대로 변환하는 표준 방법
※ ASCII 인코딩 표준
- ASCII (아스키)는 컴퓨터가 텍스트 데이터를 저장하기 위해 흔하게 사용하는 표준 코드 체계
- 이 표준에서 숫자 65는 대문자 'A'와 대응됨
- 컴퓨터가 대문자 'A'를 저장하고 싶다면 숫자 65를 이진수로 저장함 (2진수로 나타내면, 1000001)
- 그 다음 25개 값들은 다른 대문자 25개와 대응됨
- 소문자로 ASCII에서 숫자로 나타낼 수 있음
- 소문자 'a'는 숫자 97, 'b'는 98로 나타냄. 컴퓨터가 소문자 'a'를 저장하려면 숫자 97을 2진수, 1100001로 저장함
- ASCII 에서 소문자는 같은 대문자 글자보다 항상 2^5만큼 큼
※ ASCII의 한계
- ASCII 코드 표는 모든 ASCII 코드 문자와 그에 대응하는 숫자를 나타냄
- 기본 ASCII 코드 표는 7비트만 이용해서 모든 문자을 나타냄
- 이것은 ASCII 코드로 2^7개, 즉 128개의 문자를 나타낼 수 있다는 것을 의미
- 확장 ASCII 코드는 8번째 비트를 추가하여 총 256개의 문자를 나타냄. 소문자와 대문자를 통틀어 52개 알파벳 밖에 없으므로 그외 남는 공간에 구분 기호, 숫자, 몇몇 기본 심볼들($나 %기호 등) 같은 다른 종류의 문자들을 나타낼 수 있음
- 하지만 8비트 ASCII 코드로 나타낼 수 없는 문자들이 아직도 많이 있음
- 이 때문에 훨씬 더 많은 문자들을 포함할 수 있는 유니코드(Unicode)가 생김
- 유니코드는 100만개 이상의 문자들을 나타낼 수 있는 문자 인코딩 표준. 첫 128개의 문자는 ASCII의 128개 문자와 동일하므로 서로 호환됨.
반응형'Study > Coursera' 카테고리의 다른 글
[Coursera] Stanford Machine Learning (0) 2020.08.22 Harvard CS50_2진수 (0) 2018.10.05 Harvard CS50_비트와 바이트 (0) 2018.09.28 Harvard CS50_기억장치 (0) 2018.09.23 Harvard CS50_하드웨어 (0) 2018.09.09