본문 바로가기
Etc/Coursera

Harvard CS50_ASCII 코드

by happy coding! 2018. 10. 6.
반응형

Harvard CS50 Class



 Chapter 1. 컴퓨터와 컴퓨팅


5. ASCII 코드



 Intro


- 우리가 컴퓨터로 주로 작성하는 것은 숫자가 아니라 문자임

- 0과 1만 이해할 수 있는 컴퓨터가 우리가 사용하는 문자(text)는 어떻게 이해할 수 있을까?



※ 핵심 단어


- ASCII

- ASCII 표

- 인코딩

- 유니코드



※ ASCII 코드


- 컴퓨터는 텍스트를 비롯한 다양한 형태의 정보를 저장

- 하지만 컴퓨터가 0과 1로된 데이터만 저장할 수 있기 때문에, 0과 1을 이용해 텍스트 문자로 나타내야함

- ASCII (아스키) : 문자를 컴퓨터가 이해할 수 있는 이진 데이터(0 또는 1)로, 혹은 그 반대로 변환하는 표준 방법


                                                                                                                                                                                                                                                                                                               

※ ASCII 인코딩 표준


- ASCII (아스키)는 컴퓨터가 텍스트 데이터를 저장하기 위해 흔하게 사용하는 표준 코드 체계 

- 이 표준에서 숫자 65는 대문자 'A'와 대응됨

- 컴퓨터가 대문자 'A'를 저장하고 싶다면 숫자 65를 이진수로 저장함 (2진수로 나타내면, 1000001)

- 그 다음 25개 값들은 다른 대문자 25개와 대응됨


- 소문자로 ASCII에서 숫자로 나타낼 수 있음

- 소문자 'a'는 숫자 97, 'b'는 98로 나타냄. 컴퓨터가 소문자 'a'를 저장하려면 숫자 97을 2진수, 1100001로 저장함

- ASCII 에서 소문자는 같은 대문자 글자보다 항상 2^5만큼 큼





※ ASCII의 한계


- ASCII 코드 표는 모든 ASCII 코드 문자와 그에 대응하는 숫자를 나타냄

- 기본 ASCII 코드 표는 7비트만 이용해서 모든 문자을 나타냄

- 이것은 ASCII 코드로 2^7개, 즉 128개의 문자를 나타낼 수 있다는 것을 의미

- 확장 ASCII 코드는 8번째 비트를 추가하여 총 256개의 문자를 나타냄. 소문자와 대문자를 통틀어 52개 알파벳 밖에 없으므로 그외 남는 공간에 구분 기호, 숫자, 몇몇 기본 심볼들($나 %기호 등) 같은 다른 종류의 문자들을 나타낼 수 있음


- 하지만 8비트 ASCII 코드로 나타낼 수 없는 문자들이 아직도 많이 있음

- 이 때문에 훨씬 더 많은 문자들을 포함할 수 있는 유니코드(Unicode)가 생김

- 유니코드는 100만개 이상의 문자들을 나타낼 수 있는 문자 인코딩 표준. 첫 128개의 문자는 ASCII의 128개 문자와 동일하므로 서로 호환됨.



반응형

'Etc > Coursera' 카테고리의 다른 글

[Coursera] Stanford Machine Learning  (0) 2020.08.22
Harvard CS50_2진수  (0) 2018.10.05
Harvard CS50_비트와 바이트  (0) 2018.09.28
Harvard CS50_기억장치  (0) 2018.09.23
Harvard CS50_하드웨어  (0) 2018.09.09

댓글