본문 바로가기

문자집합4

유니코드 (Unicode), 전 세계의 모든 문자를 하나로 통일 유니코드 (Unicode)개요유니코드는 전 세계의 모든 문자를 하나의 통일된 체계로 표현하기 위해 설계된 문자 인코딩 표준입니다. 유니코드는 다양한 언어와 기호를 포함하여, 다국어 문서와 소프트웨어의 상호 운용성을 높이는 데 중점을 둡니다. 1991년에 처음 제정되었으며, 현재도 계속해서 확장되고 있습니다.문자집합유니코드는 전 세계의 모든 문자를 포함합니다. 이는 라틴 문자, 한글, 한자, 아라비아 문자, 키릴 문자, 특수 기호 등 다양한 문자 집합을 포괄합니다. 유니코드는 각 문자를 유일한 코드 포인트로 정의합니다.기본 다국어 평면 (BMP):U+0000에서 U+FFFF까지의 범위를 가지며, 대부분의 자주 사용되는 문자들을 포함합니다. 한글 음절, 라틴 문자, 한자 등이 여기에 포함됩니다.예: 'A'는.. 2024. 6. 22.
마이크로소프트가 개발한 문자 인코딩 방식, CP949 (Code Page 949) CP949 (Code Page 949)개요CP949는 마이크로소프트가 개발한 문자 인코딩 방식으로, 한국어를 표현하기 위해 사용됩니다. 이는 KS X 1001 (EUC-KR 기반) 표준을 확장하여 더 많은 한글 음절과 문자를 포함합니다. 주로 윈도우 운영체제에서 사용되었습니다.문자집합CP949는 KS X 1001 표준 문자 집합을 기반으로 하면서도 추가적인 한글 음절과 문자를 포함합니다. CP949는 EUC-KR보다 더 많은 한글 음절을 지원하여, 현대 한국어에서 사용되는 모든 문자를 표현할 수 있습니다.기본 문자집합:KS X 1001에 정의된 2350개의 한글 완성형 음절과 4888개의 한자를 포함합니다.확장 문자집합:KS X 1001에 포함되지 않은 8822개의 한글 음절을 추가로 지원합니다.이는 한.. 2024. 6. 21.
[컴퓨터] EUC-KR (Extended Unix Code for Korean) EUC-KR (Extended Unix Code for Korean)개요EUC-KR은 한글을 포함한 한국어 문자를 표현하기 위해 만들어진 인코딩 방식입니다. 주로 유닉스 계열 운영체제에서 사용되었습니다. EUC-KR은 한국어 표준 문자 집합인 KS X 1001 (이전에는 KS C 5601로 알려짐)에 기반을 두고 있습니다.문자집합EUC-KR 문자집합은 한글 완성형 문자, 한자, 그리고 일부 특수 문자를 포함합니다. KS X 1001 표준은 2350개의 한글 완성형 음절과 4888개의 한자를 포함한 총 8228개의 문자를 정의합니다.한글 완성형:2350개의 한글 음절을 포함합니다. 예를 들어, '가', '나', '다' 등이 있습니다.한자:4888개의 한자를 포함합니다.특수 문자 및 기호:다양한 특수 문자와.. 2024. 6. 20.
[컴퓨터] 문자집합과 인코딩 문자집합과 인코딩문자집합과 인코딩은 컴퓨터가 문자를 처리하고 저장하는 방식에서 중요한 역할을 합니다. 한글을 중심으로, 주요 문자집합과 인코딩 방식을 설명드리겠습니다.1. ASCII (American Standard Code for Information Interchange)문자집합: ASCII는 주로 영어 알파벳, 숫자, 특수 문자를 포함하는 128개의 문자로 구성된 문자집합입니다.인코딩: 각 문자는 7비트로 표현되며, 이는 0부터 127까지의 값을 가집니다. 예를 들어, 'A'는 65, 'a'는 97로 인코딩 됩니다.한글: ASCII는 한글을 포함하지 않으며, 기본적으로 영어와 일부 특수 문자만 지원합니다.2. EUC-KR (Extended Unix Code for Korean)문자집합: EUC-KR.. 2024. 6. 18.