Kamis, 08 Maret 2018

Belajar HTML Part 22 - Charset (Set Karakter)


HTML Encoding (Set Karakter)
Untuk menampilkan halaman HTML dengan benar, web browser harus tahu mana set karakter (karakter encoding) yang akan digunakan.

Apa itu Character Encoding?
Character Encoding merupakan standar untuk pengkodean karakter. Standar pengkodean karakter (set karakter) yang pertama adalah ASCII. ASCII terdiri dari 128 karakter alfanumerik yang berbeda. Karakter alfanumerik  yang dapat digunakan di internet yaitu angka (0-9), huruf A-Z (dalam bahasa inggris), dan juga beberapa karakter khusus seperti $ + - ( ) @ < >.

Selain ASCII, ada beberapa set karakter yang bisa digunakan, yaitu:
  • ANSI (Windows-1252) adalah set karakter asli Windows, dengan dukungan untuk 256 kode karakter yang berbeda.
  • ISO-8859-1 adalah karakter default ditetapkan untuk HTML 4. Karakter ini juga didukung dengan 256 kode karakter yang berbeda.

Karena ANSI dan ISO-8859-1 begitu terbatas, HTML 4 juga mendukung UTF-8. UTF-8 (Unicode) mencakup hampir semua karakter dan simbol di dunia. UTF-8 adalah karakter pengkodean default untuk HTML5.

Atribut Charset di HTML
Untuk menampilkan halaman HTML dengan benar, web browser harus mengetahui set karakter yang digunakan di halaman. Oleh karena itu, untuk menentukan set karakter pada halaman, gunakan tag <meta>:

Untuk HTML4:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Untuk HTML5:
<meta charset="UTF-8">

Jika browser mendeteksi ISO-8859-1 di halaman web, hal tersebut merupakan set default untuk ANSI, karena ANSI identik dengan ISO-8859-1 kecuali jika ANSI memiliki 32 karakter tambahan.

Perbedaan antara Set Karakter
Pada tabel berikut, akan dijelaskan perbedaan antara set karakter seperti yang dijelaskan di atas.
Numb ASCII ANSI 8859 UTF-8
32
33
!
!
!
!
34
"
"
"
"
35
#
#
#
#
36
$
$
$
$
37
%
%
%
%
38
&
&
&
&
39
'
'
'
'
40
(
(
(
(
41
)
)
)
)
42
*
*
*
*
43
+
+
+
+
44
,
,
,
,
45
-
-
-
-
46
.
.
.
.
47
/
/
/
/
48
0
0
0
0
49
1
1
1
1
50
2
2
2
2
51
3
3
3
3
52
4
4
4
4
53
5
5
5
5
54
6
6
6
6
55
7
7
7
7
56
8
8
8
8
57
9
9
9
9
58
:
:
:
:
59
;
;
;
;
60
<
<
<
<
61
=
=
=
=
62
>
>
>
>
63
?
?
?
?
64
@
@
@
@
65
A
A
A
A
66
B
B
B
B
67
C
C
C
C
68
D
D
D
D
69
E
E
E
E
70
F
F
F
F
71
G
G
G
G
72
H
H
H
H
73
I
I
I
I
74
J
J
J
J
75
K
K
K
K
76
L
L
L
L
77
M
M
M
M
78
N
N
N
N
79
O
O
O
O
80
P
P
P
P
81
Q
Q
Q
Q
82
R
R
R
R
83
S
S
S
S
84
T
T
T
T
85
U
U
U
U
86
V
V
V
V
87
W
W
W
W
88
X
X
X
X
89
Y
Y
Y
Y
90
Z
Z
Z
Z
91
[
[
[
[
92
\
\
\
\
93
]
]
]
]
94
^
^
^
^
95
_
_
_
_
96
`
`
`
`
97
a
a
a
a
98
b
b
b
b
99
c
c
c
c
100
d
d
d
d
101
e
e
e
e
102
f
f
f
f
103
g
g
g
g
104
h
h
h
h
105
i
i
i
i
106
j
j
j
j
107
k
k
k
k
108
l
l
l
l
109
m
m
m
m
110
n
n
n
n
111
o
o
o
o
112
p
p
p
p
113
q
q
q
q
114
r
r
r
r
115
s
s
s
s
116
t
t
t
t
117
u
u
u
u
118
v
v
v
v
119
w
w
w
w
120
x
x
x
x
121
y
y
y
y
122
z
z
z
z
123
{
{
{
{
124
|
|
|
|
125
}
}
}
}
126
~
~
~
~
127
DEL
128
129



130
131
ƒ
132
133
134
135
136
ˆ
137
138
Š
139
140
Œ
141



142
Ž
143



144



145
146
147
148
149
150
151
152
˜
153
154
š
155
156
œ
157



158
ž
159
Ÿ
160
161

¡
¡
¡
162
¢
¢
¢
163
£
£
£
164
¤
¤
¤
165
¥
¥
¥
166
¦
¦
¦
167
§
§
§
168
¨
¨
¨
169
©
©
©
170
ª
ª
ª
171
«
«
«
172
¬
¬
¬
173



174
®
®
®
175
¯
¯
¯
176
°
°
°
177
±
±
±
178
²
²
²
179
³
³
³
180
'
'
'
181
μ
μ
μ
182
183
·
·
·
184
¸
¸
¸
185
¹
¹
¹
186
º
º
º
187
»
»
»
188
¼
¼
¼
189
½
½
½
190
¾
¾
¾
191
¿
¿
¿
192
À
À
À
193
Á
Á
Á
194
Â
Â
Â
195
Ã
Ã
Ã
196
Ä
Ä
Ä
197
Å
Å
Å
198
Æ
Æ
Æ
199
Ç
Ç
Ç
200
È
È
È
201
É
É
É
202
Ê
Ê
Ê
203
Ë
Ë
Ë
204
Ì
Ì
Ì
205
Í
Í
Í
206
Î
Î
Î
207
Ï
Ï
Ï
208
Ð
Ð
Ð
209
Ñ
Ñ
Ñ
210
Ò
Ò
Ò
211
Ó
Ó
Ó
212
Ô
Ô
Ô
213
Õ
Õ
Õ
214
Ö
Ö
Ö
215
×
×
×
216
Ø
Ø
Ø
217
Ù
Ù
Ù
218
Ú
Ú
Ú
219
Û
Û
Û
220
Ü
Ü
Ü
221
Ý
Ý
Ý
222
Þ
Þ
Þ
223
ß
ß
ß
224
à
à
à
225
á
á
á
226
â
â
â
227
ã
ã
ã
228
ä
ä
ä
229
å
å
å
230
æ
æ
æ
231
ç
ç
ç
232
è
è
è
233
é
é
é
234
ê
ê
ê
235
ë
ë
ë
236
ì
ì
ì
237
í
í
í
238
î
î
î
239
ï
ï
ï
240
ð
ð
ð
241
ñ
ñ
ñ
242
ò
ò
ò
243
ó
ó
ó
244
ô
ô
ô
245
õ
õ
õ
246
ö
ö
ö
247
÷
÷
÷
248
ø
ø
ø
249
ù
ù
ù
250
ú
ú
ú
251
û
û
û
252
ü
ü
ü
253
ý
ý
ý
254
þ
þ
þ
255
ÿ
ÿ
ÿ
Catatan: Pada tabel di atas, tanda  artinya tidak digunakan (not used).
Set Karakter ASCII
  • ASCII menggunakan nilai dari 0 sampai 31 (dan 127) untuk karakter kontrol.
  • ASCII menggunakan nilai dari 32 - 126 untuk huruf, angka, dan simbol.
  • ASCII tidak menggunakan nilai-nilai dari 128 - 255.

Set Karakter ANSI (Windows-1252)
  • ANSI identik dengan ASCII untuk nilai 0 - 127.
  • ANSI memiliki sekumpulan karakter nilainya dari 128 - 159.
  • ANSI identik dengan UTF-8 nilainya dari 160 - 255.

Set Karakter ISO-8859-1
  • 8859-1 identik dengan ASCII nilainya dari 0 -127.
  • 8859-1 tidak menggunakan nilai-nilai dari 128 - 159.
  • 8859-1 identik dengan UTF-8 nilainya dari 160 - 255.

Set Karakter UTF-8
  • UTF-8 identik dengan ASCII nilainya dari 0 - 127.
  • UTF-8 tidak menggunakan nilai-nilai dari 128 - 159. 
  • UTF-8 sangat identik dengan ANSI dan 8859-1 dengan nilai dari 160 - 255.
  • UTF-8 terus berlanjut dengan nilai dari nilai 256 sampai dengan lebih dari 10.000 karakter yang berbeda.

Demikian pembahasan mengenai Set Karakter di HTML.
Semoga bermanfaat!

Sumber: https://www.w3schools.com

Bagikan

Artikel Terkait

Belajar HTML Part 22 - Charset (Set Karakter)
4/ 5
Oleh

Subscribe via email

Suka dengan artikel di atas? Tambahkan email Anda untuk berlangganan! Terima Kasih...