HTML குறியீட்டு முறைகள் (எழுத்துத் தொகுப்புகள்)

HTML எழுத்துத் தொகுப்புகள் மற்றும் குறியீட்டு முறைகள்

HTML charset பண்புக்கூறு

ஒரு HTML பக்கத்தை சரியாகக் காட்டுவதற்கு, வலை உலாவி எந்த எழுத்துத் தொகுப்பைப் பயன்படுத்த வேண்டும் என்பதை அறிந்து கொள்ள வேண்டும்.

எழுத்துத் தொகுப்பு <meta> குறிச்சொல்லில் குறிப்பிடப்படுகிறது:

<meta charset="UTF-8">

HTML விவரக்குறிப்பு வலை மேம்பாட்டாளர்களை UTF-8 எழுத்துத் தொகுப்பைப் பயன்படுத்த ஊக்குவிக்கிறது.

UTF-8 உலகின் கிட்டத்தட்ட அனைத்து எழுத்துக்கள் மற்றும் குறியீடுகளையும் உள்ளடக்கியது!

UTF-8 எழுத்துத் தொகுப்பு உள்ளடக்கம்

UTF-8 உலகின் கிட்டத்தட்ட அனைத்து எழுத்துக்கள் மற்றும் குறியீடுகளையும் உள்ளடக்கியது!

யூனிகோட் வலை வளர்ச்சி

மேலும் அறிக:

முழு UTF-8 குறிப்பு

ASCII எழுத்துத் தொகுப்பு

ASCII என்பது வலையின் முதல் எழுத்து குறியீட்டு தரநிலையாகும்.

இது இணையத்தில் பயன்படுத்தக்கூடிய 128 வெவ்வேறு லத்தீன் எழுத்துக்களை வரையறுத்தது:

A
B
C
D
E
F
G
H
I
J
ஆங்கில எழுத்துக்கள் (a-z மற்றும் A-Z)
0
1
2
3
4
5
6
7
8
9
எண்கள் (0-9)
!
$
+
-
(
)
@
<
>
.
#
?
சில சிறப்பு எழுத்துக்கள்: ! $ + - ( ) @ < > . # ?

ANSI எழுத்துத் தொகுப்பு

ANSI (Windows-1252) முதல் விண்டோஸ் எழுத்துத் தொகுப்பாகும்:

ASCII உடன் ஒரே மாதிரி

முதல் 127 எழுத்துகளுக்கு

சிறப்பு எழுத்துக்கள்

128 முதல் 159 வரை

UTF-8 உடன் ஒரே மாதிரி

160 முதல் 255 வரை

<meta charset="Windows-1252">

ISO-8859-1 எழுத்துத் தொகுப்பு

HTML 4 இன் இயல்புநிலை எழுத்துத் தொகுப்பு ISO-8859-1 ஆகும்.

இது 256 எழுத்துக்களை ஆதரித்தது:

ASCII உடன் ஒரே மாதிரி

முதல் 127 எழுத்துகளுக்கு

பயன்படுத்தாதது

128 முதல் 159 வரையிலான எழுத்துக்கள்

ANSI மற்றும் UTF-8 உடன் ஒரே மாதிரி

160 முதல் 255 வரை

HTML 4 எடுத்துக்காட்டு

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

HTML 5 எடுத்துக்காட்டு

<meta charset="ISO-8859-1">

UTF-8 எழுத்துத் தொகுப்பு

ASCII உடன் ஒரே மாதிரி

0 முதல் 127 வரையிலான மதிப்புகளுக்கு

பயன்படுத்தாதது

128 முதல் 159 வரையிலான எழுத்துக்கள்

ANSI மற்றும் 8859-1 உடன் ஒரே மாதிரி

160 முதல் 255 வரை

தொடர்கிறது

256 முதல் 10,000 எழுத்துகள் வரை

<meta charset="UTF-8">

மேலும் அறிக:

முழு UTF-8 குறிப்பு

HTML UTF-8 எழுத்துக்கள்

அடிப்படை லத்தீன்

A
B
C
D
a
b
c
d
0
1
2
3
?
#
$
%
ABCD abcd 0123 ?#$%

லத்தீன் நீட்டிப்பு A

Ā
Ă
Ą
Ć
Ĉ
Ċ
Ē
Ĕ
Ė
Ę
ĀĂĄ ĆĈĊ ĒĔĖĘ

லத்தீன் நீட்டிப்பு B

ƀ
Ɓ
Ƃ
ƃ
Ƅ
ƅ
Ɔ
Ƈ
ƈ
Ɖ
Ɗ
Ƌ
ƌ
ƀƁƂƃƄƅ ƆƇƈ ƉƊƋƌ

லத்தீன் நீட்டிப்பு C

ⱠⱡⱢ ⱣⱤ ⱥⱦ ⱧⱨⱩ

லத்தீன் நீட்டிப்பு D

Ꜧꜧ ꜨꜩꜪꜫ ꜬꜭꜮꜯ

லத்தீன் நீட்டிப்பு E

ꬰꬱ ꬲꬳꬴ ꬵꬶ ꬷꬸꬹ

IPA நீட்டிப்புகள்

ɖ
ɜ
ɣ
ɘ
ɫ
ɛ
ɱ
ɷ
ɞ
ɖɜɣ ɘɫɛ ɱɷɞ

இடைவெளி மாற்றிகள்

pʰ pʱ pʲ pʳ

இடைக்குறிகள்

àáâã èéêẽ òóôõ

பொது நிறுத்தக்குறிகள்

‰ ‱ ⁒ ‼ ⁇ ⁈ ⁉ ⁎ ⁑ ⁂

மேல் மற்றும் கீழ் எழுத்துக்கள்

C⁰
Cⁱ
C⁴
C⁵
C₆
C₇
C₈
C⁰ Cⁱ C⁴ C⁵ C₆ C₇ C₈

பிரெயில்

⠓⠑⠇⠇⠕ ⠺⠕⠗⠇⠙