Συνολική χαρακτήρα HTML
- Επόμενη σελίδα Συνολική χαρακτήρα HTML
- Προηγούμενη σελίδα HTML ASCII
Για να εμφανιστεί σωστά η σελίδα HTML, ο περιηγητής πρέπει να γνωρίζει τη γλωσσα χαρακτήρων (κωδικοποίηση) που πρέπει να χρησιμοποιήσει:
Παράδειγμα
<meta charset="UTF-8">
Συνολική χαρακτήρα HTML
Η规範 του HTML5 ενθαρρύνει τους προγραμματιστές του Web να χρησιμοποιούν τη γλωσσα χαρακτήρων UTF-8!
Ωστόσο, αυτό δεν ήταν πάντα έτσι. Η κωδικοποίηση χαρακτήρων του αρχικού Web ήταν ASCII.
Αργότερα, από το HTML 2.0 μέχρι το HTML 4.01, η ISO-8859-1 θεωρήθηκε η πρότυπη γλωσσα χαρακτήρων.
Με την XML και το HTML5, το UTF-8 τελικά εμφανίστηκε και λύσε numerous προβλήματα κωδικοποίησης χαρακτήρων.
Αρχικά: ASCII
Τα δεδομένα του υπολογιστή αποθηκεύονται σε ηλεκτρονικά συστήματα ως δυαδικό κώδικα (01000101).
Για να standardize την αποθήκευση κειμένων, δημιουργήθηκε ο Αμερικανικός Κώδικας Εξ ανταλλαγής Πληροφοριών (American Standard Code for Information Interchange, ASCII). Ορίζει έναν μοναδικό δυαδικό αριθμό για κάθε χαρακτήρα που μπορεί να αποθηκευτεί, για να υποστηρίξει τους αριθμούς 0-9, τα κεφαλαία και τα πεζά γράμματα (a-z, A-Z) και τους ειδικούς χαρακτήρες (π.χ. ! $ + - ( ) @ < > ,).
Επειδή το ASCII χρησιμοποιεί 7-bit χαρακτήρες, μπορεί να εκφράσει μόνο 128 διαφορετικούς χαρακτήρες.
Η μεγαλύτερη αδυναμία του ASCII είναι ότι αποκλείει χαρακτήρες μη αγγλικούς.
Σήμερα, το ASCII εξακολουθεί να χρησιμοποιείται, ειδικά σε συστήματα μεγάλων υπολογιστών.
Για περαιτέρω έρευνα, επισκεφθείτε τον Πλήρης αναφορά ASCII.
Στο Windows: Windows-1252
Το Windows-1252 είναι η προεπιλεγμένη γλωσσα χαρακτήρων στο Windows (μέχρι το Windows 95).
Είναι επέκταση του ASCII, προσθέτοντας χαρακτήρες διεθνείς.
Χρησιμοποιεί έναν ολόκληρο μπύτης (8 bits) για να εκφράσει 256 διαφορετικούς χαρακτήρες.
Επειδή το Windows-1252 είναι η προεπιλεγμένη ρύθμιση στο Windows, όλα τα προγράμματα περιήγησης υποστηρίζουν το.
Για περαιτέρω έρευνα, επισκεφθείτε τον Πλήρης αναφορά Windows-1252.
Στο HTML 4: ISO-8859-1
Η πιο συχνά χρησιμοποιούμενη γλωσσα χαρακτήρων στο HTML 4 είναι η ISO-8859-1.
ISO-8859-1 είναι επέκταση του ASCII, προσθέτοντας χαρακτήρες διεθνείς.
Παράδειγμα
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Στο HTML 4, μπορείτε να καθορίσετε διαφορετική χαρακτήρα από το ISO-8859-1 στο σήμα <meta>:
Παράδειγμα
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Όλοι οι διαχειριστές HTML 4 υποστηρίζουν τα UTF-8:
Παράδειγμα
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Συμβουλή:Όταν ο περιηγητής αναγνωρίζει το ISO-8859-1, συνήθως ορίζεται ως Windows-1252, επειδή το Windows-1252 έχει 32 διεθνείς χαρακτήρες.
Για περαιτέρω έρευνα, επισκεφθείτε τον Πλήρης αναφορά ISO-8859-1.
Στο HTML5: Unicode UTF-8
Το πρότυπο HTML5 ενθαρρύνει τους ανάπτυκτες του Web να χρησιμοποιούν τη χαρακτήρα UTF-8.
Παράδειγμα
<meta charset="UTF-8">
Μπορείτε να καθορίσετε διαφορετική χαρακτήρα από το UTF-8 στο σήμα <meta>:
Παράδειγμα
<meta charset="ISO-8859-1">
Η Ένωση Unicode αναπτύχθηκε τα πρότυπα UTF-8 και UTF-16, επειδή η σειρά χαρακτήρων ISO-8859 είναι περιορισμένη και δεν είναι συμβατή με πολυγλωσσικές περιβάλλοντα.
Ο πρότυπος Unicode (κατά περίπου) καλύπτει όλους τους χαρακτήρες, τα σημεία στίξης και τα σύμβολα του κόσμου.
Συμβουλή:Όλοι οι διαχειριστές HTML5 και XML υποστηρίζουν τα UTF-8, UTF-16, Windows-1252 και ISO-8859.
Για περαιτέρω έρευνα, επισκεφθείτε τον Πλήρης αναφορά Unicode.
- Επόμενη σελίδα Συνολική χαρακτήρα HTML
- Προηγούμενη σελίδα HTML ASCII