2.7.1. Κωδικοποίηση χαρακτήρων

Κωδικοποίηση χαρακτήρων

Οι λέξεις και οι φράσεις σε ένα κείμενο, δημιουργούνται από χαρακτήρες. Οι χαρακτήρες ομαδοποιούνται σε σύνολα χαρακτήρων (character sets ή repertoires). Ένα σύνολο χαρακτήρων μπορεί να περιλαμβάνει αλφαβητικούς χαρακτήρες, αριθμούς και άλλα σύμβολα. Ένα σύνολο χαρακτήρων λέγεται κωδικοποιημένο σύνολο χαρακτήρων όταν κάθε χαρακτήρας αντιστοιχίζεται σε ένα συγκεκριμένο αριθμό που καλείται code point. Η τιμή του code point, αντιπροσωπεύει τη θέση του χαρακτήρα στο κωδικοποιημένο σύνολο χαρακτήρων.

Για παράδειγμα,

  • στο κωδικοποιημένο σύνολο χαρακτήρων ASCII, ο χαρακτήρας που αναπαριστά το κεφαλαίο γράμμα «Α» στο λατινικό αλφάβητο, μπορεί να απεικονιστεί στον αριθμό 65(δεκαδικό σύστημα αρίθμησης) ή 41 (δεκαεξαδικό σύστημα αρίθμησης).
  • στο κωδικοποιημένο σύνολο χαρακτήρων Unicode, το code point για το χαρακτήρα à είναι 225 (δεκαδικό σύστημα αρίθμησης), ή E1 (δεκαεξαδικό σύστημα αρίθμησης).

 

Διαφημίσεις

 

Τα κωδικοποιημένα σύνολα χαρακτήρων, μερικές φορές αναφέρονται ως κωδικοσελίδες (code pages). Η κωδικοποίηση χαρακτήρων (character encoding) είναι το κλειδί που μετατρέπει τα codepoints σε δυαδική μορφή για να αποθηκευτούν σε έναν υπολογιστή ή να μεταδοθούν.

Επομένως τα μέσα και οι συσκευές εισόδου, εξόδου, αποθήκευσης και επικοινωνίας μεταφέρουν, αποθηκεύουν και χειρίζονται δεδομένα κειμένου υπό τη μορφή ενός κώδικα χαρακτήρων που απεικονίζει κάθε χαρακτήρα σε έναν μοναδικό αριθμό (code point). Η κωδικοποίηση μετατρέπει αυτούς τους αριθμούς σε δυαδική μορφή, ώστε κάθε χαρακτήρας να αντιστοιχίζεται σε μία μοναδική διαφορετική ακολουθία δυαδικών ψηφίων (σειρές από bytes).

 

Διαφημίσεις
SEE ALL Add a note
YOU
Add your Comment
 
error: Το περιεχόμενο προστατεύεται!!
X