Compose map

Alejandros Diamandidis adia at egnatia.ee.auth.gr
Thu May 10 23:55:49 EEST 2001


On Thu, May 10, 2001 at 04:04:43PM +0100, Konstantinos Pistiolis wrote:
> Δηλαδή η NFC έχει τους χαρακτήρες συνδυασμένους ενώ ή
> NFD με τους τόνους "ελεύθερους" και με τυχαία σειρά;

Ναι, όχι όμως με τυχαία σειρά, αλλά από "μέσα" προς τα "έξω" (δηλαδή τον
βασικό χαρακτήρα τον ακολουθούν πρώτα οι τόνοι που είναι πιο κοντά). Στην
κανονικοποίηση υπάρχει και ένα βήμα που οι τόνοι αναδιατάσσονται έτσι ώστε
να είναι στην "κανονική" σειρά. Αυτά αναλύονται στο UAX #15.

Πάντως ενώ οι αλγόριθμοι κανονικοποίησης υπάρχουν σε διάφορες βιβλιοθήκες,
δεν ξέρω αν χρησιμοποιούνται από τις εφαρμογές.

> Αν κατάλαβα καλά, το combining αντιστοιχεί σε
> ενεργητική φωνή. Ίσως η μετάφραση "συνιστώντες
> χαρακτήρες" είναι πιο κατανοητή. 

Χμμ... "Combining characters" (ή "non-spacing characters") είναι τα
σύμβολα εκείνα που δεν στέκουν μόνα τους στη γραμμή αλλά πηγαίνουν και
κάθονται πάνω σε κάποιον βασικό χαρακτήρα - τέτοια είναι οι τόνοι, διάφορα
άλλα διακριτικά σημεία όπως αυτά που συμβολίζουν τα φωνήεντα στα Εβραϊκά
και τα Αραβικά, κλπ. Το "συνιστώντες χαρακτήρες" παραπέμπει μάλλον σε
όλους τους χαρακτήρες που αποτελούν έναν σύνθετο χαρακτήρα.

> -αντί για "συνδυασμένος χαρακτήρας", "σύνθετος
> χαρακτήρας"
> -και "σύνθεση" ή "ανασύνθεση" αντί για "επανασύνδεση"

Σωστές προτάσεις, ευχαριστώ!

> Πολύ κατατοπιστικό. Άρα, και στην περίπτωση που πχ. τό
> "α" παίρνει και οξεία και βραχύ, που δεν γράφονται και
> τα δύο από πάνω (η οξεία πηγαίνει δίπλα μόνη της),
> είναι τελείως ισοδύναμο με το να τα έπαιρνε και τα δύο
> από πάνω στην NFC κανονικοποίηση (δεν υπάρχει τέτοιος
> συνδυασμός ούτε χρησιμοποιείται στη γραφή με το χέρι).

Ναί, ακριβώς. Στο Unicode υπάρχουν ως βασικοί χαρακτήρες τα περισσότερα
γράμματα των "σημαντικών" γλωσσών, αλλά μπορείς να κάνεις και άλλους
συνδυασμούς (οι οποίοι μπορεί βέβαια να μην απεικονίζονται και τόσο καλά).

-- 
Alejandros Diamandidis * adia at egnatia.ee.auth.gr



More information about the I18ngr mailing list