Unicode (was: Re: Arrg, to bandwith mou !!)

Alejandros Diamandidis adia at egnatia.ee.auth.gr
Sun Sep 23 00:41:01 EEST 2001


On Sat, 22 Sep 2001, Sarantis Paskalis wrote:
> Mia erwthsh twra pou prospa8ousa na dw kai egw ta UTF-8 mails:  Estw oti
> xrhsimopoieis xterm me UTF-8 support kai UTF-8 font.  Pws blepeis ta
> ISO-8859-7 keimena?  Oxi mono mail, alla kai genikotera ISO-8859-7
> keimena?  Ypo8etw oti se X einai eukolo na anoikseis ena allo para8yro me
> ISO-8859-7 font, alla an 8es na ta deis ola auta se ena xterm ti kaneis? 

Αν θέλεις απλώς να διαβάσεις ένα κείμενο που το έχεις σε κάποια άλλη
κωδικοποίηση, μπορείς να το μετατρέψεις με το iconv ή το recode:

iconv -f iso-8859-7 -t utf-8 <greek.txt |less

Αν μάλιστα δουλεύεις συνέχεια σε UTF-8 locale, μπορείς να μετατρέψεις
όλα σου τα κείμενα σε UTF-8 και να ησυχάσεις ;-)

Τώρα, το θέμα είναι τι γίνεται με τις άλλες εφαρμογές. Η βιβλιοθήκη
της C περιέχει μια συνάρτηση, την iconv, με την οποία τα προγράμματα
μπορούν να μετατρέπουν εύκολα το κείμενο από τη μια κωδικοποίηση στην
άλλη. Υποτίθεται ότι τα προγράμματα που είναι γραμμένα με το i18n
(internationalization) στο μυαλό χρησιμοποιούν αυτή τη συνάρτηση έτσι
ώστε το κείμενο που τυπώνουν στην οθόνη να είναι στη σωστή
κωδικοποίηση για το τρέχον locale. Για περισσότερες πληροφορίες,
"info iconv". Φυσικά πολλά προγράμματα δεν έχουν τέτοια πρόβλεψη, ενώ
σε άλλα πρέπει να εγκαταστήσεις τις τελευταίες-τελευταίες εκδόσεις
τους. Σιγά-σιγά πάντως η υποστήριξη για τέτοια λειτουργία βελτιώνεται
και εξαπλώνεται.

Πέραν αυτών, μια εφαρμογή μπορεί να πει στο τερματικό τι κωδικοποίηση
θα χρησιμοποιήσει για την έξοδό της χρησιμοποιώντας τους κωδικούς του
ISO 2022. Δεν ξέρω ποια προγράμματα δουλεύουν έτσι, αλλά υποστήριξη
γι' αυτό παρέχει ένα πρόγραμμα που λέγεται luit, το οποίο δουλεύει σαν
περιτύλιγμα στα προγράμματα αυτά και μεταφράζει την έξοδό τους σε
UTF-8: http://www.pps.jussieu.fr/~jch/software/luit/

Δεν το έχω ψάξει, αλλά έχω την εντύπωση ότι το luit μπορεί να
χρησιμοποιηθεί για να τρέξεις εφαρμογές που χρησιμοποιούν οποιαδήποτε
κωδικοποιήση μέσα σε ένα xterm UTF-8: Στέλνεις πρώτα τον κωδικό ISO
2022 για την κωδικοποίηση που θέλει το πρόγραμμα και μετά το τρέχεις
κανονικά.

Αλέξανδρος



More information about the Linux-greek-users mailing list