Unicode UTF-8 UTF 10646-1

Vasilis Vasaitis vvas at hal.csd.auth.gr
Tue Aug 31 22:37:54 EEST 2004


On Tue, Aug 31, 2004 at 08:56:50PM +0300, fs wrote:
> Ligo arga to skefthka alla skeftika na afhsw ligo to iso 8859-7 kai na
> dokimasw ti mporei na kanei to unicode. Meta apo ligo psaksimo yparxei
> mia sebasth leitourgikothta edw, par'ola ayta exw kapoies erwthseis kai
> kapoia problhmatakia.
> 
> Kat'arxhn kati ameso, 8etontas sto mutt sending charset 8859-7 
> - opws tora - logika den yparxei problima se ena 8859-7 xterm. 8etontas
> ws sending charset UTF-8 apo ena UTF-8 xterm, perimena problima apo ena
> 8859-7 xterm, alla den yphrxe. Giati?

  Γιατί ο mutt κάνει μετατροπή του κειμένου, ώστε να εμφανίζεται στο
τερματικό σου. Προφανώς, αν στο UTF-8 κείμενο περιλαμβάνονταν
χαρακτήρες που δεν υπάρχουν στο ISO-8859-7, αυτοί θα εμφανίζονταν ως
ερωτηματικά.

  Πάντως, εγώ για το send_charset του mutt προτείνω κάτι τέτοιο:

	set send_charset="us-ascii:iso-8859-7:iso-8859-1:utf-8"

ώστε να στέλνει ένα μήνυμα ως UTF-8 μόνο όταν δεν είναι εφικτό να
σταλεί με κάποια από τις άλλες κωδικοποιήσεις, μεγιστοποιώντας την
συμβατότητα προς τα πίσω. Τη ρύθμιση αυτή, όπως στη γράφω, την πήρα
απευθείας από το .muttrc μου.

> Se ena UTF-8 xterm poy grafo ena text me vim, me ena 8859-7 xterm to
> text einai xalasmeno. ayto akoygetai logikotero. (Ta agglika giati
> diabazontai BTW;)

  Γιατί το UTF-8 είναι συμβατό με το ASCII, δηλαδή οι 128 πρώτοι
χαρακτήρες (7-bit) κωδικοποιούνται με τον ίδιο ακριβώς τρόπο. Αυτό
είναι ένα από τα μεγάλα του προτερήματα σε σχέση με άλλες
κωδικοποιήσεις του Unicode.

> Gia na kleiso me ayto, exo thn entypwsh einai ligo problhma to grapsimo
> utf texts gia "global compatibility" Yparxei kati poy den lambano ypopsin
> moy;

  Ότι, προφανώς, σε οποιοδήποτε περιβάλλον που χρησιμοποιεί μια
συγκεκριμένη κωδικοποίηση, τα κείμενα μιας άλλης δε θα διαβάζονται.
Όμως το UTF-8 θα οδηγήσει τελικά σε αυτήν την καθολική συμβατότητα που
αναφέρεις, όταν απλά θα έχει πλέον καθιερωθεί και θα το χρησιμοποιούν
όλοι.

> Tora se kapoia pio amesa problimata. Einai monimi katastasi se UTF
> periballon to oti ta non-UTF fonts den doyleyoyn; Dioti mporei na mporw
> na treksw to lala me "LANG=el_GR lala" anti toy el_GR.UTF-8 alla oso
> na'nai ayto einai ligo messy kai kapoia pragmata den "ksanatrexoyn" syxna
> opws to window manager. Pantos ean ayto einai monimi katastash kai kati
> den moy diafeygei, einai logos gia na iparxei monima to 8859-7.
> Skeftomai tora oti isos ayto mporei na ginei mesw toy windowmanager kai
> pros to paron trexo windowmaker. isos me kapoio window manager me
> kalyterh utf ypostiriksh na kalyptetai ayto. Ali8eyei;

  Με τον WindowMaker δεν πρόκειται να καταφέρεις να δεις υποστήριξη
για UTF-8 της προκοπής, μέχρι να αποφασίσουν να βγάλουν κάποια έκδοση
που να χρησιμοποιεί fontconfig, όπως κάνει όλος ο κόσμος. Η μη ύπαρξη
τέτοιας υποστήριξης είναι ένας από τους λόγους που, μετά από χρόνια,
δεν τον χρησιμοποιώ τον τελευταίο καιρό. [0]

> Kai ayto poy pragmatika "den doyleyei": den mporesa na kano ta gtk apps
> na doyn ellinika kan. Bazontas oti ISO10646-1 brika mprosta moy sto
> gtkrc, amesa h' me to 'switch', akoma kai to idio to switch edikse
> "tetragonakia". to gimp episis(sta menu toy, den koitaksa kan ti ginetai
> sta text tools). ekana comment arxeia sxetizomena sto /etc/gtk gia na eimai
> sigoyros pws den pernei kati apo kei alla tpt. To gtk einai ekdosi 1.2 edo,
> alla de pisteyo na min ypostirizei unicode. btw, to xmms episis exi
> problimata (1.7.2) to opoio me windos ttfs htan beauty.

  Προφανώς, δεν αρκεί να αλλάξεις τη γραμματοσειρά, πρέπει να αλλάξεις
και το locale, και πρέπει και τα δεδομένα που τους ταΐζεις να είναι σε
UTF-8 (π.χ., τα ονόματα των αρχείων που πας να ανοίξεις, τα tags των
MP3, κτλ.). Αλλά γενικά η GTK+ 1.x δεν έχει καλή υποστήριξη για
γραμματοσειρές με πολλούς χαρακτήρες, και θα έχεις καλύτερη τύχη με
μια -iso8859-7 γραμματοσειρά στο .gtkrc. Βέβαια δε θα βλέπεις σύμβολα
όπως το ευρώ, αλλά τι να κάνουμε.

  Όσο για το xmms, δοκίμασε με -iso10646-1 γραμματοσειρά, σε συνδυασμό
με την επιλογή «Χρήση fontsets».

> Ayth th stigmh eimai anapofasistos gia to an gyrisw sto 8859-7. To
> http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-demo.txt einai
> pragmatika entypwsiako se ena xterm kai diskola afineis kati tetio na
> paei xameno. 

  Αργά ή γρήγορα θα την κάνεις την αλλαγή. Όλοι θα την κάνουν. IMHO,
όσο συντομότερα ξεμπερδέψεις, τόσο το καλύτερο. :^)


[0] Οι άλλοι λόγοι σχετίζονται με το ότι το KDE 3.3 που χρησιμοποιώ
αντ' αυτού είναι και πολύ όμορφο και πολύ λειτουργικό, IMHO. Δοκίμασα
το KDE για πρώτη φορά με το 3.2.3 πριν λίγους μήνες, και έμεινα άκρως
εντυπωσιασμένος.

-- 
Vasilis Vasaitis
"A man is well or woe as he thinks himself so."





More information about the Linux-greek-users mailing list