tar + ελληνικά filenames -> windows + winrar

Giorgos Keramidas keramida at ceid.upatras.gr
Sat Dec 29 02:33:32 EET 2007


On 2007-12-28 23:53, Manolis Kiagias <sonicy at otenet.gr> wrote:
>Thanasis wrote:
>> Πάντως εγώ τα ανοίγω κανονικά.
>> locale
>> LANG=el_GR.UTF-8
>> LC_CTYPE=el_GR.UTF-8
>> LC_NUMERIC=en_US.UTF-8
>> LC_TIME=en_US.UTF-8
>> LC_COLLATE=en_US.UTF-8
>> LC_MONETARY=en_US.UTF-8
>> LC_MESSAGES=en_US.UTF-8
>> LC_PAPER=en_US.UTF-8
>> LC_NAME=en_US.UTF-8
>> LC_ADDRESS=en_US.UTF-8
>> LC_TELEPHONE=en_US.UTF-8
>> LC_MEASUREMENT=en_US.UTF-8
>> LC_IDENTIFICATION=en_US.UTF-8
>> LC_ALL=
>
> Στο linux πράγματι ανοίγουν μια χαρά, πάντως μια γρήγορη δοκιμή στα
> Vista με το 7-zip δείχνει πράγματι... αραμαϊκά

Ανάλογα με το charset του «προγράμματος απεικόνισης», μπορεί να
φαίνονται, μπορεί και όχι.  Τα filenames είναι κωδικοποιημένα με UTF-8,
οπότε αν τα Windows δε μπορούν να δείξουν filenames με UTF-8 ελληνικά,
είναι μάλλον λογικό.

Σε terminal με ISO 8859-7 font, και {LANG=el_GR, LC_ALL=el_GR.ISO8859-7}
βλέπω κι εγώ «αραμαϊκά» (τα οποία είναι, βασικά, η unibyte εκτύπωση των
UTF-8 χαρακτήρων):

%%%
keramida at kobe:/tmp/pallas$ find test
test
test/Ξ±ΟΟΡίο δοκιμαΟΟ
                              ΞΉΞΊΟ.txt
test/test ΞΊΞ±Ο
               άλογοΟ
test/test ΞΊΞ±Ο
               άλογοΟ/άλλο δοκιμαΟΟ
                                                  ΞΉΞΊΟ Ξ±ΟΟΡίο.txt
keramida at kobe:/tmp/pallas$ find test | iconv -f utf-8
%%%

Μια μικρή βοήθεια από το iconv(1), όμως, δείχνει ότι τα filenames είναι
valid UTF-8 Ελληνικά:

%%%
keramida at kobe:/tmp/pallas$ find test | iconv -f utf-8
test
test/αρχείο δοκιμαστικό.txt
test/test κατάλογος
test/test κατάλογος/άλλο δοκιμαστικό αρχείο.txt
keramida at kobe:/tmp/pallas$
%%%

Το tar δεν αποθηκεύει, από όσο ξέρω, το charset κάθε ονόματος αρχείου,
οπότε δεν υπάρχει τρόπος να ξέρει το πρόγραμμα στο target μηχάνημα ότι
τα «αραμαϊκά» πρέπει να τα φιλτράρει μέσα από utf-8-to-local-charset
μετατροπέα πριν τα γράψει στο δίσκο :(




More information about the Linux-greek-users mailing list