split utf-8 string

Giorgos Keramidas keramida at ceid.upatras.gr
Thu Sep 27 20:57:39 EEST 2007


On 2007-09-27 20:20, Giorgos Pallas <gpall at ccf.auth.gr> wrote:
> προσπαθώ να φτιάξω ένα μικρό perl script για να μετατρέπω μαζικά τα
> ελληνικά ονόματα αρχείων σε greeklish.

Γιατί;  Αυτό είναι λίγο χαζό γενικά.  Όποιος δεν υποστηρίζει utf-8 ή
iso-8859-7 στο file system του, μπορεί να αυτοκτονήσει, έχουμε ήδη 2007
και ο κόσμος υποστηρίζει utf-8 εδώ και κάμποσα χρόνια :-)

> Παιδεύτηκα με διάφορα, αλλά τζίφος... Πρέπει να είναι μια δυο γραμμές
> κώδικα όλο κι όλο αλλά δεν κατέχω και πολλά από encodings και ζητώ
> βοήθεια!

> #!/usr/bin/perl
> 
> use Encode;
> use utf8;
> 
> @gl =
> ('α','β','γ','δ','ε','ζ','η','θ','ι','κ','λ','μ','ν','ξ','ο','π','ρ','σ','τ','υ','φ','χ','ψ','ω');
> @el =
> ('a','b','g','d','e','z','h','8','i','k','l','m','n','3','o','p','r','s','t','y','f','x','4','w');
> 
> opendir(DIRHANDLE, ".") || die "Cannot open current dir\n";
> 
> while ($name = readdir(DIRHANDLE)){
>     next unless (-f $name);
> 
> <<<SNIP>>>
> 
> }
> 
> closedir(DIRHANDLE);

Σε τι κωδικοποίηση είναι όμως τα ίδια τα 'α', 'β', ... 'ω' παραπάνω;

Τι πιστεύεις ότι θα κάνει και κυρίως τι θα προτιμούσες να κάνει το
script αν βρει τονισμένα γράμματα ή γράμματα με διαλυτικά;

Ξανασκέψου το, είναι μια χαρά τα utf-8 filenames :-)




More information about the Linux-greek-users mailing list