encoding αχταρμάς

V13 v13 at priest.com
Sat Jun 16 11:01:40 EEST 2007


On Wednesday 13 June 2007, Giorgos D. Pallas wrote:
> Έχω ένα αρχειάκι το οποίο όταν το κάνω cat σε UTF-8 encoding τερματικού
> μου δείχνει εκείνα τα aeoaeoao με τα accents που συνήθως βλέπουμε σε web
> pages που έχουν ελληνικά αλλά encoding iso8859-1.
>
> Για να καταφέρω να το δω στα ελληνικά, πρέπει να γυρίσω το τερματικό σε
> iso-8859-7 και να δώσω cat lala | recode utf8..iso-8859-1
> Aν δώσω αν'αυτού cat lala | recode utf8..iso-8859-7, μου γκρινιάζει
> Invalid input in step `UTF-8..ISO-8859-7'...
>
> Ποιο είναι το ζόρι; Πως θα δω τα ελληνικά όντας σε utf-8 τερματικό;
> Κόλλησα!

  Exeis ena arxeio se UTF-8. Ayto shmainei pos mporei na exei perissoteroys 
apo 256 diaforetikoys xaraktires mesa. 

  To iso8859-1 exei xaraktires megethoys enos byte. Oi xaraktires me tis times 
0-127 einai akribos oi idioi me toy iso8859-7 kai me toy UTF-8. Apo ekei kai 
pera yparxoyn diaforopoihseis.

  Skepsoy oti to arxeio soy mporei na exei: 
* Kapoioys xaraktires poy antistoixoyn stis times 0-127 ton ISO-8859-1 kai 
ISO-8859-7.
* Kapoioys xaraktires poy antistoixoyn stis times 128-255 toy ISO-8859-1.
* Kapoioys xaraktires poy antistoixoyn stis times 128-255 toy ISO-8859-7.

  Opote kai den mporei na metatrapei se 8859-1 h 8859-7 xoris na xathoyn 
xaraktires.

  Pera apo ta parapano, pithanotata to arxeio soy na'nai lathos ftiagmeno. Apo 
ayta poy les, to arxeio prepei na ftiaxtike os eksis: Anoigeis ena arxeio kai 
grafeis ellhnika me iso8859-7. Meta xrhsimopoieis to iconv kai dineis:

cat koko.txt | iconv -f iso8859-1 -t utf-8 > lala.txt

To iconv den mporei na ksexorisei an einai 8859-1 h 8859-7, opote kai to 
kanei. Sth synexeia exeis to arxeio soy.

Gia na to antistrepseis dokimase na kaneis:

cat lala.txt | iconv -f utf-8 -t iso8859-1 | \
  iconv -f iso8859-7 -t utf-8 > lala_utf8.txt

<<V13>>




More information about the Linux-greek-users mailing list