Re: bug στην tr???
Nick Demou
ndemou at gmail.com
Tue May 12 11:03:54 EEST 2009
Δεν ξέρω πως ξέχασα να πατήσω sent στο παρακάτω -- το βρήκα σήμερα στα
drafts οπότε το στέλνω κι ας είναι (πολύ αργά). Η κεντρική ιδέα για να
μη σας κουράζω είναι "ευχαριστώ Αλέξανδρε έχεις απόλυτο δίκιο -- έκανα
τότε bug report για το documentation του tr που δεν αναφέρει κάτι
εμφανώς και πριν λίγες μέρες έστειλα κι ένα patch)
2009/2/4 Αλέξανδρος Διαμαντίδης <adia at hellug.gr>:
> Τα αποτελέσματα που παίρνεις οφείλονται στο ότι το tr δεν ξέρει
> από χαρακτήρες και ουσιαστικά δουλεύει με bytes. Δεδομένου ότι οι ελληνικοί
> χαρακτήρες σε UTF-8 είναι 2 bytes ο καθένας, απλώς είναι θέμα σύμπτωσης
> ότι παρατήρησες το πρόβλημα μόνο με το "ό".
ευχαριστώ για τις εξηγήσεις Αλέξανδρε. Έχεις βέβαια απόλυτο δίκιο
παρόλο που δεν μπορούσα να το φανταστώ:
Το κακό είναι ότι το man page της tr όχι μόνο δεν αναφέρει τίποτα αλλά
ακόμα χειρότερα περιέχει την εξής διατύπωση (όπου δυστυχώς
χρησιμοποιούν το διφορούμενο character αντί για το ξεκάθαρο byte ή
ASCII character):
#
# NAME
# tr - translate or delete characters
# DESCRIPTION
# Translate, squeeze, and/or delete characters from standard
input, writing to standard output.
#
επιπλέον ούτε στο στο documentation ούτε στο faq των coreutils υπάρχει
ουσιαστική αναφορά σε utf8 και unicode (και μια δυο σύντομες αναφορές
αφορούν σε σημεία που υποστηρίζεται utf-8).
Συνεπώς είναι προφανώς missing feature στα coreutils και bug στο
documentation :(
ΥΓ: Μετά απο πολύ αναζήτηση βρήκα και αυτό το απογοητευτικό σχόλιο
στην wikipedia:
#
# Unfortunately, even the latest forthcoming coreutils version 7.0
does not support transformation on multibyte encodings, such as UTF-8.
#
θα προσπαθήσω να κάνω submit ένα patch για το documentation (μιας και
δεν μπορώ να στείλω patch για utf support :)
--
"The software is licensed, not sold" -- MICROSOFT LICENSE TERMS
More information about the Linux-greek-users
mailing list