[I18NGR] Πρόβλημα με το αρχείο /home/kde/trunk/KDE/kdelibs/kdoctools/docbook/xsl/common/el.xml

Dimitrios Glentadakis dglent at gmail.com
Sun Nov 14 09:17:34 EET 2010


2010/11/14, Τα πάντα ρει <ta_panta_rei at speedpost.net>:
> Dimitrios Glentadakis [13/11/2010]:
>> Έλαβα αυτή την απάντηση αλλά δεν βγάζω άκρη. Δοκίμασα  αυτό που λέει αλλά
>> παίρνω συνέχεια ιερογλυφικά (με οποιαδήποτε ρυθμιση κωδικοποίησης):
>
>> >> i search how to do the inverse , from html to text , so i can see the
>> >>> existing content of the file. Is there any tool ?
>> >>>
>> >>>
>> >> Please, press "Change" once again.
>
>> Because current entities are not valid entities for Greek letters:
>> http://htmlhelp.com/reference/html40/entities/symbols.html
>> Try to make the document (say, test.html) with the following content
>
>> <html>
>> <body>
>> Ðåñßëçøç
>> </body>
>> </html>
>
>> Open it in any browser and try to figure out the encoding. Hope this
>> helps...
>
> Πιθανόν να λείπει η κατάλληλη δήλωση κωδικοποίησης περιεχομένου
> στον κώδικα HTML που δεν μπορείς να δεις το αρχείο στον
> περιηγητή ιστοσελίδων σου.
>
> Η προσθήκη της δήλωσης
> <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-7"/>
> ή
> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/>
> πριν την ετικέτα <body> στο αρχείο HTML μπορεί να σε βοηθήσει να
> δεις τι γράφει το αρχείο.
>
> Για το δείγμα HTML που έλαβες ως απάντηση και περιέχει
> χαρακτήρες δυτικοευρωπαϊκών γλωσσών που δεν περιλαμβάνονται στην
> κωδικοποίηση ISO-8859-1, μπορείς παρόμοια να το διαβάσεις αν το
> μετατρέψεις στο ακόλουθο:
>
> <html>
> <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-5"/>
> <body>
> Ðåñßëçøç
> </body>
> </html>
>
>
> Γενικώτερα μπορείς να εξάγεις τους χαρακτήρες που περιέχονται
> σε αρχείο με κώδικα HTML χωρίς τη χρήση περιηγητή ιστοσελίδων με
> το ακόλουθο φίλτρο:
>
> # από ειδικούς χαρακτήρες HTML σε Unicode (UTF-8)
> ascii2uni -a D <hmtl_file >text_file
>
> Φυσικά υπάρχει διαθέσιμο και το αντίστροφο φίλτρο:
>
> # από Unicode (UTF-8) σε ειδικούς χαρακτήρες HTML
> uni2ascii -a D <text_file >html_file
>
>

Δοκιμασα και τα δύο και όποια κωδικοποίηση και να βάλω έχω πάντα το
ίδιο αποτέλεσμα:

Ðåñßëçøç

Ίσως το υπόλοιπο αρχείο να μην είναι στα ελληνικά ή να έχει
κωδικοποιηθεί λάθος αφού δεν βρίσκω αυτά τα νούμερα εδώ:

http://htmlhelp.com/reference/html40/entities/symbols.html

Οι ελληνικοί χαρακτήρες ξεκινάν από το Α



--
Δημήτριος Γλενταδάκης


More information about the I18ngr mailing list