[I18NGR] Πρόβλημα με το αρχείο /home/kde/trunk/KDE/kdelibs/kdoctools/docbook/xsl/common/el.xml

Τα πάντα ρει ta_panta_rei at speedpost.net
Sun Nov 14 01:55:34 EET 2010


Dimitrios Glentadakis [13/11/2010]:
> Έλαβα αυτή την απάντηση αλλά δεν βγάζω άκρη. Δοκίμασα  αυτό που λέει αλλά
> παίρνω συνέχεια ιερογλυφικά (με οποιαδήποτε ρυθμιση κωδικοποίησης):

> >> i search how to do the inverse , from html to text , so i can see the
> >>> existing content of the file. Is there any tool ?
> >>>
> >>>
> >> Please, press "Change" once again.

> Because current entities are not valid entities for Greek letters:
> http://htmlhelp.com/reference/html40/entities/symbols.html
> Try to make the document (say, test.html) with the following content

> <html>
> <body>
> Ðåñßëçøç
> </body>
> </html>

> Open it in any browser and try to figure out the encoding. Hope this
> helps...

Πιθανόν να λείπει η κατάλληλη δήλωση κωδικοποίησης περιεχομένου
στον κώδικα HTML που δεν μπορείς να δεις το αρχείο στον
περιηγητή ιστοσελίδων σου.

Η προσθήκη της δήλωσης
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-7"/>
ή
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/>
πριν την ετικέτα <body> στο αρχείο HTML μπορεί να σε βοηθήσει να
δεις τι γράφει το αρχείο.

Για το δείγμα HTML που έλαβες ως απάντηση και περιέχει
χαρακτήρες δυτικοευρωπαϊκών γλωσσών που δεν περιλαμβάνονται στην
κωδικοποίηση ISO-8859-1, μπορείς παρόμοια να το διαβάσεις αν το
μετατρέψεις στο ακόλουθο:

<html>
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-5"/>
<body>
Ðåñßëçøç
</body>
</html>


Γενικώτερα μπορείς να εξάγεις τους χαρακτήρες που περιέχονται
σε αρχείο με κώδικα HTML χωρίς τη χρήση περιηγητή ιστοσελίδων με
το ακόλουθο φίλτρο:

# από ειδικούς χαρακτήρες HTML σε Unicode (UTF-8)
ascii2uni -a D <hmtl_file >text_file 

Φυσικά υπάρχει διαθέσιμο και το αντίστροφο φίλτρο:

# από Unicode (UTF-8) σε ειδικούς χαρακτήρες HTML
uni2ascii -a D <text_file >html_file 



More information about the I18ngr mailing list