Ελληνικό κείμενο σε latex: Σφάλμα στην αντιγραφή κειμένου από το παραγόμενο pdf.

Konstantinos Togias ktogias at math.upatras.gr
Thu Aug 31 17:39:11 EEST 2006


Γεια σε όλους.

Έχω συντάξει το αρχείο http://master.math.upatras.gr/~kit/test.tex το
οποίο είναι σε utf8 κωδικοποίηση και περιέχει ελληνικό κείμενο.

Με τη χρήση των

\usepackage[english,greek]{babel}
\usepackage{ucs}
\usepackage[utf8]{inputenc}
\selectlanguage{greek}

η εντολή latex test.tex μου δίνει ένα (φαινομενικά τουλάχιστον) αψογο
dvi που εμφανίζει μια χαρά τα ελληνικά:
http://master.math.upatras.gr/~kit/test.dvi

Τρέχοντας pdflatex test.tex παίρνω το
http://master.math.upatras.gr/~kit/test.pdf .
Το test.pdf ενώ εμφανίζεται και εκτυπώνεται μια χαρά με acroread και
evince, παρουσιάζει την εξής ανωμαλία:

Αν επιλέξω με το ποντίκι κάποιο κομμάτι κειμένου, το κάνω copy και
paste σε ένα τερματικό ή στο gedit, αντί να πάρω Ελληνικούς
χαρακτήρες, παίρνω αγγλικούς (κάτι σαν greeglish).

Π.χ. Επιλέγοντας το από το pdf κείμενο

"Τα τελευταία χρόνια έχει σημειωθεί"

και κάνοντας paste στο gedit παίρνω

"Ta teleutaÐa qrìnia èqei shmeiwjeÐ"

Το σύστημά μου είναι ubuntu 6.06 με

$ env | grep -i lan
LANG=el_GR.UTF-8
LANGUAGE=el_GR:el:en_GB:en

$ pdflatex -v pdfeTeX 3.141592-1.21a-2.2 (Web2C 7.5.4)
kpathsea version 3.5.4

Με άλλα pdf που περιέχουν ελληνικό κείμενο, όπως πχ. το
www.image.ece.ntua.gr/papers/409.pdf  το copy-paste τόσο από acroread,
όσο και από evince δίνει κανονικά ελληνικό κείμενο στο gedit. Επίσης
στέλνοντας το test.pdf σε κάποιον με windows και acrobat reader μου
ανέφερε την ίδια ακριβώς συμπεριφορά (μετατροπή σε αγγλικούς
χαρακτήρες) όταν έκανε copy από το pdf και paste στο ms-word.

Έχει κανείς καμιά ιδέα τι πάει στραβά ή τι κάνω εγώ λάθος και τα pdf
που παράγω στο σύστημά μου έχουν αυτή την ιδιοτροπία;

-- 
Konstantinos Togias
University Of Patras
Dept. of Mathematics




More information about the Linux-greek-users mailing list