Ελληνικό κείμενο σε latex: Σφάλμα στην αντιγραφή κειμένου από το παραγόμενο pdf.
Konstantinos Togias
ktogias at math.upatras.gr
Thu Aug 31 17:39:11 EEST 2006
Γεια σε όλους.
Έχω συντάξει το αρχείο http://master.math.upatras.gr/~kit/test.tex το
οποίο είναι σε utf8 κωδικοποίηση και περιέχει ελληνικό κείμενο.
Με τη χρήση των
\usepackage[english,greek]{babel}
\usepackage{ucs}
\usepackage[utf8]{inputenc}
\selectlanguage{greek}
η εντολή latex test.tex μου δίνει ένα (φαινομενικά τουλάχιστον) αψογο
dvi που εμφανίζει μια χαρά τα ελληνικά:
http://master.math.upatras.gr/~kit/test.dvi
Τρέχοντας pdflatex test.tex παίρνω το
http://master.math.upatras.gr/~kit/test.pdf .
Το test.pdf ενώ εμφανίζεται και εκτυπώνεται μια χαρά με acroread και
evince, παρουσιάζει την εξής ανωμαλία:
Αν επιλέξω με το ποντίκι κάποιο κομμάτι κειμένου, το κάνω copy και
paste σε ένα τερματικό ή στο gedit, αντί να πάρω Ελληνικούς
χαρακτήρες, παίρνω αγγλικούς (κάτι σαν greeglish).
Π.χ. Επιλέγοντας το από το pdf κείμενο
"Τα τελευταία χρόνια έχει σημειωθεί"
και κάνοντας paste στο gedit παίρνω
"Ta teleutaÐa qrìnia èqei shmeiwjeÐ"
Το σύστημά μου είναι ubuntu 6.06 με
$ env | grep -i lan
LANG=el_GR.UTF-8
LANGUAGE=el_GR:el:en_GB:en
$ pdflatex -v pdfeTeX 3.141592-1.21a-2.2 (Web2C 7.5.4)
kpathsea version 3.5.4
Με άλλα pdf που περιέχουν ελληνικό κείμενο, όπως πχ. το
www.image.ece.ntua.gr/papers/409.pdf το copy-paste τόσο από acroread,
όσο και από evince δίνει κανονικά ελληνικό κείμενο στο gedit. Επίσης
στέλνοντας το test.pdf σε κάποιον με windows και acrobat reader μου
ανέφερε την ίδια ακριβώς συμπεριφορά (μετατροπή σε αγγλικούς
χαρακτήρες) όταν έκανε copy από το pdf και paste στο ms-word.
Έχει κανείς καμιά ιδέα τι πάει στραβά ή τι κάνω εγώ λάθος και τα pdf
που παράγω στο σύστημά μου έχουν αυτή την ιδιοτροπία;
--
Konstantinos Togias
University Of Patras
Dept. of Mathematics
More information about the Linux-greek-users
mailing list