Re: Ελληνικό κείμενο σε latex: Σφάλμα στην αντιγραφή κειμένου από το παραγόμενο pdf.
Konstantinos Togias
ktogias at math.upatras.gr
Thu Aug 31 19:20:36 EEST 2006
On 8/31/06, No No <nono.231 at gmail.com> wrote:
> Από όσο το είχα ψάξει αυτή είναι η φυσιολογική συμπριφορά. Το κείμενο
> www.image.ece.ntua.gr/papers/409.pdf δεν είναι γραμμένο
> με Tex. Η διαφορά τους είναι τα fonts. Το κείμενο 409.pdf έχει truetype
> fonts, ενώ το test.pdf έχει type 3. Γιαυτό έχει και το δεύτερο έχει τόσο
> ωραία γραμματοσειρά. Άν μάλιστα βάλεις στο αρχείο Tex το "Ta teleuta'ia
> qr'onia 'eqei shmeiwje'i" θα σου δώσει στο dvi και στο pdf την φράση "Τα
> τελευταία χρόνια έχει σημειωθεί". Προφανώς είναι ο τρόπος που τα αποθηκεύει.
>
> 2006/8/31, Konstantinos Togias <ktogias at math.upatras.gr>:
> >
> Γεια σε όλους.
>
> Έχω συντάξει το αρχείο
> http://master.math.upatras.gr/~kit/test.tex το
> οποίο είναι σε utf8 κωδικοποίηση και περιέχει ελληνικό κείμενο.
>
> Με τη χρήση των
>
> \usepackage[english,greek]{babel}
> \usepackage{ucs}
> \usepackage[utf8]{inputenc}
> \selectlanguage{greek}
>
> η εντολή latex test.tex μου δίνει ένα (φαινομενικά τουλάχιστον) αψογο
> dvi που εμφανίζει μια χαρά τα ελληνικά:
> http://master.math.upatras.gr/~kit/test.dvi
>
> Τρέχοντας pdflatex test.tex παίρνω το
> http://master.math.upatras.gr/~kit/test.pdf .
> Το test.pdf ενώ εμφανίζεται και εκτυπώνεται μια χαρά με acroread και
> evince, παρουσιάζει την εξής ανωμαλία:
>
> Αν επιλέξω με το ποντίκι κάποιο κομμάτι κειμένου, το κάνω copy και
> paste σε ένα τερματικό ή στο gedit, αντί να πάρω Ελληνικούς
> χαρακτήρες, παίρνω αγγλικούς (κάτι σαν greeglish).
>
> Π.χ. Επιλέγοντας το από το pdf κείμενο
>
> "Τα τελευταία χρόνια έχει σημειωθεί"
>
> και κάνοντας paste στο gedit παίρνω
>
> "Ta teleutaÐa qrìnia èqei shmeiwjeÐ"
>
> Το σύστημά μου είναι ubuntu 6.06 με
>
> $ env | grep -i lan
> LANG=el_GR.UTF-8
> LANGUAGE=el_GR:el:en_GB:en
>
> $ pdflatex -v pdfeTeX 3.141592-1.21a-2.2 (Web2C 7.5.4)
> kpathsea version 3.5.4
>
> Με άλλα pdf που περιέχουν ελληνικό κείμενο, όπως πχ. το
> www.image.ece.ntua.gr/papers/409.pdf το copy-paste τόσο
> από acroread,
> όσο και από evince δίνει κανονικά ελληνικό κείμενο στο gedit. Επίσης
> στέλνοντας το test.pdf σε κάποιον με windows και acrobat reader μου
> ανέφερε την ίδια ακριβώς συμπεριφορά (μετατροπή σε αγγλικούς
> χαρακτήρες) όταν έκανε copy από το pdf και paste στο ms-word.
>
> Έχει κανείς καμιά ιδέα τι πάει στραβά ή τι κάνω εγώ λάθος και τα pdf
> που παράγω στο σύστημά μου έχουν αυτή την ιδιοτροπία;
>
> --
> Konstantinos Togias
> University Of Patras
> Dept. of Mathematics
>
>
> --
> linux-greek-users mailing list -- http://lists.hellug.gr
>
Έτσι όμως είναι αδύνατο να κάνει κάποιος search στο test.pdf ή να
εξάγει με κάποιο τρόπο το κείμενο. Επειδή έχω γράψει τη διπλωματική
μου με αυτό τον τρόπο, φοβάμαι μην μου την πούνε που δεν θα μπορούν
από το pdf που τους έστειλα να εξάγουν κείμενο ή να κάνουν ένα search
(και ακόμα χειρότερα μη μου πουν οτι το θέλουν σε κανένα .doc).
--
Konstantinos Togias
University Of Patras
Dept. of Mathematics
More information about the Linux-greek-users
mailing list