Αναζήτηση στα Ελληνικά: Google

Vasilis Vasaitis vvas at hal.csd.auth.gr
Tue Dec 2 02:22:58 EET 2003


On Mon, Dec 01, 2003 at 10:41:26PM +0200, Panayiotis Christodoulou wrote:
> Στις Δευ 01 Δεκ 2003 20:04, ο Giannis Stoilis έγραψε:
> > Lefteris Dimitroulakis wrote:
> > > Διαφωνώ με τον ορισμός σου της «βελτίωσης». Ήδη σε προηγούμενο
> > > μήνυμα έχεις αναφέρει ότι:
> > > «Δυστηχώς, αν το google δεν μας δώσει την δυνατότητα αναζήτησης με
> > > επιλογή, τότε μάλλον μαζί με τα ξερά, θα καούν και τα χλωρά...»
> > > Αυτό που εδώ μπορεί να θεωρούμε «ξερό» άλλοι ίσως
> > > το θεωρούν χλωρότατο!
> >
> > Ωραία λοιπον, ίσως να μην είμαι και το καταλληλότερο άτομο να εκφέρω
> > γνώμη για τα αρχαία ελληνικά. Ας μιλήσουν και οι υπόλοιποι...
> 
>    Αν οι αλλαγές που προτείνονται δεν θα επιτρέπουν στους Έλληνες ή και 
> ξένους χρήστες τού Ίντερνετ να κάνουν αναζήτησι μέσω της *ελληνικής* 
> σελίδας τού «Google» σε άλλες μορφές τής *ελληνικής* παρά μόνο σε μία, 
> τότε αυτό προσωπικά το θεωρώ απαράδεκτο.
> 
>    Επίσης πρέπει να σημειώσω ότι η αναζήτησι με πολυτονικό σύστημα αφορά 
> και άλλα κείμενα εκτός των αρχαίων, αν και τα τελευταία είναι φυσικά τα 
> σημαντικότερα στην συγκεκριμένη περίπτωσι.
> 
>    Τέλος, πιστεύω ότι είσαι κατάλληλος να εκφέρης γνώμη για τα αρχαία 
> ελληνικά αφού είσαι Έλληνας. Απλώς, ίσως, δεν θεωρείς ιδιαίτερα 
> σημαντικό για τους Έλληνες να κάνουν αναζητήσεις σε αυτήν την μορφή τής 
> γλώσσας τους.

  Αφού όλοι μπήκαν στον κόπο να αναφέρουν τη γνώμη τους επί του
θέματος, ας αναφέρω κι εγώ τη δική μου...

  IMHO, το καλύτερο που έχει να γίνει είναι μια γενικότερη ενοποίηση:
ενοποίηση των κεφαλαίων με τα πεζά (case-insensitive), ενοποίηση του
σίγμα τελικού με το κανονικό, ενοποίηση των τονούμενων με τα μη
τονούμενα, τόσο στα μονοτονικά όσο και στα πολυτονικά. Είναι πολύ πιο
σημαντικό να μπορεί κάποιος να βρει πράγματα ανεξάρτητα με το πώς
ακριβώς γράφτηκαν, παρά να κάνουμε τη ζωή μας δύσκολη για να
εξυπηρετούνται μερικές παθολογικές περιπτώσεις (τα δέκα ζευγάρια
λέξεων που διαφέρουν μόνο στον τόνο, το να ψάχνω συγκεκριμένη
ανορθογραφία, κτλ.).

  Επίσης, το να υλοποιηθεί η αναζήτηση όπως λέω είναι εξαιρετικά
εύκολο. Π.χ. οι τόνοι, δασείες κτλ. πετιούνται απλά μετατρέποντας το
κείμενο σε εκείνο το normalization form του unicode που δεν επιτρέπει
προκατασκευασμένους (precomposed) χαρακτήρες, και αγνοώντας τους
χαρακτήρες που προσθέτουν τον τόνο (combining characters). Μετά, μια
μετατροπή στα κεφαλαία λογικά κανονίζει και το τελικό σίγμα μαζί, ε
και αυτό ήταν. Παιχνιδάκι.

-- 
Vasilis Vasaitis
vvas at hal.csd.auth.gr
+306976604701





More information about the Linux-greek-users mailing list