Αναζήτηση στα Ελληνικά: Google

Apollon Koutlides apollon at planewalk.net
Wed Dec 3 19:10:27 EET 2003


Panayiotis Christodoulou wrote:

>>  Επίσης, το να υλοποιηθεί η αναζήτηση όπως λέω είναι εξαιρετικά
>>εύκολο. Π.χ. οι τόνοι, δασείες κτλ. πετιούνται απλά μετατρέποντας το
>>κείμενο σε εκείνο το normalization form του unicode που δεν επιτρέπει
>>προκατασκευασμένους (precomposed) χαρακτήρες, και αγνοώντας τους
>>χαρακτήρες που προσθέτουν τον τόνο (combining characters). Μετά, μια
>>μετατροπή στα κεφαλαία λογικά κανονίζει και το τελικό σίγμα μαζί, ε
>>και αυτό ήταν. Παιχνιδάκι.
>>    
>>
(...)

>   Υποθέτω, λοιπόν, ότι η λύσι που προτείνεις θα δημιουργήσει σοβαρά 
>προβλήματα σε όσους κάνουν αναζητήσεις σε αρχαία κείμενα.
>
>  
>
Αυτό που -φυσιολογικά- θα έπρεπε να αναζητούμε είναι μία συμπεριφορά για 
τα ελληνικά αντίστοιχη με αυτή για τους λατινικούς χαρακτήρες. Αυτή 
είναι η εξής: Case-Insensitive, με προτεραιότητα στα exact matches. Αυτό 
λύνει τα προβλήματα όλων, νομίζω - ή όχι;

Απόλλων





More information about the Linux-greek-users mailing list