Αναζήτηση στα Ελληνικά: Google

evris evris at source.gr
Wed Nov 26 15:16:29 EET 2003


Giannis Stoilis wrote:

> Dimitris Stasinopoulos wrote:
>> Υπάρχει η εξής υπεραπλουστευμένη λογική διαδικασία:
>> 
>> 1) Παίρνω το "σύνολο" των λέξεων (Λίστα 1)
>> 2) Τους βγάζω τους τόνους (Λίστα 2)
>> 3) Τις συγκρίνω μεταξύ τους.
>> 4) Αν υπάρχουν λέξεις ίδιες στην Λιστα 2, τότε αυτές μπαίνουν στην Λίστα
>> 3, με τη μορφή που ήταν στη Λίστα 1.
>> 5) Όποτε κάνεις search στο Google, αυτό θα ψάχνει tone insensitive (strip
>> tones), εκτός από τις λέξεις που υπάρχουν στη Λίστα 3.
>> 
>> Τα βήματα 1-4 γίνονται μια και καλή, ενώ το 5 σε κάθε search. Θέλει
>> φυσικά πολύ ψάξιμο αν είναι efficient η διαδικασία.
> 
> Βασικά, εγώ αναρωτήθηκα κατά πόσο είναι δυνατόν να χρησιμοποιήσουμε κάτι
> ήδη έτοιμο. Υπάρχει άραγε κάποιος έτοιμος ψαγμένος αλγόριθμος που να
> αναγνωρίζει και να υποστηρίζει σωστά τα ελληνικά;
> Αν δώσουμε μια λύση που που χειροτερεύει τα πράγματα, και εμείς θα
> γίνουμε ρόμπα, και θα μας κλείσει του Google την πόρτα.
> 
> - Γιάννης Στοίλης



koitakse, aneksartita me tous tonous kai pos afto paizei me to google, pou
ante pes ekei telika (tha) ginetai to zitima ton ellinikon einai akoma pio
anomalo sti geniki tou periptosi akoma kai ektos google. 

einai kai oi anorthografies: ksereis oti prepei na akoustei "afksomiosi",
alla den ksereis na to grapseis sosta sto search, affxomeiossy klp. parola
afta afto pou eipes  einai afto pou theleis (soundlike). me i xoris tonous,
me i xoris sosti orthografia, me i xoris caps. (fysika παιδάκια και
παϊδάκια kai loipes asafies paramenoun)... isos mesa apo soundlike kanones
i me xrisi tou aspell klp na sou proteinei i na sou diorthonei i na psaxnei
telika kai to sosto...

alla yparxoun kai simantikotera probs: pes oti zitas selides pou periexoun
"liwnw" akoma kai sto diko sou to idio to site. diladi an mia selida exei
liwsame den sou kanei? liwmenh? liwste? tha mou peis boro na psakso kati
san liw* kai na ta eferne. to eliwsa, eliwna klp? ti na psaksei? 
*liw* ?
na ginei o xamos stis asxetosines pou tha epistrepei? ase pou polla allazoun
entelos kai riza (eimai, eisai,...).  

emeis dokimazoume kati diko mas se afto ton tomea, gia idioxrisi sto
gourmet.gr kai fainetai na psilodoulevei oso kairo to exoume kai to
testaroume.

i idea einai i eksis. afto to pragma borei (tha||na) klinei klita meri logou
(trexo, trexeis, trexei, trexontas, ...,, kalos, kalou, kali, kreas,
kreatos, kreata...), na limatopoiei (stoseis -> strono, strosh) na
anagnorizei ti typou, meros logou, ptosi klp einai kati, na paragei
ipokoristika, parathetika epitheton, metoxes klp. 

episis kali idea einai kai to pantrema me thisavro oron: diladi an psaxneis
gia mpampa kai se mia selida exei pateroulides logika tha  itheles na sto
epistrepsei. xamenos kai ittimenos klp...(sinonima, antitheta, ...)

etsi tha borouses mexri kai na entopiseis spam i na kaneis moderate forums
kathoti oi apagorevmenes lekseis tha entopistoun aneksartita apo tin
ptosi/klisi/arithmo/prosopo klp...

se afto to pramga the itheles kapoio configuration kathoti to na psaxneis
gia "zesto kafe" kai na kinigisei ston idio vathmo tin oikogeneia tou
zestos (zestoi, zesths, zestous...zestoulhs, thermos, thermh klp) kai to
kafes (kafedes, kafedakos) pithanos na odigei se anisovareis anazitiseis
pou to zestos evnoite eis varos tou kafe kai gyranei "zesto fai". an omos
sto config tou les na min anaptysei toso ta epitheta (afou boreis kai
ksereis ti meros tou logou einai) tote kati ginetai. borei episis na min
theleis na kinigas to rima se oles tou tis morfes alla mono sta b' eniko,
b'plith giati to content sto opoio efarmozeis to search se odigei etsi (px
sto gourmet.gr pou exei sintages ta rimata sinantontai se sigkekrimenous
tipous: tiganiste, tiganizoume, tiganise... ta alla mallon vavoura kai
thorivo prokaloun para voithan.

episis afou etsi boreis na ksereis ti einai ousiastiko kai ti oxi, exeis kai
ena tropo na parageis eite aftomata keywords apo mia selida eite aftomati
perilipsi (kata mia ennoia) eite na katigoriopoieis selides pou den ksereis
ti diaolo lene. 
px an i selida leei: piga me tous filous mou gia psarema sto potami ->
ousiastika only -> paragei META KEYWORDS (i katigories i perilipsi selidas:
filos psarema potami 


e, emeis ftiaksame afto to pragma se pilot morfi, to valame metaksi tou
xristi kai tou mnogo na dexetai to user input, na to emploutizei kata to
config file mas kai na to dinei sto mnogosearch.

http://www.gourmet.gr/mnogosearch.php

kai psakse gia 
αρνιών
πατατούλες
gia na deis ena demo pou pano kato deixnei ta parapano me ta sinonima,
ptoseis, kliseis, klp....

arxika pantos gia allo pragma ksekinise, pros checking typon: i kalos
gatous, ego trexeis, gia emploutismo tou aspell, gia entopismo allagis
yfous se keimena kai tetoia, alla oi dinatotites fainetai na einai
aperioristes, analoga me tis idees tou kathenos... tsekare an ekpempoume
sto mikos kimatos pou thes kai pes mas...




More information about the Linux-greek-users mailing list