Σχετικά με ελληνικό εννοιολογικό λεξικό

Christos Ricudis ricudis at komodino.itc.auth.gr
Tue Mar 7 11:00:15 EET 2006


Raoul wrote:
> 2) Υπάρχει άλλος τρόπος, εκτός από regular expressions, να επεξεργάζεται
> κανείς html code? Ένα απλό παράδειγμα: έστω ότι ένα string περιέχει τον
> κώδικα μιας ιστοσελίδας. Υπάρχει τρόπος να σβήσουμε όλα τα tags? ή να
> κρατήσουμε μόνο τον κώδικα ενός στοιχείου της σελίδας, το οποίο έχει id
> πχ form1? Μήπως η ερώτηση είναι εντελώς λάθος?
To "allos tropos ektos apo regular expressions" einai ontws entelws 
la8os. To HTML (gia na ginw pio genikos : XML) markup DEN akolou8ei 
regular grammar, alla context-free grammar.

Se mia regular grammar exeis kanones paragwghs tou eidous :

A -> b*C

h

A -> Cb*

opou A kai C non-terminals, kai b terminal.

Se mia context-free grammar exeis kanones paragwghs tou eidous :

A -> union ( bs Cs )*

opoy A terminal, kai bs, Cs peperasmena synola apo non-terminals kai 
terminals antistoixa.

H diafora poy prokyptei einai oti stis context-free grammars mporeis na 
ekfraseis recursively enumerable expressions, enw stis regular languages 
oxi. Gia na kaneis parse XML (HTML) xreiazesai ena pushdown automaton.

XML kai HTML parsers 8a breis pollous, se o,ti glwssa sxedon 8eleis. 
Kapou eida oti xrhsimopoieis python, opote arnoumai na se boh8hsw 
perissotero :P

-- 
Christos Ricudis				ricudis at itc.auth.gr
Systems Administrator				+30-2310-998656
IT Support Center
Aristotle University of Thessaloniki, GREECE




More information about the Linux-greek-users mailing list