Σχετικά με ελληνικό εννοιολογικό λεξικό
Christos Ricudis
ricudis at komodino.itc.auth.gr
Tue Mar 7 11:00:15 EET 2006
Raoul wrote:
> 2) Υπάρχει άλλος τρόπος, εκτός από regular expressions, να επεξεργάζεται
> κανείς html code? Ένα απλό παράδειγμα: έστω ότι ένα string περιέχει τον
> κώδικα μιας ιστοσελίδας. Υπάρχει τρόπος να σβήσουμε όλα τα tags? ή να
> κρατήσουμε μόνο τον κώδικα ενός στοιχείου της σελίδας, το οποίο έχει id
> πχ form1? Μήπως η ερώτηση είναι εντελώς λάθος?
To "allos tropos ektos apo regular expressions" einai ontws entelws
la8os. To HTML (gia na ginw pio genikos : XML) markup DEN akolou8ei
regular grammar, alla context-free grammar.
Se mia regular grammar exeis kanones paragwghs tou eidous :
A -> b*C
h
A -> Cb*
opou A kai C non-terminals, kai b terminal.
Se mia context-free grammar exeis kanones paragwghs tou eidous :
A -> union ( bs Cs )*
opoy A terminal, kai bs, Cs peperasmena synola apo non-terminals kai
terminals antistoixa.
H diafora poy prokyptei einai oti stis context-free grammars mporeis na
ekfraseis recursively enumerable expressions, enw stis regular languages
oxi. Gia na kaneis parse XML (HTML) xreiazesai ena pushdown automaton.
XML kai HTML parsers 8a breis pollous, se o,ti glwssa sxedon 8eleis.
Kapou eida oti xrhsimopoieis python, opote arnoumai na se boh8hsw
perissotero :P
--
Christos Ricudis ricudis at itc.auth.gr
Systems Administrator +30-2310-998656
IT Support Center
Aristotle University of Thessaloniki, GREECE
More information about the Linux-greek-users
mailing list