Re: μετατροπή ελληνικού html σε text (χύμα)
Nick Demou
ndemou at gmail.com
Tue Oct 3 17:25:21 EEST 2006
Την 3/10/2006, Michael Iatrou <iatrou at serverhive.com> έγραψε:
> When the date was Tuesday 03 October 2006 12:21, Nick Demou wrote:
>
> > [...]
> >
> > wget -q -O tmp.html $URL
> > sed -e 's#<[^>]*>##g' tmp.html | sed -e 's/\t/ /g' | sed -e 's/ */
> > /g' | sed '/./!d' | uniq > $FILE.txt
> > diff -u $FILE.txt $OLDFILE.txt
>
> Δεν χρειάζεται να ξεκινήσεις 4 διαφορετικά sed processes, ειδικά τη στιγμή
> που χρησιμοποιείς το `-e':
>
> sed -e 's#<[^>]*>##g' -e 's/\t/ /g' sed -e 's/ */ /g' -e '/./!d'
> tmp.html | uniq > $FILE.txt
>
ευχαριστώ για το tip Μηχάλη
More information about the Linux-greek-users
mailing list