Re: μετατροπή ελληνικού html σε text (χύμα)

Nick Demou ndemou at gmail.com
Tue Oct 3 17:25:21 EEST 2006


Την 3/10/2006, Michael Iatrou <iatrou at serverhive.com> έγραψε:
> When the date was Tuesday 03 October 2006 12:21, Nick Demou wrote:
>
> > [...]
> >
> > wget -q -O tmp.html  $URL
> > sed -e 's#<[^>]*>##g' tmp.html | sed -e 's/\t/ /g' | sed -e 's/  */
> > /g' | sed '/./!d' | uniq > $FILE.txt
> > diff -u $FILE.txt $OLDFILE.txt
>
> Δεν χρειάζεται να ξεκινήσεις 4 διαφορετικά sed processes, ειδικά τη στιγμή
> που χρησιμοποιείς το `-e':
>
> sed -e 's#<[^>]*>##g' -e 's/\t/ /g' sed -e 's/  */  /g' -e '/./!d'
> tmp.html | uniq > $FILE.txt
>
ευχαριστώ για το tip Μηχάλη




More information about the Linux-greek-users mailing list