μετατροπή ελληνικού html σε text (=?iso-8859-7?b?9/3s4Q==?=)

Michael Iatrou iatrou at serverhive.com
Tue Oct 3 16:53:46 EEST 2006


When the date was Tuesday 03 October 2006 12:21, Nick Demou wrote:

> με ένα bash script παρακολουθώ κάποιες ενδιαφέρουσες web σελίδες και
> όποτε υπάρχει αλλαγή με ενημερώνει.
> Αυτό παίζει αλλά θέλω να βλέπω και τι αλλαγή έγινε γιατί συχνά είναι
> σε χαζομάρες (π.χ. διαφημίσεις). Στα αγγλικά το παρακάτω παίζει μια
> χαρα
>
> wget -q -O tmp.html  $URL
> sed -e 's#<[^>]*>##g' tmp.html | sed -e 's/\t/ /g' | sed -e 's/  */
> /g' | sed '/./!d' | uniq > $FILE.txt
> diff -u $FILE.txt $OLDFILE.txt

Δεν χρειάζεται να ξεκινήσεις 4 διαφορετικά sed processes, ειδικά τη στιγμή 
που χρησιμοποιείς το `-e':

sed -e 's#<[^>]*>##g' -e 's/\t/ /g' sed -e 's/  */  /g' -e '/./!d' 
tmp.html | uniq > $FILE.txt

-- 
++Michael Iatrou;




More information about the Linux-greek-users mailing list