μετατροπή ελληνικού html σε text (=?iso-8859-7?b?9/3s4Q==?=)
Michael Iatrou
iatrou at serverhive.com
Tue Oct 3 16:53:46 EEST 2006
When the date was Tuesday 03 October 2006 12:21, Nick Demou wrote:
> με ένα bash script παρακολουθώ κάποιες ενδιαφέρουσες web σελίδες και
> όποτε υπάρχει αλλαγή με ενημερώνει.
> Αυτό παίζει αλλά θέλω να βλέπω και τι αλλαγή έγινε γιατί συχνά είναι
> σε χαζομάρες (π.χ. διαφημίσεις). Στα αγγλικά το παρακάτω παίζει μια
> χαρα
>
> wget -q -O tmp.html $URL
> sed -e 's#<[^>]*>##g' tmp.html | sed -e 's/\t/ /g' | sed -e 's/ */
> /g' | sed '/./!d' | uniq > $FILE.txt
> diff -u $FILE.txt $OLDFILE.txt
Δεν χρειάζεται να ξεκινήσεις 4 διαφορετικά sed processes, ειδικά τη στιγμή
που χρησιμοποιείς το `-e':
sed -e 's#<[^>]*>##g' -e 's/\t/ /g' sed -e 's/ */ /g' -e '/./!d'
tmp.html | uniq > $FILE.txt
--
++Michael Iatrou;
More information about the Linux-greek-users
mailing list