[Open-source] Need a little debuging and hits...

Nick Kossifidis mickflemm at gmail.com
Tue Feb 15 17:22:15 EET 2011


Στις 25 Ιανουαρίου 2011 3:06 μ.μ., ο χρήστης Apollon Oikonomopoulos
<apollon at noc.grnet.gr> έγραψε:
> On 12:08 Tue 25 Jan     , Giorgos Keramidas wrote:
>> On Mon, 24 Jan 2011 22:06:10 +0200, Nick Kossifidis <mickflemm at gmail.com> wrote:
>> > Στις 24 Ιανουαρίου 2011 10:41 π.μ., ο χρήστης Panagiotis Astithas
>> > <pastith at gmail.com> έγραψε:
>> >>
>> >> Αν ψάχνεις για URL regexp, δε νομίζω να βρεις καλύτερο από αυτό:
>> >> http://daringfireball.net/2010/07/improved_regex_for_matching_urls
>> >
>> > Και όμως έχει αρκετά προβλήματα το συγκεκριμένο...
>> >
>> > α) [a-z][\w-]+: -> asdfasdfasdfasdfasdfasd: εγώ θέλω μόνο http: ή https:
>> > β) /{1,3} -> Δε με ενδιαφέρει το file:/// πχ.
>> > γ) www\d{0,3}[.]  -> κανένα νόημα :P
>> > δ) [a-z0-9.\-]+[.][a-z]{2,4}/ -> asdfa--asd..--..adsfa.<κάτι από 2 εώς
>> > 4 γράμματα>/ δε μου πολυμοιάζει με domain name :P
>>
>> Επίσης το '-' δεν είναι valid domain-name character.  Παίζει, μεν, σε
>> ορισμένες περιπτώσεις, αλλά έχει και ένα σωρό προβλήματα σε άλλες.
>>
>
> Το '-' *είναι* valid domain-name character (βλ. RFC 1034), αρκεί να μη
> βρίσκεται στην άκρη του ονόματος (επίσης χρησιμοποιείται και από το IDN,
> το οποίο «παράγει» έγκυρα ονόματα χώρου από unicode strings). Αυτό που
> είναι πιο περίεργο είναι το underscore, το οποίο χρησιμοποιείται μεν σε
> SRV records, όχι όμως σε κοινά hostnames.
>
>>

Αλήθεια με τα unicode domain names τι κάνουμε ? Πώς τα πιάνουμε με regexp ?

-- 
GPG ID: 0xD21DB2DB
As you read this post global entropy rises. Have Fun ;-)
Nick



More information about the Hellug mailing list