Regular Expression um Links / URLs zu matchen

Folgende Regex matcht aus einem Text die erste URL die vorkommt:

https?://([-\w\.]+)+(:\d+)?(/([\w/_\.]*(\?\S+)?)?)?

Programmiersprachenfreundlich schon \ escaped:

https?://([-\\w\\.]+)+(:\\d+)?(/([\\w/_\\.]*(\\?\\S+)?)?)?

(via)

2 Gedanken zu „Regular Expression um Links / URLs zu matchen“

  1. Das zweite + ist überflüssig. Außerdem bekommst Du Probleme, wenn eine Domain Umlaute enthält, was ja inzwischen möglich ist. Die Regex müsste wie folgt aussehen 🙂

    https?://([-\w\.áàăâåäãąāæćĉčċçďđéèĕêěëėęēğĝġģĥħíìĭîïĩįīıĵķĺľļłńňñņŋóòŏôöőõøōœĸŕřŗśŝšşťţŧúùŭûůüűũųūŵýŷÿźžżðþ]+)(:\d+)?(/([\w/_\.]*(\?\S+)?)?)?

Schreibe einen Kommentar