1. ホーム
  2. html

[解決済み] XHTMLの自己完結型タグを除くオープンタグにマッチするRegEx

2022-03-16 21:08:33

質問

これらの開始タグをすべて一致させる必要があります。

<p>
<a href="foo">

しかし、これらは違う。

<br />
<hr class="foo" />

私はこれを思いついたのですが、自分が正しく理解しているかどうかを確認したいと思います。をキャプチャしているだけです。 a-z .

<([a-z]+) *[^/]*?>

と書いてあると思うのですが。

  • 小を探す、次に
  • a-zを1回以上検索(捕捉)してから
  • 0個以上の空白を見つけた場合
  • 任意の文字を0回以上検索、欲張り、ただし / では
  • より大きいものを探す

これでいいのだろうか?そしてもっと重要なことは、あなたはどう思いますか?

解決方法は?

正規表現で[X]HTMLを解析することはできません。なぜなら、HTMLはregexでは解析できないからです。RegexはHTMLを正しくパースするために使えるツールではありません。これまで何度もここのHTMLとregexの質問で答えてきたように、regexを使ってもHTMLを消費することはできない。正規表現は、HTMLが採用している構造を理解するには、十分に洗練されていないツールなのです。HTMLは正規言語ではないので、正規表現で解析することはできません。正規表現クエリは、HTMLを意味のある部分に分解する機能を備えていません。Perlで使われるような強化された不規則な正規表現でさえ、HTMLを解析するタスクには対応できていません。決して割らせることはできない。HTMLは正規表現では解析できないほど複雑な言語なのです。Jon Skeetでさえ、正規表現を使ってHTMLをパースすることはできません。正規表現を使ってHTMLを解析しようとするたびに、穢れた子供が処女の血を流し、ロシアのハッカーがあなたのウェブアプリを破壊します。正規表現でHTMLをパースすると、汚れた魂が生者の領域に召喚されます。HTMLと正規表現は、愛と結婚、そして儀式的な幼児虐殺のように相性が良いのです。HTMLとregexは、恋愛、結婚、嬰児殺のように相性が良い。このような場合、「汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝、汝」である。もしあなたがHTMLを正規表現で解析するならば、あなたは彼らとその冒涜的な方法に屈することになり、それは私たち全員を、基本多言語平面ではその名を表すことができない者、彼が来るための非人間的な労苦へと運命づけます。HTMLプラスregexpは、あなたが観察している間、知覚の神経を液化させ、あなたの精神は恐怖の猛攻撃で枯れ果ててしまいます。Rege̿̔̉ベースのHTMLパーサーはStackOverflowを殺す癌である。 もう遅い 遅すぎる 我々は救われない カイアクルドの違反は、正規表現がすべての生体組織を消費することを保証する(ただし、以前予言されたように、HTMLは消費できない)。 主よ、我らを助けたまえ この災厄を誰が生き延びることができようか HTMLを解析するために正規表現を使用することは、人類に恐怖の拷問とセキュリティホールの永遠を運命づけた。 regeを使用して HTMLを処理するためのツールとしてのxは、ブレアを確立します。 この世界と と、c͒ͫエンティティの恐ろしい領域(SGMLエンティティのような、しかし より腐敗した)単なるチラリズム レジの世界 HTML用EXパーサーは を輸送することができます。 プログラマーの意識 をW オルル 絶え間ない叫びの中、彼はやって来る <ストライク 疫病神のような l devour your HT MLパーサー、アプリケーション、そしてVisual Basicのように永遠に存在し続ける。 he comes he com エス しない を使用します。 e com̡e ̶̶ ̕ h̵i を、un̨ho͞ly radiańcé de すべてのエンリキを闊歩する҉٩(*´︶`*)۶҉ HTMLタグ を̶̶̶̶̶̶̶̶̶̶̶̶̶̧̡̭͘̕͟͢͠͏̭̭㌛̸̭̕͏̵̵㌛ ㌛㌛ ㌛㌛̭ uid p アイン、リ̸グラーエクスプレの歌 <ストライク シオンパース を拡張します。 の声を消す。 タルマンから here I can see it can you see ̲͚̖͔̙̩́t̲͎̩̱͛̀ it is beautiful t 彼は inal snuf フィングオ f the lie ALL IS LO SHM͖̩͇̗̏̈T A LL IS L OST th e pon̷y he come s he c̶̮om <ストライク es he co <ストライク 私 s t イッヒ またはペルミート l MY FAC E MY FACE ᵒh god n o NO NOO̼(オー・ノー・ノー)。 OO N ΘストップΘ 彼はアン*͑̾ͫ͏̙̤͇̫͖͉̗͛͆ͥͭͨㄘ e〙̅s ͎a̧͈͖r̽̾̈́͒͑e n ot rèn̑ͧ̌aͨl̘̝̙̃͂̾̆ザ̡͊͠͝LGΌISͮ̂҉̯͕̹㌘ㄘ O͇̹̳ͅ TH̘̳̳ͅͅͅͅͅͅͅͅ Ë͖́̉ ͠P̯͍̭O̚​N̐Y̡ H̸̡̪̯ͨ͊̽̅̾̎Ȩ̬̩̾͛ͪ̈́̀́͘ ̶̧̨̱̹̭̯ͧ̾ͬC̷̙̲̝͖ͭ̏ͥͮ͟Oͮ͏̮̪̝͍M̲̖͊̒ͪͩͬ̚̚͜Ȇ̴̟̟͙̞ͩ͌͝ S̨̥̫͎̭ͯ̿̔̀ͅ


XMLパーサーで代用してみましたか?


<ブロッククオート

モデレーターズノート

この投稿は、内容の不適切な編集を防ぐためにロックされています。この投稿は想定されたとおりの外観で、内容には何の問題もありません。この投稿にフラグを立てないでください。