Skilore

正規表現とテキスト処理

正規表現はテキスト処理の強力な武器。基本構文からルックアヘッド/ビハインド、名前付きキャプチャ、Unicode 対応、各言語での実装まで、正規表現の全てを解説する。

3 セクション
12 ガイド

01Basics

02Advanced

05

グループ・後方参照 -- キャプチャ、名前付きグループ、先読み・後読み

グループ化はパターンの部分式をまとめ、後方参照はマッチした部分文字列を再利用する。キャプチャグループ、非キャプチャグループ、名前付きグループの使い分けを正確に理解し、置換・抽出・検証で活用する。さらに先読み・後読み(lookahead/lookbehind)、アトミックグループ、条件分岐パターンといった高度なグループ構文も網羅する。

06

先読み・後読み -- (?=)(?!)(?<=)(?<!)

先読み(Lookahead)と後読み(Lookbehind)はゼロ幅アサーションであり、文字を消費せずに位置条件を指定する。パスワード強度検証、複雑な抽出条件、置換対象の限定など、通常のパターンでは表現しにくい制約を可能にする強力な機能である。

07

Unicode 正規表現 -- \p{Script}、フラグ、正規化

グローバルなテキスト処理において、Unicode 対応の正規表現は不可欠である。Unicode プロパティエスケープ(`\p{...}`)、正規化形式(NFC/NFD)、書記体系(Script)によるマッチングを体系的に解説する。

08

パフォーマンス -- ReDoS、バックトラック爆発、最適化

正規表現のパフォーマンス問題は、セキュリティ脆弱性(ReDoS)からサービス停止まで深刻な影響を及ぼす。バックトラック爆発の原理を正確に理解し、安全で高速なパターンを設計する方法を解説する。

03Practical