AI正規表現生成とは?
読み方: えーあいせいきひょうげんせいせい
30秒まとめ
自然言語の説明やサンプルから、AIが正規表現(regex)を自動で生成・解説する技術。
AI正規表現生成の意味・定義
AI正規表現生成は、「日本の携帯電話番号にマッチするパターンを作って」といった自然言語の指示や、サンプルテキストの「抽出したい箇所」をもとに、大規模言語モデル(LLM)が正規表現(regex)を自動で書き起こす技術です。正規表現は強力な一方、先読み・後方参照・量指定子などの記法が難解で「書けるが読めない」「動くが意図と違う」が起きやすい領域であり、AIはその橋渡しをします。多くは双方向で、既存のregexを貼って「これは何にマッチする?」と聞けば平易な言葉で解説もしてくれます。代表的ツールに、自然言語とregexを相互変換するAutoRegex、サンプルから逆算するRegex.aiがあり、ChatGPTやClaudeはテストコード込みで柔軟に生成できます。注意点として、AIの正規表現は「取りこぼし/拾いすぎ」が頻繁に起きるためマッチさせたい例・させたくない例の両方でregex101などを使って必ずテストすること、JavaScript・Python・PCRE・grepなどで対応記法が異なるため使用環境を明示すること、入れ子の量指定子などによるReDoS(正規表現DoS)に注意することが挙げられます。