正規表現

正規表現とは

「パターンを指定して、文字列を効率よく検索・置換するためのミニ言語」

参考サイト https://qiita.com/jnchito/items/893c887fbf19e17d3ff9

この表現方法を使えば、たくさんの文字列の中から、特定の文字列だけを抜き出すことが簡単にできる。

 

メタ文字について

正規表現では、パターンを指定するために、いくつかの文字に対して特別な意味を持たせている。そのような文字をメタ文字という。

主なメタ文字には、以下のようなものがある。

. ^ $ [ ] * + ? | ( )

 

各メタ文字の意味

「 .」任意の一文字

「^」行の先頭

「$」行の最後

「*」直前の文字の0回以上の繰り返し

「+」直前の文字の1回以上の繰り返し

「?」直前の文字が0回か1回

「|」 | で区切ったいずれかの文字列

「[ ]」[ ] のなかで指定した文字のどれか

「( )」( ) のなかで指定した文字でグループ化

「\d」半角の数字

「\w」半角の英数字かアンダーバー

「\s」空白とタブ

「[a-z]」a~zまでの文字のどれか

「[0-9]」0~9までの数字のどれか

「{2,5}」2文字以上5文字以下という文字数指定

 

具体的な使用例

以下のサイトで試してみる。

http://rubular.com

以下の画像のように、正規表現を使うと抜き出したい文字だけを簡単に抜き出すことができる。

gyazo.com