都道府県名と地方名の正規表現

2018-10-11

#Python3 正規表現

大まかな判定をする為の、47都道府県と地方名などの正規表現です。

Python 3 での利用を想定していますが、その他の言語などでも、マルチバイト文字に対応している正規表現ライブラリであれば利用可能です (たぶん)。

長所

  • 「県」や「地方」が付かなくても判定可能。

短所

  • 「中国」や「大分」など、他と判別不能な表現がいくつか有る。
  • 「県」や「地方」を付ける場合と比べて、誤検出が増える。

用途

多数の文字列から、都道府県名や地方名が含まれている可能性がある部分を大まかに抽出するときなど。
まあまあ使えますが、短所で挙げたような語句を多く含む文字列の場合は、ほとんど役に立たないかも。😅

QooQ