Pythonの正規表現で日本語を扱う方法
提供: Python入門
スポンサーリンク
Pythonの正規表現で、漢字だけ置換したい、平仮名だけ置換したい、カタカナだけ置換したい、といったことがあるかと思います。
読み方
- 正規表現
- せいき ひょうげん
概要
漢字を表します。
[一-龥]
ひらがなを表します。
[ぁ-ん]
カタカナを表します。
[ァ-ン]
平仮名とカタカナを表します。
[ぁ-んァ-ン]
漢字だけ置換する
ソースコード
import re regex = u'[一-龥]' src = u"日本語の漢字だけを置換する" dst = re.sub(regex, "Z", src) print dst
実行例
ZZZのZZだけをZZする
平仮名とカタカナだけ置換する
ソースコード
import re regex = u'[ぁ-んァ-ン]' src = u"日本語を置換しちゃうゾ" dst = re.sub(regex, "Z", src) print dst
実行例
日本語Z置換ZZZZZ
関連項目
ツイート
スポンサーリンク