Pythonの正規表現で日本語を扱う方法

提供: Python入門
2015年2月8日 (日) 20:06時点におけるDaemon (トーク | 投稿記録)による版

(差分) ←前の版 | 最新版 (差分) | 次の版→ (差分)
移動: 案内検索
スポンサーリンク

Pythonの正規表現で、漢字だけ置換したい、平仮名だけ置換したい、カタカナだけ置換したい、といったことがあるかと思います。

読み方

正規表現
せいき ひょうげん

概要

漢字を表します。

[一-龥]

ひらがなを表します。

[ぁ-ん]

カタカナを表します。

[ァ-ン]

平仮名とカタカナを表します。

[ぁ-んァ-ン]

漢字だけ置換する

ソースコード

import re
 
regex = u'[一-龥]'
 
src = u"日本語の漢字だけを置換する"
 
dst = re.sub(regex, "Z", src)
print dst

実行例

ZZZのZZだけをZZする

平仮名とカタカナだけ置換する

ソースコード

import re
regex = u'[ぁ-んァ-ン]'
src = u"日本語を置換しちゃうゾ"
dst = re.sub(regex, "Z", src)
print dst

実行例

日本語Z置換ZZZZZ

関連項目




スポンサーリンク