「Pythonの正規表現で日本語を扱う方法」の版間の差分
提供: Python入門
行1: | 行1: | ||
− | + | Pythonの正規表現で、漢字だけ置換したい、平仮名だけ置換したい、カタカナだけ置換したい、といったことがあるかと思います。 | |
'''読み方''' | '''読み方''' | ||
− | ; | + | ;正規表現:せいき ひょうげん |
__TOC__ | __TOC__ | ||
行12: | 行12: | ||
[ぁ-ん] | [ぁ-ん] | ||
− | + | カタカナを表します。 | |
[ァ-ン] | [ァ-ン] | ||
+ | |||
+ | 平仮名とカタカナを表します。 | ||
+ | [ぁ-んァ-ン] | ||
== 漢字だけ置換する == | == 漢字だけ置換する == | ||
行31: | 行34: | ||
ZZZのZZだけをZZする | ZZZのZZだけをZZする | ||
</syntaxhighlight> | </syntaxhighlight> | ||
− | == | + | == 平仮名とカタカナだけ置換する == |
=== ソースコード === | === ソースコード === | ||
<syntaxhighlight lang="python"> | <syntaxhighlight lang="python"> |
2015年2月8日 (日) 20:06時点における最新版
Pythonの正規表現で、漢字だけ置換したい、平仮名だけ置換したい、カタカナだけ置換したい、といったことがあるかと思います。
読み方
- 正規表現
- せいき ひょうげん
概要
漢字を表します。
[一-龥]
ひらがなを表します。
[ぁ-ん]
カタカナを表します。
[ァ-ン]
平仮名とカタカナを表します。
[ぁ-んァ-ン]
漢字だけ置換する
ソースコード
import re regex = u'[一-龥]' src = u"日本語の漢字だけを置換する" dst = re.sub(regex, "Z", src) print dst
実行例
ZZZのZZだけをZZする
平仮名とカタカナだけ置換する
ソースコード
import re regex = u'[ぁ-んァ-ン]' src = u"日本語を置換しちゃうゾ" dst = re.sub(regex, "Z", src) print dst
実行例
日本語Z置換ZZZZZ