「Pythonの正規表現で日本語を扱う方法」の版間の差分

提供: Python入門
移動: 案内検索
(ページの作成:「x とは、 '''読み方''' ;x: __TOC__ == 概要 == 漢字を表します。 [一-龥] ひらがなを表します。 [ぁ-ん] カナを表します。 [...」)
 
 
行1: 行1:
[[x]] とは、
+
Pythonの正規表現で、漢字だけ置換したい、平仮名だけ置換したい、カタカナだけ置換したい、といったことがあるかと思います。
  
 
'''読み方'''
 
'''読み方'''
;[[x]]:
+
;正規表現:せいき ひょうげん
 
__TOC__
 
__TOC__
  
行12: 行12:
 
  [ぁ-ん]
 
  [ぁ-ん]
  
カナを表します。
+
カタカナを表します。
 
  [ァ-ン]
 
  [ァ-ン]
 +
 +
平仮名とカタカナを表します。
 +
[ぁ-んァ-ン]
  
 
== 漢字だけ置換する ==
 
== 漢字だけ置換する ==
行31: 行34:
 
ZZZのZZだけをZZする
 
ZZZのZZだけをZZする
 
</syntaxhighlight>
 
</syntaxhighlight>
== 平仮名とカナだけ置換する ==
+
== 平仮名とカタカナだけ置換する ==
 
=== ソースコード ===
 
=== ソースコード ===
 
<syntaxhighlight lang="python">
 
<syntaxhighlight lang="python">

2015年2月8日 (日) 20:06時点における最新版

Pythonの正規表現で、漢字だけ置換したい、平仮名だけ置換したい、カタカナだけ置換したい、といったことがあるかと思います。

読み方

正規表現
せいき ひょうげん

概要

漢字を表します。

[一-龥]

ひらがなを表します。

[ぁ-ん]

カタカナを表します。

[ァ-ン]

平仮名とカタカナを表します。

[ぁ-んァ-ン]

漢字だけ置換する

ソースコード

import re
 
regex = u'[一-龥]'
 
src = u"日本語の漢字だけを置換する"
 
dst = re.sub(regex, "Z", src)
print dst

実行例

ZZZのZZだけをZZする

平仮名とカタカナだけ置換する

ソースコード

import re
regex = u'[ぁ-んァ-ン]'
src = u"日本語を置換しちゃうゾ"
dst = re.sub(regex, "Z", src)
print dst

実行例

日本語Z置換ZZZZZ

関連項目