「nkf」の版間の差分
提供: セキュリティ
(ページの作成:「nkf とは、ネットワーク漢字フィルターで、主に文字コードの変換に利用されます。SJIS,EUC-JP,UTF-8などの文字コードを相互に...」) |
(相違点なし)
|
2014年12月24日 (水) 14:41時点における版
nkf とは、ネットワーク漢字フィルターで、主に文字コードの変換に利用されます。SJIS,EUC-JP,UTF-8などの文字コードを相互に変換できます。ひらがなをカタカナに変換したり、その逆を行うこともできます。FreeBSDには、iconvがデフォルトで用意されていますが、nkfのほうが便利かもしれません。
読み方
- nkf
- えぬけーえふ
概要
文字化けで困ったときの救世主が nkf コマンドです。文字コードを判定したり、文字コードを変換できます。
インストール
FreeBSD
$ sudo pkg install ja-nkf
Ubuntu/Debianにインストールする場合
apt-get コマンドでインストールする場合です。
sudo apt-get install nkf
CentOSにインストールする場合
sudo yum -y install nkf
MacOS
$ brew install nkf
使い方
コマンドラインオプション
Usage: nkf -[flags] [--] [in file] .. [out file for -O flag] j/s/e/w Specify output encoding ISO-2022-JP, Shift_JIS, EUC-JP UTF options is -w[8[0],{16,32}[{B,L}[0]]] J/S/E/W Specify input encoding ISO-2022-JP, Shift_JIS, EUC-JP UTF option is -W[8,[16,32][B,L]] m[BQSN0] MIME decode [B:base64,Q:quoted,S:strict,N:nonstrict,0:no decode] M[BQ] MIME encode [B:base64 Q:quoted] f/F Folding: -f60 or -f or -f60-10 (fold margin 10) F preserve nl Z[0-4] Default/0: Convert JISX0208 Alphabet to ASCII 1: Kankaku to one space 2: to two spaces 3: HTML Entity 4: JISX0208 Katakana to JISX0201 Katakana X,x Convert Halfwidth Katakana to Fullwidth or preserve it O Output to File (DEFAULT 'nkf.out') L[uwm] Line mode u:LF w:CRLF m:CR (DEFAULT noconversion) --ic=<encoding> Specify the input encoding --oc=<encoding> Specify the output encoding --hiragana --katakana Hiragana/Katakana Conversion --katakana-hiragana Converts each other --{cap, url}-input Convert hex after ':' or '%' --numchar-input Convert Unicode Character Reference --fb-{skip, html, xml, perl, java, subchar} Specify unassigned character's replacement --in-place[=SUF] Overwrite original files --overwrite[=SUF] Preserve timestamp of original files -g --guess Guess the input code -v --version Print the version --help/-V Print this help / configuration Network Kanji Filter Version 2.1.3 (2013-11-22) Copyright (C) 1987, FUJITSU LTD. (I.Ichikawa). Copyright (C) 1996-2013, The nkf Project.
ファイルの文字コードの判定
$ nkf -g utf8.txt UTF-8
UTF8 から EUC-JP へ変換する
$ nkf -e utf8.txt
EUC-JP から UTF-8 へ変換する
$ nkf -w euc.txt
SJIS から UTF-8 へ変換する
$ nkf -w sjis.txt
ひらがな から カタカナ へ変換する
$ cat hiragana ひらがな $ nkf -h2 hiragana ヒラガナ
カタカナ から ひらがな へ変換する
$ cat katakana ヒラガナ $ nkf -h1 katakana ひらがな
ひらがな をカタカナへ、カタカナをひらがなへ変換する
$ cat hiragana_katakana ひらがな ヒラガナ $ nkf -h3 hiragana_katakana ヒラガナ ひらがな
ファイルの文字コードを上書きで変換する
$ nkf -w --overwrite overwrite.txt