スポンサーリンク

このドキュメントの内容は、以下の通りです。

概要

2018-05-03に ページのタイトルはそのままですが、「真 UNIX findとxargsコマンドで-print0オプションを使う理由」として記事をアップデート致しました。

UNIXでファイルを検索する方法として
  • find
  • locate などがあります。
Unix の find コマンドにはいろいろなオプションがあり、パワフルな検索機能を提供してくれます。find の exec を使えば、ほかのコマンドを連携できますが、 UNIXでfindコマンドをパイプでxargsとつなぐこともよくあります。
find . -name '*.txt'  | xargs ls
上記のケースだと問題になることがあります。それはどんなケースかというと、ファイル名にスペースが含まれるときです。
例えば、こんな名前だったら

read me.txt

read と me.txt として xargs が扱ってしまいます。
echo と xargs でやってみると

$ echo 'read me.txt' | xargs -n1 echo
read
me.txt
こんな感じになります。

上記の問題がおきるケースでの解決策を先に示しておくと、以下の-print0や-0オプションを使うことになります。
find . -name '*.txt' -print0 | xargs -0 ls
この謎のオプション達(-print0と-0)については、後述します。

findとxargsを組み合わせて失敗する例

失敗する例を示してみます。
ファイル名にスペースが含まれたファイルを作成し、findの結果をxargsに渡して、lsを実行させます。
mkdir tmp
cd tmp
touch 'abc def.txt'
find . -name '*.txt'  | xargs  ls
ls: ./abc: No such file or directory
ls: def.txt: No such file or directory
lsコマンドの結果からわかるように、スペースが含まれるファイル名は、別々なものとして認識されています。
この問題は、xargsが区切り文字(デミリタ, delimiter) としてスペースを使っているからです。xargsは、デミリタとして、スペース、タブ、改行です。

スペースが含まれるファイル名をうまく扱う方法

この問題を回避するためには、区切り文字をスペース以外のものにする必要があります。findコマンドでは、-print0というオプションが用意されています。-print0オプションを有効にすると区切り文字がスペースから \0 (ヌル文字)に変更されます。xargsコマンドは、-0オプションを指定されると \0 を区切り文字(デミリタ)として扱います。
\0 (ヌル文字)は、C言語で文字列の終端に使われているものです。

findの-print0オプションとxargsの-0オプションを有効にした結果です。
find . -name '*.txt' -print0 | xargs -0 ls
./abc def.txt
-0 オプションは、 --null という別名も持っています。

まとめ

find からパイプで xargs につなぐ場合には、ファイル名にスペース(スペース、タブ)が含まれている場合には、 find に -print0 オプションを指定し、 xargs に -0 オプションを指定することで、スペースが含まれるファイル名を正しくハンドルできます。
参照しているページ (サイト内): [2010-07-03-1]

スポンサーリンク
スポンサーリンク
 
いつもシェア、ありがとうございます!


もっと情報を探しませんか?

関連記事

最近の記事

人気のページ

はてなの人気のブックマーク

スポンサーリンク
 

過去ログ

2018 : 01 02 03 04 05 06 07 08 09 10 11 12
2017 : 01 02 03 04 05 06 07 08 09 10 11 12
2016 : 01 02 03 04 05 06 07 08 09 10 11 12
2015 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12
2003 : 01 02 03 04 05 06 07 08 09 10 11 12

サイト

Vim入門

C言語入門

C++入門

JavaScript/Node.js入門

Python入門

FreeBSD入門

Ubuntu入門

セキュリティ入門

パソコン自作入門

ブログ

トップ


プライバシーポリシー