Hadoop Streaming の使い方 mapper を perl で書くサンプル
スポンサーリンク
このドキュメントの内容は、以下の通りです。
この例では、Hadoop Streaming を利用し、 Map を perl、 Reducer を wc コマンドとして、 Map Reduce を実行します。perl1.pl
#!/usr/local/bin/perl -w use strict; sub main { while (<STDIN>) { chomp; # ここに処理 print $_ . "\t1\n"; } exit (0); } & main;
perl1.sh
#!/bin/sh HADOOP_HOME=/home/kaworu/Hadoop/hadoop-1.0.3 HADOOP=$HADOOP_HOME/bin/hadoop STREAMING=$HADOOP_HOME/contrib/streaming/hadoop-streaming-1.0.3.jar $HADOOP jar $STREAMING \ -input input -output output \ -mapper $PWD/perl1.pl -reducer /usr/bin/wc
input
$ ls input/ a $ cat input/a 1 2 3
実行
$ sh perl1.sh packageJobJar: [/tmp/hadoop-kaworu/hadoop-unjar45233/] [] /var/tmp/streamjob45234.jar tmpDir=null 12/07/03 01:08:06 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 12/07/03 01:08:06 WARN snappy.LoadSnappy: Snappy native library not loaded 12/07/03 01:08:06 INFO mapred.FileInputFormat: Total input paths to process : 1 12/07/03 01:08:07 INFO streaming.StreamJob: getLocalDirs(): [/tmp/hadoop-kaworu/mapred/local] 12/07/03 01:08:07 INFO streaming.StreamJob: Running job: job_201207281237_0042 12/07/03 01:08:07 INFO streaming.StreamJob: To kill this job, run: 12/07/03 01:08:07 INFO streaming.StreamJob: /home/kaworu/Hadoop/hadoop-1.0.3/libexec/../bin/hadoop job -Dmapred.job.tracker=localhost:9001 -kill job_201207281237_0042 12/07/03 01:08:07 INFO streaming.StreamJob: Tracking URL: http://localhost:50030/jobdetails.jsp?jobid=job_201207281237_0042 12/07/03 01:08:08 INFO streaming.StreamJob: map 0% reduce 0% 12/07/03 01:08:26 INFO streaming.StreamJob: map 100% reduce 0% 12/07/03 01:08:38 INFO streaming.StreamJob: map 100% reduce 100% 12/07/03 01:08:44 INFO streaming.StreamJob: Job complete: job_201207281237_0042 12/07/03 01:08:44 INFO streaming.StreamJob: Output: output
コマンド
確認とファイルの削除。
./bin/hadoop dfs -ls output/part-00000 ./bin/hadoop dfs -cat output/part-00000 ./bin/hadoop dfs -rmr output
スポンサーリンク
スポンサーリンク
いつもシェア、ありがとうございます!
もっと情報を探しませんか?
関連記事
最近の記事
- パナソニック ジェットウォッシャードルツ EW-DJ61-Wのホースの修理
- LinuxセキュリティモジュールIntegrity Policy Enforcement
- アマゾンのEcho Show 5を買ったのでレビューします
- アマゾンのサイバーマンデーはAlexa Echo Show 5が安い
- Android スマートフォン OnePlus 7T と OnePlus 7の違い
- Android スマートフォン OnePlus 7 をAndroid10にアップデートしてみた
- クレジットカードのバーチャルカードの比較のまとめ
- 活動量計 Xiaomi Mi Band 4を買ってみたのでレビュー
- Android スマートフォン OnePlus 7 のレビュー
- AliExpressでスマートフォンを買い物してみた
- パソコンのホコリ対策 レンジフードフィルターと養生テープ
- 80PLUS GOLDのPC電源ユニットAntec NeoEco 750 Goldのレビュー
- イギリスの付加価値税 VAT は払い戻しを受けられる
- イギリスのロンドンでスーツケースなど荷物を預けられる場所は
- イギリスのロンドンで地下鉄やバスに乗るならオイスターカードを使おう
- イギリスのヒースロー空港からロンドン市内への行き方
- 航空便でほかの航空会社に乗り継ぎがある場合のオンラインチェックイン
- SFC会員がANA便ではなくベトナム航空のコードシェアを試して解ったこと
- ベトナムの入国審査でeチケットの掲示が必要だった話
- シアトルの交通ICカードはオルカカード(Orca)です
人気のページ
- Windows7 IME 辞書ツールで単語の登録に失敗しました
- C言語 popen()でコマンドを実行して出力を読み込む
- Windows7で休止状態にする方法
- CentOS MySQLの起動、停止、再起動
- loggerコマンドでsyslogにエラーを出力する方法
- パソコンパーツの買取をしてくれる店のまとめ
- Java Mapの使い方 get(),put(),remove(),size(),clear()
- 楽天のRポイントカードを作ってみた
- iPhone 5 から iPhone 6 に乗り換えたのでレビュー
- netstatコマンドのステータスの意味
スポンサーリンク
過去ログ
2020 : 01 02 03 04 05 06 07 08 09 10 11 122019 : 01 02 03 04 05 06 07 08 09 10 11 12
2018 : 01 02 03 04 05 06 07 08 09 10 11 12
2017 : 01 02 03 04 05 06 07 08 09 10 11 12
2016 : 01 02 03 04 05 06 07 08 09 10 11 12
2015 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12
2003 : 01 02 03 04 05 06 07 08 09 10 11 12