HadoopTimes

ストリーミングアーキテクチャ Apache Kafka とMapR Streams による新しい設計手法
技術情報

MapR Sandbox for Hadoopへのネットワークの構築の仕方:ホワイトボード・ウォークスルー

今回のホワイトボード・ウォークスルーでは、ジェームズ・カサレットがMapR Hadoop Sandboxへのネットワークはどのように構築するかについて解説します。MapR Sandboxをサポートするために、あなたがVirtualBox、VMware Fusion、VMware Player、あるいは、ラップトップの中にあるどんなハイパーバイザを使っていても、ネットワークを構築しなければなりません。あなたのSandboxにネットワークを構築するには、基本的に3つの異なる設定を使うことができます。一つはNAT、もう一つはホストオンリー、そしてブリッジです。

こちらが講義の書き起こしです:
こんにちは、ジェームズ・カサレットです。MapR Technologies社のプロフェッショナルサービス組織で働いています。ホワイトボード・ウォークスルーへようこそ。今回はこれから、MapR Hadoop Sandboxへのネットワークの構築はどのようにしたら良いかをお話します。MapR Sandboxをサポートするために、あなたがVirtualBox、VMware Fusion、VMware Player、あるいは、ラップトップの中にあるどのようなハイパーバイザを使っていても、ネットワークを構築しなければなりません。あなたのSandboxにネットワークを構築するには、基本的に3つの異なる設定を使うことができます。一つはNAT、もう一つはホストオンリー、そしてブリッジです。

まずはNATから始めましょう。 NATはNetwork Address Translation (ネットワークアドレス変換) の略です。NATはアウトバウンドトラフィックを効率的にサポートします。なので、Sandbox内から、私は外にあるネットワークに接続することはできます、だけどインバウンドトラフィックにはできません。デフォルトでは。これを可能にするにはいくつかの方法があります。私が構築できるものに、ポートフォワーディングルールと呼ばれるものがあります。なので、ポートフォワーディングと呼ばれるものを構築できます。これは、ポートごとに、そのポートがホストから来たものを通過させるか、ホストからVMへ送信させるかを設定することができるということです。

もし私がほんの一握りのポートしか使えないとしたら、例えばポート22が SSH用、そしてポート8443がMCS用で、多分ポート5881がZookeeper用、ポート7222がCLDB用…というような感じだとします。このようなほんの少しのポートだけでも、それはそれで大丈夫です。だけどリストはどんどん長くなって、NATは処理するのが大変になってくるでしょう。さあ困った。ホストオンリーは、Sandboxにこのホストから接続することができるというネットワーク設定です。これが端末ウィンドウだとします。私はホストから、SSHやPingやTelemat、そしてFTPが、私のラップトップからSandboxへ、またはその逆ができます。

つまり基本的に、ホストオンリーでの接続の範囲は、ホストだけなのです。あなたがSandboxへラップトップからつなげさえすれば良いのであれば、これで問題ありません。だけどもし、例えば、ソフトウェア・パッケージをインストールしたい場合は? おそらくAptiaやYum、WgetやCurlやその他インターネットを参照したいでしょうが、ホストオンリーでは無理です。なので、ホストオンリーでのインターネットオプションはありえません。

3つ目のオプションはブリッジと呼ばれるものです。ブリッジの考え方とは、Sandboxにあなたのイーサネット接続を持たせることです。ethOを、あなたのラップトップのネットワークポートのどれかにブリッジするか接続させます。ブリッジさせるということは、それを何かに橋渡しするということですので、ワイヤレス接続に橋渡ししたり、ケーブルのイーサネット接続に橋渡ししたりということができます。それはうまく行きます。それがうまく行かないのは、そのネットワークに接続するのにパスワードやダイアログが必要な場合です。なぜならSandboxの内部には対話は伝えられないのですから。例えば、もしあなたがスターバックスにいるとして、ウェブブラウザを表示して、続けるには「はい」をクリックしなくちゃいけないとしたら、それはSandboxではサポートできません。ネットワーク接続にパスワードやダイアログが必要なければ全く問題ありません。Sandboxからネットワークに出て、そして外からSandboxに戻ることができます。ネットワークの通常のノードのような機能みたいなものです。

ただ、ブリッジのその他の面は、ブリッジからどこにもつながらない、という状態には気をつけなければいけないということです。それは多分、あなたがオフィスにいるときにはオフィスのWiFiに接続できるのに (パスワードは要らないとします)、家に帰ってそこにWiFi経由で接続したい場合、家ではあなたのWiFiルータにパスワードを設定しているというような場合です。それが基本的に、ブリッジからどこにもつながらない、という状態です。同様に、あなたが家でイーサネットケーブルにつないでブリッジを行い、それでインターネット接続もできるという場合に、他の場所に移って何もつなげていない場合は、それがブリッジからどこにもつながらない、という状態になります。ブリッジネットワーキングをしている時には、そのことに注意してください。

これらの設定から、一体どれを使ったら良いでしょう? それはあなたが何が必要かによります。ブリッジは、ネットワークに接続するのにパスワードやダイアログが必要ない場合には完璧に向いています。ホストオンリーは、ラップトップとSandboxだけつなげば良い場合は問題ありません。NATはあなたが接続する必要があるポートの数が少ない場合には大丈夫です。そうでない場合は、あなた次第です。

最後に、MapR Sandboxでは、これらのモードを変更した時はどうなるでしょう? 必要なのはSandboxを再起動することです。Sandboxの起動時にアサインするIPアドレスを管理する常駐のコントロールスクリプトがあるのです。

これで全部です。このセッションを観ていただきありがとうございました。

こちらの記事もおすすめです