HadoopTimes

実践 機械学習:レコメンデーションにおけるイノベーション
技術情報

不動産、天候および機械学習におけるロケーションの重要性

不動産の専門家は、物件の最も重要な特性として、一にロケーション、二にも三にもロケーションを挙げます。同様に、天候事象もまた大いにロケーションに左右されます。以下では、同様の見解を機械学習アルゴリズムにも当てはめて考察していきます。

一にロケーション、二にも三にもロケーション

不動産において購入者がロケーションを最重要項目に掲げる理由として、少なくとも次の三つが挙げられます: (a) 周辺地域の望ましさ、(b) 学校、企業、官公庁等への近さ、そして(c) 同エリアにおける物件の価値。気象学者もまた同様に、あらゆる天気は局所的であると述べます。

天候においてもロケーションは、少なくとも次の三つの理由から重要性を持ちます: (a) 何百マイルもの広範囲に及ぶ、ミクロ規模の大気の相互作用現象は著しく複雑であるため、具体的な天候事象の予測はほぼ不可能であり、(b) 天気予報の具体的な結末は、高度に局所的なエリアにおいてのみ発生する可能性が高く、また (c) ロケーションの僅かな詳細(地形、水分学および構造)は、地域モデルに含めるには具体性が高すぎるものの、ミクロ規模の天候事象においては非常に有意な変数となるためです。

注記: 上述のロケーションベースの機能をパラメータ化し、適切にスコアリングできれば、予測モデル(不動産販売あるいは天候向け)をいくつか生成できる可能性があります。

「ロケーション」に関するもう一つの側面として、異なるエリア間の境界領域が挙げられます。特に、望ましいエリアが望ましくないエリアに隣接している場合、この境界領域は不動産販売に影響を及ぼす事があります。両エリアにおける条件(価格、市場要素、リセールバリュー)は明々白々としていても、境界領域には不明な要素が多く存在します。この点が天候にも当てはまることは、2014年3月3日に全米を襲った大雪・豪雪からも特に明らかとなりました。

ボルティモア・ワシントン地域にいた我々は、大量の雪、雨雪やみぞれを想定していました。しかし、ほとんどの地域では中程度の雪以上の何ものでもありませんでした。このような「深刻度の低い」天候事象が発生した一つの理由として、北からの冷たく乾いた空気が、南からの暖かく湿った空気を押し退け、乾いた空気を予想以上に上述地域にもたらした事が挙げられます。

この地域の緯度は、北部天候循環と南部天候循環の境界領域内に属する事が多いため、大量の積雪に関する誤報も少なくありません。ある嵐の際に、南北いずれの天候パターンが境界領域において打ち勝つかを確実に予測するのは簡単ではありません。