
データレイクとは、データがバシャバシャと流れ込む巨大な湖のことですが、正直言ってただの雑多なストレージに過ぎません。元々はデータってものは整然としているべきなのに、こいつは雑然としたバッカスの誘惑に負けたデータたちが入り乱れているだけ。例えば、冷蔵庫に賞味期限切れのピザや半端な野菜を放り込むようなもの。使うべき時に必要なデータを見つけられず、結局は無駄に時間を浪費することになります。データをどう扱うか、戦略を持たずにデータレイクに飛び込むのは、サメのいる海で泳ぐようなもので、生き残れる自信がありますか?
データレイクをまじめに語ると
前の記事: « データマネジメントとは?毒舌で解説!
次の記事: データ前処理とは?毒舌で解説! »