
クラス不均衡とは、データセットにおけるクラスの分布が偏りすぎている状態を指します。簡単に言えば、あるクラスが他のクラスに対して圧倒的に多い、もしくは少ない状態ですね。まるで、世界中の空き缶を集める大会で、参加者の99%がオリンピック選手級の金メダリストで、残り1%が運動不足の中年男性のようなものです。データサイエンスの世界では、この不均衡が予測モデルを台無しにしてしまうことが多いのです。つまり、こんな偏ったデータじゃ、正しい判断を下すどころか、ただの運任せ、お祈り大作戦になってしまうのが目に見えています。まるで、テスト勉強を怠けた子供が試験の合格を祈るようなものですね。なので、クラス不均衡には十分な注意が必要です。
クラス不均衡をまじめに語ると
前の記事: « 軽食とは?毒舌で解説!
次の記事: ユーザーアカウントとは?毒舌で解説! »