スポンサーリンク

[sklearn] ラベルエンコーディング(LabelEncoder)の使い方

ラベルエンコーディングとは

ラベルエンコーディングは、カテゴリ変数を数値に変換する処理を行います。

実装

PythonのsklearnのLabelEncoderクラスを用いることで、ラベルエンコーディングの処理ができます。
以下の処理では「a, b, c」といったカテゴリ変数を、「a → 0」、「b → 1」、「c → 2」に変換する処理を行います。

IN

import numpy as np
from sklearn.preprocessing import LabelEncoder

# 変換前のデータ
arr = np.array(["a", "b", "c", "a", "b"])

# LabelEncoderのインスタンス化
le = LabelEncoder()
# fitメソッドで、どのように変換するかの前準備(a→0に変換するといった関連付けをする)
le.fit(arr)
# 実際に変換する
le.transform(arr)

OUT

array([0, 1, 2, 0, 1])