Python 日本語レファレンスマニュアル

Python パレット

scikit-learn 機械学習

IrisデータセットによるPCA

2023年7月22日

アイリスデータセットに適用した主成分分析

データセットの詳しい情報はここを参照してください。

# Code source: Gaël Varoquaux
# License: BSD 3 clause

import numpy as np
import matplotlib.pyplot as plt


from sklearn import decomposition
from sklearn import datasets

# unused but required import for doing 3d projections with matplotlib < 3.2
import mpl_toolkits.mplot3d  # noqa: F401

np.random.seed(5)

iris = datasets.load_iris()
X = iris.data
y = iris.target

fig = plt.figure(1, figsize=(4, 3))
plt.clf()

ax = fig.add_subplot(111, projection="3d", elev=48, azim=134)
ax.set_position([0, 0, 0.95, 1])


plt.cla()
pca = decomposition.PCA(n_components=3)
pca.fit(X)
X = pca.transform(X)

for name, label in [("Setosa", 0), ("Versicolour", 1), ("Virginica", 2)]:
    ax.text3D(
        X[y == label, 0].mean(),
        X[y == label, 1].mean() + 1.5,
        X[y == label, 2].mean(),
        name,
        horizontalalignment="center",
        bbox=dict(alpha=0.5, edgecolor="w", facecolor="w"),
    )
# Reorder the labels to have colors matching the cluster results
y = np.choose(y, [1, 2, 0]).astype(float)
ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=y, cmap=plt.cm.nipy_spectral, edgecolor="k")

ax.xaxis.set_ticklabels([])
ax.yaxis.set_ticklabels([])
ax.zaxis.set_ticklabels([])

plt.show()

-scikit-learn, 機械学習
-主成分分析

comment コメントをキャンセル

関連記事

: IrisデータセットのSVM分類の相違の図示
irisデータセットの2D投影図の異なる線形SVM分類を比較します。私たちは、このデータセットの最初の二つの特徴を考慮するだけです。この例は、異なるカーネルによる四つのSVM分類のための決定面を図示 ...

: 非線形SVM
　RBFカーネルと非線形SVMを使ったバイナリ分類の実行。予測の対象は入力のXORです。カラーマップはSVCによって学習された決定関数を示します。 import matplotlib.pyplot a ...

: 変分推論:ベイジアン・ニューラル・ネットワーク
機械学習の現在のトレンド　確率プログラミング、機械学習、ビッグデータは、機械学習のもっとも大きなトピックです。確率プログラミングの中では、多くのイノベーションは変分推論を使ってスケールを問題にするこ ...

: 主成分回帰 vs 部分最小二乗回帰
　この例は、主成分分析と部分最小二乗回帰を　toy データセットで比較します。私たちのゴールは、対象がデータの中で任意の方向に強く相関している場合、いかにPLSがPCRより優れているかを説明することで ...

: LinearSVCのサポートベクターの図示
　SVCと違って、LinearSVC（）は、サポートベクターを供給しません。この例は、LinearSVCでサポートベクターを得る方法を説明しています。 import matplotlib.pyplot ...

カーネル密度推定

DBSCANクラスタリングアルゴリズム