初心者でもわかる!t-SNEによる高次元データの可視化入門と活用ポイント

こんな人におすすめ:

  • 機械学習やデータ分析に携わるエンジニア・研究者
  • 大量の画像・テキストデータを扱うデータサイエンティスト
  • データの特徴やクラスタ構造を視覚的に理解したい初心者

プロンプト例:

"t-SNEを用いて高次元データを2次元または3次元に低次元化し、クラスタの分布を可視化するPythonスクリプト例を教えてください。"

プロンプト例の出力結果(要約):

Pythonのscikit-learnライブラリを使った例が示されます。まず高次元データ(例:400×60の乱数行列)を用意し、TSNEクラスで次元を2または3に削減します。matplotlibの3Dプロット機能を使い、得られた埋め込み空間上にデータ点を散布図で表示します。これにより高次元データのクラスタリング状態や構造を視覚的に把握できます。

例:

from sklearn.manifold import TSNE
import matplotlib.pyplot as plt
import numpy as np

X = np.random.rand(400, 60)
tsne = TSNE(n_components=3, random_state=0)
X_embedded = tsne.fit_transform(X)

fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
ax.scatter(X_embedded[:, 0], X_embedded[:, 1], X_embedded[:, 2])
plt.show()

この可視化により、似た特徴のデータは近く離れた特徴は遠くに配置され、データ構造全体の理解に役立ちます。

タイトルとURLをコピーしました