こんな人におすすめ:
- 機械学習やデータ分析に携わるエンジニア・研究者
- 大量の画像・テキストデータを扱うデータサイエンティスト
- データの特徴やクラスタ構造を視覚的に理解したい初心者
プロンプト例:
"t-SNEを用いて高次元データを2次元または3次元に低次元化し、クラスタの分布を可視化するPythonスクリプト例を教えてください。"
プロンプト例の出力結果(要約):
Pythonのscikit-learnライブラリを使った例が示されます。まず高次元データ(例:400×60の乱数行列)を用意し、TSNE
クラスで次元を2または3に削減します。matplotlibの3Dプロット機能を使い、得られた埋め込み空間上にデータ点を散布図で表示します。これにより高次元データのクラスタリング状態や構造を視覚的に把握できます。
例:
from sklearn.manifold import TSNE import matplotlib.pyplot as plt import numpy as np X = np.random.rand(400, 60) tsne = TSNE(n_components=3, random_state=0) X_embedded = tsne.fit_transform(X) fig = plt.figure() ax = fig.add_subplot(111, projection='3d') ax.scatter(X_embedded[:, 0], X_embedded[:, 1], X_embedded[:, 2]) plt.show()
この可視化により、似た特徴のデータは近く離れた特徴は遠くに配置され、データ構造全体の理解に役立ちます。