Cerita Tentang Data

2018-02-01T03:32:43+07:00

Terima kasih atas penjelasannya!
Btw, kumau tanya.. k-means ini kan pake Euclidean distance ya. Berarti ini cuma bisa diterapkan buat numerical data? Gimana kalo misalnya dalam 1 dataset ada campuran categorical/numerical data type? Gimana cara menghitung centroid di categorical data? Atau mungkin ada teknik lain yang lebih sesuai?

SukaSuka

Balas

2020-07-02T06:31:02+07:00

Kita bisa kok pakai k-means untuk variabel kategorikal. Jika variabelnya biner (TRUE atau FALSE), langsung bisa dianggap seperti variabel numerik, yaitu dijadikan 1 atau 0. Jika variabelnya multinomial, biasanya dikonversi dulu menjadi one-hot encoding (https://scikit-learn.org/stable/modules/preprocessing.html#encoding-categorical-features). Misalnya untuk variabel “warna” dengan nilai merah, biru, dan hijau, masing-masing nilai menjadi variabel biner sendiri yaitu “warna_merah”, “warna_biru”, dan “warna_hijau”.

SukaSuka

Balas

	import matplotlib.pyplot as plt
	from sklearn.datasets.samples_generator import make_blobs
	from sklearn.cluster import KMeans

	# Anda dapat mengganti nilai X dan y sesuai dengan kebutuhan Anda
	X, y = make_blobs(n_samples=300, centers=4,
	cluster_std=1.2, random_state=3)

	inertia = []
	for k in range(1,11):
	kmeans = KMeans(n_clusters=k)
	kmeans.fit(X)
	inertia.append(kmeans.inertia_)
	plt.plot(range(1,11), inertia, c='orange', zorder=1)
	plt.scatter(range(1,11), inertia, zorder=2)
	plt.xlabel('$k$')
	plt.ylabel('jarak agregat')
	plt.savefig('scree.png')

S	S	R	K	J	S	M
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

	Okiriza pada The Many-Faces of Recommender…
	Hafiyyan Abdul Aziz pada The Many-Faces of Recommender…
	Dyah S pada Simple Linear Regression…
	Okiriza pada Tiga Subjek yang Sebaiknya Kam…
	Okiriza pada Clustering dengan k-Means

Cerita Tentang Data

Menu

Clustering dengan k-Means

k-Means

Menentukan Nilai $k$

Mengevaluasi Clustering

Contoh Implementasi dan Aplikasi

2 pemikiran pada “Clustering dengan k-Means”

Tinggalkan komentar Batalkan balasan