Belajar Mesin - Grafik Scatter

Grafik titik (Scatter Plot)

Grafik titik adalah grafik yang masing-masing nilai dalam set data diwakili oleh titik.


Modul Matplotlib memiliki metode untuk menggambar grafik titik, yang memerlukan dua array panjang yang sama, satu array untuk nilai sumbu x, dan yang lain untuk nilai sumbu y:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Array x mewakili umur setiap mobil.

Array y menunjukkan kecepatan setiap mobil.

Contoh

Silakan gunakan scatter() Metode untuk menggambar grafik titik:

import matplotlib.pyplot as plt
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
plt.scatter(x, y)
plt.show()

Hasil:


Jalankan Contoh

Penjelasan Grafik Tertitik

Aksis x menunjukkan umur mobil, aksis y menunjukkan kecepatan.

Dari gambar yang dapat dilihat, kedua mobil tercepat telah digunakan selama 2 tahun, mobil paling lambat telah digunakan selama 12 tahun.

Keterangan:Muncul bahwa mobil semakin baru, kecepatan pengemudi semakin tinggi, tetapi ini mungkin hanya sebetulnya suatu kesempatan, sebab kami hanya mendaftarkan 13 mobil.

Distribusi Data Acak

Dalam pemelajaran mesin, set data dapat berisi ribuan hingga jutaan nilai.

Ketika menguji algoritma, Anda mungkin tidak memiliki data nyata, Anda mungkin harus menggunakan nilai yang dihasilkan secara acak.

Seperti yang kita belajar di bab sebelumnya, modul NumPy dapat membantu kami!

Buat dua array yang diisi dengan bilangan acak dari distribusi data normal 1000.

Mean dari array pertama diatur menjadi 5.0, standar deviasi menjadi 1.0.

Mean dari array kedua diatur menjadi 10.0, standar deviasi menjadi 2.0:

Contoh

Grafik titik 1000 poin:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()

Hasil:


Jalankan Contoh

Penjelasan Grafik Tertitik

Kami dapat melihat bahwa titik-titik terkonsentrasi di nilai 5 di sumbu x dan 10 di sumbu y.

Kami dapat melihat bahwa penyebaran di sumbu y adalah lebih besar daripada di sumbu x.