Statistik menggunakan PLS-SEM (2)
Partial Least Square (PLS), Pengertian, Fungsi, Tujuan, Cara
Pengertian Partial
Least Square (PLS), Fungsi, Tujuan, Cara dan Algoritma
Partial
least square atau yang biasa disingkat PLS adalah jenis analisis statistik yang
kegunaannya mirip dengan SEM di dalam analisis covariance. Oleh karena mirip
SEM maka kerangka dasar dalam PLS yang digunakan adalah berbasis regresi linear.
Jadi apa yang ada dalam regresi linear, juga ada dalam PLS. Hanya saja diberi
simbol, lambang atau istilah yang berbeda. Seperti apa? tetap dalam
artikel-artikel kami, maka pertanyaan tersebut akan terjawab dengan sendirinya
nanti.
Dalam
bahasan tentang PLS, tentunya tidak akan cukup hanya dalam satu artikel. Maka
kami akan buat dalam serangkaian artikel, yang cara penyampaiannya kami
upayakan sederhana dan mudah dipahami serta berbasis studi kasus atau contoh
langsung pengoperasiannya dalam software misal smartPLS.
Jadi
mungkin seperti artikel lainnya dalam statistikian.com, kami coba memberikan
penjelasan yang sederhana, dasar, mudah dipahami dan praktis agar kiranya para
pembaca langsung dapat mempraktekannya dalam tempo yang sesingkat-singkatnya
(kayak teks proklamasi ya). Dalam beberapa bagian dari serangkaian artikel
tersebut, akan kami ambil dari berbagai tulisan para ahli dalam buku maupun
blogger yang beredar di berbagai blog. (Sebelumnya terima kasih pada para ahli
dan blogger-blogger ya.)
Pengertian Partial least square
Partial
least square adalah suatu teknik statistik multivariat yang bisa untuk
menangani banyak variabel respon
serta variabel eksplanatori sekaligus. Analisis ini merupakan alternatif yang
baik untuk metode analisis regresi berganda dan regresi komponen utama, karena
metode ini bersifat lebih robust atau kebal. Robust artinya parameter model
tidak banyak berubah ketika sampel baru diambil dari total populasi (Geladi dan
Kowalski, 1986).
Partial
Least Square suatu teknik prediktif yang bisa menangani banyak variabel
independen, bahkan sekalipun terjadi multikolinieritas diantara
variabel-variabel tersebut (Ramzan dan Khan, 2010).
Menurut
Wold, PLS adalah metode analisis yang powerfull sebab
tidak didasarkan pada banyak asumsi atau syarat, seperti uji normalitas dan
multikolinearitas. Metode tersebut mempunyai keunggulan tersendiri antara lain:
data tidaklah harus berdistribusi normal multivariate. Bahkan indikator
dengan skala data kategori, ordinal, interval sampai rasio dapat digunakan.
Keunggulan lainnya adalah ukuran sampel yang tidak harus besar.
Penemu PLS
PLS
pertama kali dikembangkan oleh Herman O. A. Wold dalam bidang ekonometrik pada
tahun 1960-an. Kelebihan dari Partial Least Square yang penting adalah dapat
menangani banyak variabel independen, bahkan meskipun terjadi multikolinieritas
diantara variabel-variabel independen.
Analisis regresi berganda sebenarnya masih dapat digunakan ketika terdapat
variabel prediktor yang banyak. Namun, jika jumlah variabel tersebut terlalu
besar (misal lebih banyak variabel dari pada jumlah observasi), maka akan
diperoleh model yang fit dengan data sampel, tapi akan gagal memprediksi untuk
data baru. Fenomena ini disebut overfitting.
Dalam
kasus overfitting seperti itu, meskipun terdapat banyak faktor manifes, mungkin
saja hanya terdapat sedikit faktor laten yang paling bisa menjelaskan variasi
dalam respon. Maka muncullah ide PLS. Ide umum dari PLS adalah untuk
mengekstrak faktor-faktor laten tersebut, yang menjelaskan sebanyak mungkin
variasi faktor manifes saat memodelkan variabel respon.
Algoritma PLS
Untuk sub
bagian tentang algoritma ini, terus terang jangan diambil hati ya. Bagi yang
kesulitan, silahkan dibaca saja dulu. Perkara paham atau tidak, tidak jadi
masalah. Yang penting pada artikel berikutnya anda bisa melakukan analisis yang
namanya Partial Least Square.
Misalnya X
adalah matriks yang berukuran n x p dan Y adalah matriks berukuran n x q. Maka
prosedur PLS akan mengekstraksi faktor dari X dan Y tersebut berturut-turut
sedemikian hingga diantara faktor-faktor yang terekstrak memiliki kovarian yang
maksimal. Metode PLS juga bisa bekerja dengan variabel respon berganda.
Dengan
tekhnik Partial Least Square ini akan dicoba untuk mencari suatu dekomposisi
linier dari X dan Y . Sehingga rumusnya adalah:

Decomposisi Linear X dan Y (Gambar dikutip dari https://statistikakomputasi.wordpress.com/2010/08/11/partial-least-square-regression/)
Kolom dari
T merupakan vektor laten, dan U = TB, yaitu regresi dari vektor laten t
sehingga:
Y = TBQT + F
Vektor
laten dapat dipilih dalam berbagai cara. Dalam persamaan di atas, maka setiap
set vektor ortogonal pembentuk ruang kolom dari X bisa digunakan. Untuk
menentukan T, maka diperlukan kondisi tambahan.
Untuk
regresi PLS, yaitu mencari dua set bobot yang dinotasikan dengan w dan c dalam
rangka menciptakan suatu kombinasi linier pada kolom-kolom X dan Y sehingga
kombinasi linier ini memiliki kovarian yang maksimum. Secara khusus, tujuannya
adalah memperoleh pasangan vektor.
t = Xw dan
u = Yc
Dengan
konstrain wTw = 1, tTt = 1 dan tTu adalah maksimal. Ketika vektor laten pertama telah
dihitung, maka vektor tersebut disubstraksi dari X maupun Y dan prosedur
diulang sampai dengan X menjadi matriks nol.
NIPALS
Algoritma
standar untuk menghitung komponen (faktor) PLS adalah nonlinear iterative
partial least square atau disingkat NIPALS yang pertama kali dikembangkan oleh
Herman Wold (1966a). Algoritma NIPALS merupakan inti paling penting dalam PLS
dan mempelajarinya merupakan kunci untuk memahami metode PLS.
Ide dasar
dalam algoritma ini adalah mengestimasi parameter t dan u dengan suatu proses
iteratif dari regresi least square. Berikut ini adalah langkah-langkah dalam
algoritma NIPALS:

Tujuan Partial Least
Square
Walaupun
Partial Least Square digunakan untuk menkonfirmasi teori, tetapi dapat juga
digunakan untuk menjelaskan ada atau tidaknya hubungan antara variabel laten.
Partial Least Square dapat menganalisis sekaligus konstruk yang dibentuk dengan
indikator refleksif dan indikator formatif dan hal ini tidak mungkin dijalankan
dalam Structural Equation Model (SEM) karena akan terjadi unidentified model.
PLS
mempunyai dua model indikator dalam penggambarannya, yaitu: Model
Indikator Refleksif dan Model Indikator Formatif.
Model Indikator Refleksif
Model
Indikator Refleksif sering disebut juga principal factor model dimana
covariance pengukuran indikator dipengaruhi oleh konstruk laten atau
mencerminkan variasi dari konstruk laten.
Di bawah ini adalah contoh model hubungan
reflektif:

Gambar
diatas menunjukkan bahwa: Variabel laten Y diukur dengan blok X yang
terdiri dari 3 indikator. X1, X2 dan X3 secara reflektif.
Model
reflektif mencerminkan bahwa setiap indikator merupakan pengukuran kesalahan
yang dikenakan terhadap variabel laten. Arah sebab akibat ialah dari variabel
laten ke indikator dengan demikian indikator-indikator merupakan refleksi
variasi dari variabel laten (Henseler, Ringle & Sinkovicks, 2009). Dengan
demikian perubahan pada variabel laten diharapkan akan menyebabkan perubahan
pada semua indikatornya.
Pada Model
Refleksif konstruk unidimensional digambarkan dengan bentuk elips dengan
beberapa anak panah dari konstruk ke indikator, model ini menghipotesiskan
bahwa perubahan pada konstruk laten akan mempengaruhi perubahan pada indikator.
Model
Indikator Refleksif harus memiliki internal konsistensi oleh karena semua
ukuran indikator diasumsikan semuanya valid indikator yang mengukur suatu
konstruk, sehingga dua ukuran indikator yang sama reliabilitasnya dapat saling
dipertukarkan.
Walaupun reliabilitas (cronbach
alpha) suatu konstruk akan rendah jika hanya ada sedikit indikator, tetapi
validitas konstruk tidak akan berubah jika satu indikator dihilangkan.
Model Indikator Formatif
Model
Formatif tidak mengasumsikan bahwa indikator dipengaruhi oleh konstruk tetapi
mengasumsikan semua indikator mempengaruhi single konstruk. Arah hubungan
kausalitas mengalir dari indikator ke konstruk laten dan indikator sebagai grup
secara bersama-sama menentukan konsep atau makna empiris dari konstruk laten.
Di bawah ini adalah contoh model hubungan
formatif:

Gambar
diatas menunjukkan bahwa: Variabel laten Y diukur dengan blok X yang
terdiri dari 3 indikator. X1, X2 dan X3 secara formatif.
Model
hubungan formatif ialah hubungan sebab akibat berasal dari indikator menuju ke
variabel laten. Hal ini dapat terjadi jika suatu variabel laten didefinisikan
sebagai kombinasi dari indikator-indikatornya. Dengan demikian perubahan yang
terjadi pada indikator-indikator akan tercermin pada perubahan variabel
latennya.
Oleh
karena diasumsikan bahwa indikator mempengaruhi konstruk laten maka ada
kemungkinan antar indikator saling berkorelasi. Tetapi model formatif tidak
mengasumsikan perlunya korelasi antar indikator atau secara konsisten bahwa
model formatif berasumsi tidak adanya hubungan korelasi antar indikator.
Karenanya ukuran internal konsistensi reliabilitas (cronbach alpha) tidak
diperlukan untuk menguji reliabilitas konstruk formatif.
Kausalitas
hubungan antar indikator tidak menjadi rendah nilai validitasnya hanya karena
memiliki internal konsistensi yang rendah (cronbach alpha), untuk menilai
validitas konstruk perlu dilihat variabel lain yang mempengaruhi konstruk
laten.
Jadi untuk
menguji validitas dari konstruk laten, peneliti harus menekankan pada
nomological dan atau criterion-related validity. Implikasi lain dari Model
Formatif adalah dengan menghilangkan satu indikator dapat menghilangkan bagian
yang unik dari konstruk laten dan merubah makna dari konstruk.
Fungsi
Partial Least Square
Setelah para pembaca menelaah secara
seksama penjelasan yang lumayan panjang diatas, tentunya bisa jadi malah tambah
pusing. Maka bukan maksud untuk menyepelekan tulisan yang diatas, lupakanlah
atau simpan saja hasil bacaan anda diatas. Secara mudahnya saya coba simpulkan
dari kaca mata orang yang awam ilmu statistik. Yaitu sebagai berikut:
1.
Partial
Least Square adalah analisis yang fungsi utamanya untuk perancangan model,
tetapi juga dapat digunakan untuk konfirmasi teori.
2.
PLS tidak
butuh banyak syarat atau asumsi seperti SEM. Apa itu SEM nanti akan saya
jelaskan lebih lanjut pada artikel lainnya.
3.
Fungsi
Partial Least Square kalau dikelompokkan secara awam ada 2, yaitu inner model
dan outer model. Outer model itu lebih kearah uji validitas dan
reliabilitas. Sedangkan inner model itu lebih kearah regresi yaitu untuk
menilai pengaruh satu variabel terhadap variabel lainnya.
4.
Kecocokan
model pada Partial Least Square tidak seperti SEM yang ada kecocokan global,
seperti RMSEA, AGFI, PGFI, PNFI, CMIN/DF, dll. Dalam PLS hanya ada 2 kriteria
untuk menilai kecocokan model, yaitu kecocokan model bagian luar yang disebut
dengan outer model dan kecocokan bagian dalam yang disebut dengan inner model.
Sehingga maksud poin 3 diatas adalah menjelaskan poin 4 ini. Untuk kecocokan
model bagian luar ada 2 yaitu pengukuran reflektif dan pengukuran formatif,
yang sudah dijelaskan diatas.
5.
Penilaian
kecocokan model bagian luar atau outer model antara lain: Reliabilitas dan
validitas variabel laten reflektif dan validitas variabel laten formatif.
6.
Penilaian
kecocokan model bagian dalam antara lain: Penjelasan varian variabel laten
endogenous, ukuran pengaruh yang dikontribusikan dan relevansi dalam prediksi.
Setelah
membaca semua penjelasan partial least square diatas, tentunya para pembaca
bertanya-tanya: seperti apakah sih bentuk nyata dari penilaian kecocokan model,
yang terdiri dari outer dan inner model tersebut? Untuk itu akan kami bahas
dalam artikel selanjutnya tentang PLS SEM: Pengukuran Kecocokan Model (Inner Model dan
Outer Model).
Demikian
diatas sedikit pengantar atau penjelasan dari analisis Partial Least Square.
Kami akan terus membuat berbagai macam artikel yang berkaitan dengan Partial
Least Square ini sampai ke contoh Partial Least Square dalam pengujiannya
menggunakan software seperti smartPLS.
Komentar
Posting Komentar