Sedang memuat data...
11 Nov 2024

PERFORMA RANDOM FOREST GROUPUNTUK KLASIFIKASI PENYAKIT BUSUK PANGKAL BATANG YANG DISEBABKAN OLEH Ganoderma boninense PADA PERKEBUNAN KELAPA SAWIT

Pemanfaatan teknik penginderaan jauh sudah banyak dimanfaatkan untuk kajian penyakit busuk pangkal batang (BPB) di perkebunan kelapa sawit. Performa klasifikasi dapat ditingkatkan dengan memanfaatkan machine learning algorithms. Identifikasi sejak awal serangan penyakit BPB merupakan kunci dalam penanganan secara kultur teknis yang ditujukan untuk memperpanjang umur produksi tanaman. Pemilihan model klasifikasi yang memanfaatkan machine learning algorithms akan mempengaruhi akurasi dan waktu proses klasifikasi. Random Forest (RF) dari hasil beberapa penelitian menunjukkan model klasifikasi dengan performa akurasi yang tinggi dalam klasifikasi penyakit BPB ini. Model klasifikasi RF saat ini memiliki 15 varian yang dikembangkan oleh para peneliti.Penelitian ini bertujuan untuk membandingkan akurasi dan kecepatan fitting model dari 15 metode klasifikasi random forest group dalam mengidentifikasi penyakit BPB diperkebunan kelapa sawit. penelitian ini menggunakan analisis deskriptif berdasarkan hasil akurasi dan kecepatan fitting model dari 15 metode klasifikasi. Hasil penelitian ini menunjukkan model klasifikasi Oblique Random Forest (ORF) dengan metode Partial Least Squares (PLS) mempunyai akurasi dan nilai Kappa terbaik (0,914 dan 0,815) dan model Random Ferns (RFerns) sebagai model klasifikasi dengan akurasi dan nilai Kappa yang terendah (0,657 dan 0,334). Model RF rule-based model (rlb) memerlukan waktu terlama dalam fitting model yaitu 12.993,23 detik dan model Parallel Random Forest (PRF) memerlukan waktu tersingkat yaitu 13,54 detik. Pencapaian akurasi dan waktu yang diperlukan untuk fitting model menjadi pertimbangan dalam pemilihan model klasifikasi untuk tanaman sehat dan tanaman terinfeksi penyakit BPB karena jamur Ganoderma.

Teknik penginderaan jauh dan machine learning algorithms dalam identifikasi dan pemetaan sebaran tanaman yang sehat dan terinfeksi penyakit BPB memberikan akurasi yang baik serta hasil pemetaan tanaman sakit dan terinfeksi penyakit BPB yang baik mengingat sebaran tanaman yang terinfeksi BPB berada disekitar tanaman yang sudah mati karena infeksi penyakit BPB tersebut (Santosoetal., 2017, 2018). Dan Machine learning algorithms sudah banyak dimanfaatkan dalam kajian penginderaan jauh baik yang memanfaatkan data dari hasil perekaman sistem aktif maupun pasif (Behmann, Mahlein, Rumpf, Römer, & Plümer, 2015 ; Crawford, Tuia, & Yang, 2013; Kimetal., 2014 ;Omer, Mutanga, Abdel-Rahman, & Adam, 2016 ; Santoso, Tani, Wang, Prasetyo, & Sonobe, 2018 ; Uhlmann, Kiranyaz, & Gabbouj, 2014 ; Wieland & Pittore, 2014). RF merupakan model klasifikasi hirarki yang dibangun dari banyak Decision Tree (DT) dari ensemble atau learning algorithms yang di surpevisi, setiap tree akan memberikan hasil klasifikasi (klas) dari variabel yang dimasukan sebagai input dan membentuk sebuah forest, dan forest akan memilih klas mayoritas dari seluruh tree yang ada di forest tersebut – (Breiman, 2001). Seiring dengan perkembangan pemanfaatan machine learning dalam analisis data, beberapa model klasifikasi yang pengembangannya didasarkan pada model klasifikasi RF telah dihasilkan oleh para peneliti seperti yang disampaikan oleh Kuhn(2019).

Beberapa metode klasifikasi yang didasarkan model klasifikasi RF menurut Kuhn (2019) meliputi Oblique Random Forest (ORF) dengan metode Partial Least Squares (PLS), Regularized Random Forest (RRF) dengan metode RRF, Parallel Random Forest (PRF) dengan metode parRF, Random Forest by randomization (RFr) dengan metode extra Trees, Weighted Subspace Random Forest (WSRF) dengan metode wsrf, Conditional Inference Random Forest (CIRF) dengan metode cforest, regularized random forest (RRFg) dengan metode RRF global, oblique random forest (ORFl) dengan metode ORFlog, random forest ranger (RFrg) dengan metode ranger, random forest (RFrb) dengan metode Rborist, oblique random forest (ORFrg) dengan metode ORFridge, random forest (RFrlb) dengan metode rule-based model (rfRules), oblique random forest (ORFsvm) dengan metode ORFsvm, dan random Ferns (rFerns) dengan metoder Ferns. Masing-masing model klasifikasi tersebut tentunya akan mempengaruhi waktu dalam fitting model dan akurasi klasifikasinya.

Dalam pembangunan tree dalam RF didasarkan pada metode pemilihan split vektor independen secara acak (random split selection)dan melakukan klasifikasi pada semua tree (Breiman, 2001). RF didasarkan pada banyak DT, sedangkan perbedaan tipe pemecahan data (split) pada DT meliputi orthogonal, oblique, dan rotation memberikan beberapa turunan model klasifikasi RF. Model klasifikasi tersebut adalah RF, ORF, dan rotation Random Forest (rotRF) dengan model pemecahan (split) data berupa ridge regression, Partial Least Squares (PLS), Support Vector Machine (SVM), dan lainnya(Breiman, 2001 ; Menze, Kelm, Splitthoff, Koethe, & Hamprecht, 2011 ; Poona, van Niekerk, & Ismail, 2016). Perbandingan antar model klasifikasi ini dilakukan di perangkat lunak (software) R dengan caret package. Dalam proses fitting model, digunakan parameter Cross-Validation (CV) dengan jumlah iterasi (perulangan) resampling sebanyak 10 kali dan jumlah CV sebanyak 10 dan preprocessing data berupa scale (masing-masing data yang dibagi dengan nilai standar deviasi) dan center (masing-masing data dikurangi nilai rata-rata seluruh data). Penerapan CV ini dimaksudkan untuk menghindari overfitting (Kuhn, 2008, 2016). Pembagian data untuk training datase banyak 75%dan testing data sebanyak 25% (Liaghat et al., 2014).

15 model klasifikasi dengan perbedaan utama dalam tipe split dalam DT dan model pemecahan node (the node splitting models) dengan parameter masing-masing model klasifikasi sebagai berikut:

Klasifikasi tanaman kelapa sawit yang sehat dan terinfeksi penyakit BPB dengan menggunakan machine learning sangat dipengaruhi oleh variable yang digunakan untuk fitting model. Distribusi data setiap kelas (H dan UH) pada masing-masing variable dalam kajian ini berupa empat band dari citra QuickBird memberikan gambaran relatif sulit membedakan tanaman yang sehat (H) dan terinfeksi penyakit BPB (UH). Data boxplot nilai pixel citra QuickBird pada penelitian ini lebih baik jika dibandingkan dengan penelitian Santoso et al., (2018), sehingga akurasi klasifikasi lebih baik pada penelitian ini. Scatterplot matrik menunjukkan data yang saling overlap antara tanaman kelapa sawit H dan UH, sehingga dapat digunakan untuk menguji model klasifikasi terkait performa akurasi klasifikasi seperti yang dilakukan pada penelitian ini.

Berdasarkan pencapaian akurasi klasifikasi dan nilai Kappa, ORF dengan metode PLS sebagai model split dalam DT sebagai model terbaik walaupun diperlukan waktu 920,59 detik untuk fitting model. Akurasi klasifikasi pada mode lRF dan RRF sama dengan model ORF namun nilai Kappa yang lebih kecil 0,009 dibandingkan nilai Kappa pada model ORF. Namun, waktu untuk fitting model pada ORF > RRF > RF yang lamanya berturut-turut sebesar 920,59,107,75, dan 15,29 detik. Model ORF secara efisien memilih satu variable dalam fitting model dengan metode PLS yang secara fungsinya mengurangi dimensi data yaitu menghilangkan data yang tidak relevandan pengulangan penggunaan variable serta memperbaiki kualitas data untuk strategi pengorganisasian data yang lebih efisien (Dhage & Raina, 2016).

Hasil penelitian ini menunjukkan model klasifikasi ORF dengan metode PLS merupakan model dengan akurasi dan nilai Kappa terbaik (0,914 dan 0,815), sedangkan model Rferns sebagai model klasifikasi dengan akurasi dan nilai Kappa yang terendah (0,657 dan 0,334). Model RFrlb memerlukan waktu untuk fittingmodel terlama (12.993,23 detik), sedangkan model PRF memerlukan waktu tersingkat (13,54 detik). Pencapaian akurasi dan waktu yang diperlukan untuk fitting model menjadi pertimbangan dalam pemilihan model klasifikasi tanaman sehat dan tanaman terinfeksi penyakit BPB yang disebabkan oleh jamur Ganoderma.

Heri Santoso 10 November 2020, View of Performance of Random Forest Group for Basal Stem Rot Disease Classification Caused by Ganoderma boninense in Oil Palm Plantation

Other Article

image
EKSPLORASI PENDUGAAN HARA DAUN TANAMAN KELAPA SAWIT MENGGUNAKAN PESAWAT TANPA AWAK DAN KAMERA MULTISPEKTRAL

Rekomendasi pemupukan umumnya disusun setiap tahun untuk mengkoreksi kebutuhan hara tanaman melalui kegiatan pemupukan. Hara da ...

image
PEMETAAN KANDUNGAN HARA DAUN KELAPA SAWIT MENGGUNAKAN CITRA MULTISPEKTRAL BERBASIS UNMANNED AERIAL VEHICLE

Kecukupan hara merupakan salah satu faktor yang sangat berpengaruh terhadap produktivitas kelapa sawit. Umumnya, pemenuhan kecu ...

image
Peningkatan Akurasi Identifikasi Penyakit Busuk Pangkal Batang di Perkebunan Kelapa Sawit Menggunakan Unmanned Aerial Vehicle(UAV) dan Machine Learning

Penyakit busuk pangkal batang (BSR) pada tanaman kelapa sawit yang disebabkan oleh jamur Ganoderma sp sampai saat ini masih men ...