Kerangka Kerja Pemodelan Geostatistik dan Implementasinya pada Platform Agroteknologi Tanam Sehat
SoilGrids adalah sistem global yang memprediksi properti tanah menggunakan kerangka kerja Pemetaan Tanah Digital (Digital Soil Mapping). Metodologi ini berlandaskan pada model konseptual bahwa variasi spasial properti tanah adalah fungsi dari faktor-faktor pembentuk tanah yang dapat diukur atau diestimasi. Model ini dikenal sebagai SCORPAN.
Hubungan fungsional antara properti tanah (\(S\)) dan faktor-faktor pembentuknya dinyatakan sebagai:
$$ S = f(s, c, o, r, p, a, n) $$
Di mana \(f\) adalah fungsi non-linear yang dipelajari oleh model machine learning, dan variabelnya adalah: soil (properti tanah lain), climate (iklim), organisms (organisme/vegetasi), relief (topografi), parent material (bahan induk), age (umur), dan n (posisi spasial).
Faktor-faktor SCORPAN direpresentasikan secara kuantitatif oleh lapisan-lapisan data geospasial yang disebut kovariat lingkungan. SoilGrids menggunakan lebih dari 150 kovariat global, termasuk:
SoilGrids mengimplementasikan model SCORPAN dengan melatih algoritma Quantile Regression Forests (QRF). Data observasi titik dari basis data global WoSIS (World Soil Information Service) digunakan sebagai data latih. Model QRF memetakan hubungan antara data titik ini dengan lapisan-lapisan data kovariat, dan tidak hanya memprediksi nilai rata-rata, tetapi juga distribusi kuantil dari prediksi, yang memungkinkan kuantifikasi ketidakpastian.
Kualitas prediksi SoilGrids sangat bergantung pada alur kerja data yang terstandarisasi dan densitas data observasi lapangan yang menjadi dasar pelatihan model.
Diagram ini mengilustrasikan proses dari akuisisi data tanah mentah dari berbagai penyedia, proses kurasi dan standarisasi oleh ISRIC, hingga diseminasi melalui berbagai kanal, di mana salah satu produk utamanya adalah SoilGrids.
Peta ini menunjukkan sebaran spasial dari ratusan ribu titik profil tanah dalam basis data WoSIS. Kepadatan titik data ini secara langsung memengaruhi reliabilitas dan akurasi prediksi SoilGrids di suatu wilayah.
Setiap properti tanah yang disajikan oleh Tanam Sehat memiliki dasar fisika, kimia, dan biologis yang kompleks. Berikut adalah dekomposisi kuantitatif dari parameter-parameter kunci tersebut.
pH tanah adalah ukuran logaritmik dari aktivitas ion hidrogen (\(H^+\)) dalam larutan tanah, yang secara fundamental mengontrol kelarutan unsur hara dan toksisitas elemen seperti Aluminium (\(Al^{3+}\)).
$$ pH = -\log_{10}(a_{H^+}) $$
Di mana \(a_{H^+}\) adalah aktivitas ion hidrogen. Pada tanah masam (\(pH < 5.5\)), kelarutan \(Al^{3+}\) meningkat secara eksponensial, menjadi toksik bagi perakaran tanaman.
KTK adalah kuantifikasi dari total muatan negatif pada permukaan koloid tanah (liat dan bahan organik) yang mampu menjerap kation-kation hara (\(Ca^{2+}, Mg^{2+}, K^+, NH_4^+\)) dan mencegahnya dari pencucian.
$$ KTK_{total} = KTK_{liat} + KTK_{organik} = \sum_{i=1}^{n} (\%Liat_i \cdot KTK_i) + (\%BO \cdot KTK_{BO}) $$
KTK tanah adalah jumlah terbobot dari KTK masing-masing fraksi liat (tergantung mineraloginya) dan KTK bahan organik (\(BO\)), yang nilainya bisa mencapai 200 cmol(+)/kg.
C-organik adalah tulang punggung kesuburan tanah, dan Nitrogen total sangat erat kaitannya melalui rasio C:N. Kepadatan stok karbon organik (\(OCD\)) mengkuantifikasi jumlah C-organik per unit volume.
$$ N_{total} \approx \frac{C_{organik}}{Rasio_{C:N}} \quad ; \quad OCD~(kg/m^3) = \frac{C_{org}~(g/kg) \cdot \rho_b~(g/cm^3) \cdot (100 - \%FK)}{100} $$
Di mana \(Rasio_{C:N}\) umumnya berkisar 10-12, \(\rho_b\) adalah bobot isi tanah, dan \(FK\) adalah fragmen kasar.
Distribusi ukuran partikel (Particle Size Distribution - PSD) menentukan kelas tekstur tanah. Sifat hidrolik tanah, seperti konduktivitas hidrolik jenuh (\(K_{sat}\)), sangat bergantung pada tekstur. Model seperti persamaan Rosetta sering digunakan untuk memprediksi parameter hidrolik dari data tekstur.
$$ K_{sat} = f(\%Pasir, \%Debu, \%Liat, \rho_b) $$
Fungsi \(f\) ini adalah fungsi pedotransfer yang sangat non-linear, yang memetakan properti dasar ke properti hidrolik yang kompleks.
Bobot isi adalah indikator kepadatan dan porositas tanah. Porositas (\(\phi\)), ruang pori yang tersedia untuk air dan udara, berbanding terbalik dengan bobot isi. Fragmen kasar mengurangi volume efektif tanah.
$$ \rho_b = \frac{Massa_{kering}}{Volume_{total}} \quad ; \quad \phi (\%) = \left(1 - \frac{\rho_b}{\rho_p}\right) \times 100 $$
Di mana \(\rho_p\) adalah densitas partikel, yang diasumsikan ~2.65 g/cm³. Porositas yang rendah (\(\rho_b\) tinggi) akan menghambat infiltrasi air dan penetrasi akar.
Akurasi dan reliabilitas peta SoilGrids dievaluasi secara statistik menggunakan prosedur validasi silang (cross-validation) yang ketat.
Data observasi WoSIS secara acak dibagi menjadi \(k\) himpunan (biasanya 5 atau 10). Model dilatih pada \(k-1\) himpunan dan diuji pada himpunan yang tersisa. Proses ini diulang \(k\) kali, sehingga setiap observasi digunakan untuk pengujian tepat satu kali. Ini memberikan estimasi kinerja model yang tidak bias pada data yang belum pernah dilihat sebelumnya.
Kinerja model diukur menggunakan beberapa metrik statistik:
Koefisien Determinasi (\(R^2\)): \( R^2 = 1 - \frac{\sum_{i=1}^{n}(y_i - \hat{y}_i)^2}{\sum_{i=1}^{n}(y_i - \bar{y})^2} \)
Mengukur proporsi varians dalam data observasi (\(y_i\)) yang dapat dijelaskan oleh model (\(\hat{y}_i\)). Nilai \(R^2\) berkisar antara 0.6–0.8 untuk banyak properti, yang menunjukkan kinerja yang kuat untuk skala global.
Root Mean Square Error (RMSE): \( RMSE = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2} \)
Mengukur magnitudo rata-rata dari galat prediksi dalam unit asli properti tanah. RMSE yang rendah menunjukkan akurasi yang tinggi.
Aplikasi Tanam Sehat berfungsi sebagai klien yang mengintegrasikan data dari SoilGrids, melakukan analisis agronomis, dan menyajikannya dalam format yang dapat ditindaklanjuti.
Output model berbentuk grid. Saat pengguna memilih koordinat (\(\phi, \lambda\)), aplikasi melakukan kueri untuk mengekstrak nilai dari piksel yang bersesuaian. Untuk akurasi sub-piksel, metode interpolasi bilinear dapat digunakan untuk mengestimasi nilai berdasarkan empat titik grid terdekat.
Aplikasi mengimplementasikan model kuantitatif untuk menghitung Indeks Kualitas Tanah. Indeks ini merupakan fungsi skor berbobot (\(w\)) yang disesuaikan berdasarkan kebutuhan spesifik tanaman: $$ I_{kualitas} = \frac{\sum_{i=1}^{n} w_i \cdot f_i(v_i)}{\sum_{i=1}^{n} w_i} $$ Di mana \(f_i(v_i)\) adalah fungsi skor (0-10) untuk properti tanah ke-\(i\) (\(v_i\)), yang memetakan nilai properti ke tingkat kesesuaiannya.
Data kuantitatif yang telah diproses (misalnya, pH=5.2, KTK=15 cmol/kg) disusun menjadi sebuah prompt terstruktur untuk Google Gemini API. LLM menerjemahkan data numerik ini menjadi wawasan kualitatif, misalnya "Tanah bersifat masam dengan kapasitas retensi hara sedang, berisiko toksisitas Al dan pencucian K."