16
GD4113 - Statistik Spasial B. Setyadji, September 2006 Variabel-variabel regional Pemodelan variabel-variabel regional Model Genetik Pemodelan ini adalah pemodelan yang paling intuitif, yaitu memodelkan asal-usul (genesis) sebuah fenomena. Pemodelan genetis ini, bila berhasil terbentuk, akan memberikan model korelasi spasial yang paling mendekati keadaan yang sebenarnya. Walaupun, dalam prakteknya, seringkali sulit atau terlalu rumit untuk membuat model (analitis) semua komponen yang terlibat. Contoh, pemodelan matematis proses-proses pengendapan (sedimentasi). Pemodelan menjadi sulit karena hubungan geologi antara reservoir dan deposit terlalu rumit dan belum terpecahkan secara lengkap, paling tidak sampai saat ini. – Typeset by Foil T E X 1

gd4113-3

Embed Size (px)

DESCRIPTION

variogram

Citation preview

Page 1: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

Variabel-variabel regional

Pemodelan variabel-variabel regional

• Model GenetikPemodelan ini adalah pemodelan yang paling intuitif, yaitu memodelkanasal-usul (genesis) sebuah fenomena. Pemodelan genetis ini, bila berhasilterbentuk, akan memberikan model korelasi spasial yang paling mendekatikeadaan yang sebenarnya. Walaupun, dalam prakteknya, seringkali sulitatau terlalu rumit untuk membuat model (analitis) semua komponenyang terlibat. Contoh, pemodelan matematis proses-proses pengendapan(sedimentasi). Pemodelan menjadi sulit karena hubungan geologi antarareservoir dan deposit terlalu rumit dan belum terpecahkan secara lengkap,paling tidak sampai saat ini.

– Typeset by FoilTEX – 1

Page 2: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

• Permukaan kecenderungan (trend surfaces)Asumsi implisit yang mendasari metoda regresi ini adalah bahwapermukaan yang dikaji dapat diwakili - minimal secara lokal - denganfungsi deterministik yang sangat sederhana seperti polinom, ditambahsatu komponen kesalahan acak. ”Acak” disini artinya adalah kesalahantersebut tidak berkorelasi dari satu tempat ke tempat lain dantidak bergantung pada fungsinya. Kelemahan dari sistem ini adalahseringkali model persamaan untuk fungsi permukaannya sangat rumit danmengandung berbagai operator seperti sinus, cosinus, dan eksponensial.

• GeostatistikVariabel teregionalisasi (regionalized variables) dirilis oleh Matheron(1963, 1965) untuk menjelaskan dua aspek yang kontradiksi, yaitu:

1. Aspek acak (random aspect) untuk menjelaskan ketidakteraturanlokal, dan

– Typeset by FoilTEX – 2

Page 3: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

2. Aspek ter-struktur (structured aspect) yang menggambarkankecenderungan sekala besar.

– Typeset by FoilTEX – 3

Page 4: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

Fungsi-fungsi Acak (Random Functions)

• Nilai pengamatan dari setiap titik data x dikenal sebagai outcome, z(x),dari satu variabel acak, Z(x). Nilai menengahnya (mean) disebut sebagaidrift, m(x). Pada titik/lokasi dimana tidak dilakukan pengukuran nilaiz(x) dapat ditentukan dengan tepat (well defined) walaupun (nilainya)tidak diketahui. Nilai-nilai ini dapat juga dikatakan sebagai sebuahoutcomes atau ralisasi dari variabel acak Z(x) yang berkaitan.

• Dalam pengertian matematik, kelompok seluruh variabel acak disebutsebagai fungsi acak. (Sinonim: proses stokastik (stochastic process),medan acak (random field)).

• Sebuah fungsi acak membentuk hubungan yang sama dengan salah saturealisasinya sebagai variabel acak ke salah satu dari outcomes, kecuali

– Typeset by FoilTEX – 4

Page 5: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

bahwa realisasi sebuah fungsi acak adalah sebuah fungsi yang outcomevariabel acaknya adalah sebuah bilangan.

• Fungsi acak dikenali dari karakteristiknya yang terdistibusi dalam dimensiterbatas, yaitu dengan distribusi gabungan dari suatu himpunan variabel-variabel Z(x1), Z(x2), . . . , Z(xk), untuk seluruh k, dan untuk seluruhtitik x1, x2, . . . , xk.

• Hampir mustahil untuk melakukan sesuatu dengan model seperti ini,kecuali ada/diberikan sejumlah asumsi tentang karakteristik distribusisemacam ini.

• Contoh variabel-variabel yang dapat dimodelkan dengan fungsi acak:

– Grade logam, untuk logam-logam mulia, uraniim, logam-logam dasar,batubara, berlian, pasir pantai, mineral-mineral industri.

– Typeset by FoilTEX – 5

Page 6: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

– Parameter-parameter kualitas, misalnya untuk bijih besi, silika,alumina.

– Variabel-variabel topografi misalnya ketebalan batas, ketebalantimbunan, kedalaman ke horison geologi, posisi dasar laut, dsb.

– Indikator jenis batuan.– Porositas dan permeabilitas batuan.– Konsentrasi elemen-elemen jejak geokimia dalam sampel tanah.– Konsentrasi polutan dalam tanah, air dan atmosfir.– dll

– Typeset by FoilTEX – 6

Page 7: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

Stasioner dan Hipotesa intrinsik

Dalam statistik, biasa digunakan asumsi bahwa sebuah variabel adalahstasioner, yaitu distribusinya invarian bila ditranslasikan. Dengan asumsiini, fungsi acak stasioner adalah homogen dan mengulang dirinya sendiridalam ruang.

Untuk setiap peningkatan sebesar h, distribusi Z(x1), Z(x2), . . . , Z(xk)akan sama dengan Z(x1 + h), Z(x2 + h), . . . , Z(xk + h)

Karena yang digunakan hanya sampel saja, maka biasanya hanyadiperlukan dua momen pertama (nilai menengah dan kovariansi) saja yangkonstan. Cara ini disebut sebagai stasioner orde kedua atau “weak”

Nilai ekspektasi dari Z(x) harus konstan untuk semua titik-titik x, yaitu

E(Z(x)) = m(x) = m

– Typeset by FoilTEX – 7

Page 8: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

Kedua, fungsi kovariansi antara dua titik (mana saja) x dan x+h hanyatergantung pada vektor h saja, tidak tergantung pada posisi x. Yaitu

E [Z(x) Z(x + h)]−m2 = C(h)

Hipotesa intrinsik (Matheron, 1963, 1965) mengasumsikan bahwapeningkatan fungsi adalah stasioner lemah: ada nilai menengah dan variansiuntuk peningkatan X(x + h)− Z(x) dan tidak tergantung pada titik x.

E [Z(x + h)− Z(x)]

Var [Z(x + h)− Z(x)] = 2γ(h)

Fungsi γ(h) ini yang disebut sebagai “semi-variogram” (atau variogramsaja). Variogram ini adalah “basic tool” untuk interpretasi secara struktural,misalnya untuk estimasi, mengenai fenomena tertentu.

Variabel teregionalisasi yang stasioner selalu memenuhi hipotesa intrinsik

– Typeset by FoilTEX – 8

Page 9: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

(tetapi tidak perlu berlaku sebaliknya). Jika variabel teregionalisasi stasionermaka ada kesamaan antara variogram (γ(h)) dengan kovariansi (C(h)) nya.

Hampir semua estimator yang digunakan dalam ilmu-ilmu kebumianadalah kombinasi linier (a.k.a weighted moving averages) dari data yangdiberikan. Sehingga penting sekali untuk dapat menghitung variansikombinasi linier tersebut dalam bentuk variogram dan/atau kovariansi.Berlawanan dengan kasus stasioner, bilamana bekerja dengan variabel-variabel intrinsik maka operasi-operasi yang dilakukan didefinisikan hanyauntuk perubahan (increment).

– Typeset by FoilTEX – 9

Page 10: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

Menentukan Variabel Stasioner

Dalam prakteknya, variogram hanya digunakan sampai jarak tertentu.Dan bagian tersebut bisa saja merupakan perpanjangan dari sebuah zonahomogen alam sebuah deposit, sehingga fenomena ini hanya stasioner dalambatas bagian tersebut. Permasalahannya: Bagaimana menentukan apakahdapat ditemukan satu deretan data disekitar bagian itu yang nilai ekspektasidan variogramnya dapat dikatakan konstan dana dimana dapat ditemukancukup data yang bisa memberikan estimasi berarti.

Asumsi “quasi-stasioner” ini adalah salah satu jalan tengah antara sekalahomogenitas fenomena dengan kerapatan samplingnya.

– Typeset by FoilTEX – 10

Page 11: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

Fungsi Kovariansi Spasial

Kovariansi C dan korelasi R antara Z(s) dan Z(t) untuk dua titik dapatdidefinisikan sebagai:

C(s, t) = E [{Z(s)− E(Z(s))} {Z(t)− E(Z(t))}]

R(s, t) = C(s, t)/√

C(s, s)C(t, t)

Sifat homogenitas, mengakibatkan C dan R tergantung hanya padavektor h dari s ke t, dan karena isotropik hanya tergantung pada d(s, t).

Sifat-sifat dasar kovariansi spasial:

• C(0) = σ2

• C(h) = C(−h)

– Typeset by FoilTEX – 11

Page 12: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

• |C(h)| ≤ C(0)

Catatan: nilai absolut muncul di persamaan terakhir karena kovariansidapat berupa nilai negatif.

Hubungan dasar antara variogram dengan kovariansi adalah:

λ(h) = C(0)− C(h)

yang dapat dibuktikan sebagai berikut:

2λ(h) = E[{Z(x + h)− Z(x)}2

]= E

[(Z(x + h))2 + (Z(x))2 − 2(Z(x + h))(Z(x))

]= 2C(0)− 2C(h)

– Typeset by FoilTEX – 12

Page 13: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

dapat dikatakan juga bahwa kovariansi diperoleh dengan membalik kurvavariogram.

Hubungan tersebut hanya dapat dilakukan apabila variogram-nya terbataspada nilai atas tertentu. Secara matematis dapat dilihat bahwa variogramdengan batas atas berasal dari variabel teregionalisasi. Lebih tepatlagi apabila dikatakan bahwa hanya variable teregionalisasi yang memilikivariogram terbatas.

Sebagai konsekwensinya, variogram tanpa batas (unbounded variograms)berasal dari variabel-variabel teregionalisasi intrinsik atau yang tidakstasioner.

Akhirnya bisa dibuktikan bahwa

limh→∞

γ(h)h2

= 0

– Typeset by FoilTEX – 13

Page 14: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

artinya, jika variogram meningkat lebih cepat daripada sebuah bentukkuadratik untuk nilai h yang besar, maka variabelnya adalah non-stasioner.Kebalikan dari itu adalah variabel tersebut stasioner atau intrinsik.

– Typeset by FoilTEX – 14

Page 15: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

Menyatakan variansi dalam bentuk kovariansi

Salah satu “kunci” dalam geostatistik adalah menyatakan variansi sebagaisebuah kombinasi linier (rata-rata dengan pembobotan, a weighted average)sejumlah pembobotan dan fungsi kovariansi, dan akhirnya variogram.

Pilih Z(x) adalah fungsi acak yang stasioner. Kovariansi spasialnyadinyatakan dengan C(h). Tetapkan Z∗ sebagai rata-rata denganpembobotan dari nilai-nilai pada dua titik:

Z∗ = λ1Z(x1) + λ2Z(x2)

dimana λ1 dan λ2 adalah dua faktor pembobotan dan x1 dan x2 adalahnilai kedua titik.

Berapakah nilai ekspektasi dari Z∗ tersebut? Nyatakan variansinyadalam bentuk faktor pembobotan dan kovariansi C(h).

– Typeset by FoilTEX – 15

Page 16: gd4113-3

GD4113 - Statistik Spasial B. Setyadji, September 2006

Z∗∗ =∑

i

λi Z(Xi)

Nilai ekspektasi untuk Z∗∗

Var (Z∗∗) =∑

i

λ2i Var(Z(xi)) + 2 ·

∑i

∑j>i

λi λj C(xi − xj)

=∑

i

∑j

λi λj C(xi − xj)

next → variogram

– Typeset by FoilTEX – 16