Metode grafis untuk studi statistik hubungan. Studi statistik tentang hubungan

Mengirimkan karya bagus Anda ke basis pengetahuan itu sederhana. Gunakan formulir di bawah ini

Pelajar, mahasiswa pascasarjana, ilmuwan muda yang menggunakan basis pengetahuan dalam studi dan pekerjaan mereka akan sangat berterima kasih kepada Anda.

Dokumen serupa

    Subjek dan metode statistik. Esensi dan aspek utama observasi statistik. Seri distribusi. Tabel statistik. Nilai-nilai mutlak. Indikator variasi. Konsep deret waktu statistik. Perbandingan dalam deret dinamika.

    lembar contekan, ditambahkan 26/01/2009

    Pertimbangan proses audit di departemen akuntansi suatu perusahaan oleh otoritas pajak dari sudut pandang pengamatan statistik. Pemilihan nilai statistik absolut dari data awal. Penyajian data statistik. Nilai rata-rata. Indikator variasi.

    tes, ditambahkan 28/05/2015

    Indikator statistik absolut dan relatif, metode peramalan. Hukum distribusi probabilitas variabel acak diskrit. Perkiraan parameter populasi. Kajian statistik potensi sosial ekonomi.

    lembar contekan, ditambahkan 16/05/2012

    Nilai rata-rata dan indikator variasi. Indeks agregat volume fisik massa komoditas. Pengelompokan data statistik. Indeks biaya unit individual dan konsolidasi. Indikator rangkaian dinamika. Perhitungan biaya perolehan aset tetap.

    tes, ditambahkan 06/04/2015

    Nilai statistik absolut dan relatif. Konsep dan prinsip penggunaan nilai rata-rata dan indikator variasi. Aturan penggunaan mean aritmatika dan bobot harmonik. Koefisien variasi. Penentuan dispersi dengan metode momen.

    tutorial, ditambahkan 23/11/2010

    Subjek dan metode statistik. Pengelompokan dan distribusi baris. Nilai absolut, relatif, rata-rata, indikator variasi. Contoh observasi, deret waktu. Dasar-dasar analisis korelasi dan regresi. Statistik populasi dan pasar tenaga kerja.

    manual pelatihan, ditambahkan 16/02/2011

    Ringkasan dan pengelompokan bahan observasi statistik. Nilai absolut, relatif dan rata-rata, indikator variasi. Seri dinamis, analisis indeks. Melakukan analisis korelasi dan regresi tabel pemanenan dan pemupukan.

    tugas kursus, ditambahkan 14/05/2013

    Karakteristik umum badan penyediaan pensiun, organisasi kerja badan Dana Pensiun Federasi Rusia. Indikator statistik dan perhitungannya: nilai rata-rata, indikator variasi, rangkaian dinamika, indeks, analisis tren, pengelompokan.

    tugas kursus, ditambahkan 15/06/2010

Konsep dasar analisis korelasi dan regresi

Ketika mempelajari alam, masyarakat, dan ekonomi, perlu memperhitungkan keterkaitan proses dan fenomena yang diamati. Selain itu, kelengkapan uraian tersebut entah bagaimana ditentukan oleh ciri-ciri kuantitatif hubungan sebab-akibat di antara keduanya. Menilai faktor yang paling signifikan, serta dampak beberapa faktor terhadap faktor lainnya, adalah salah satu tugas utama statistik.

Bentuk-bentuk perwujudan hubungan sangat beragam. Sebagai dua tipe yang paling umum sorot fungsional(penuh) dan korelasi koneksi (tidak lengkap). Dalam kasus pertama, nilai karakteristik faktor berhubungan erat dengan satu atau lebih nilai fungsi. Seringkali, hubungan fungsional muncul dalam fisika dan kimia. Dalam ilmu ekonomi, contohnya adalah hubungan berbanding lurus antara produktivitas tenaga kerja dengan peningkatan produksi.

Hubungan korelasi (yang juga disebut tidak lengkap, atau statistik) muncul rata-rata, untuk pengamatan massal, ketika nilai-nilai tertentu dari variabel terikat sesuai dengan sejumlah nilai kemungkinan tertentu dari variabel bebas. Penjelasannya adalah kompleksitas hubungan antara faktor-faktor yang dianalisis, yang interaksinya dipengaruhi oleh variabel acak yang tidak terhitung. Oleh karena itu, hubungan antar tanda hanya muncul rata-rata, dalam banyak kasus. Dalam hubungan korelasi, setiap nilai argumen sesuai dengan nilai fungsi yang terdistribusi secara acak dalam interval tertentu.

Misalnya, sedikit peningkatan dalam argumen hanya akan menyebabkan peningkatan atau penurunan rata-rata (tergantung pada arah) fungsi, sedangkan nilai spesifik untuk unit observasi individual akan berbeda dari rata-rata. Ketergantungan seperti itu ditemukan dimana-mana. Misalnya, di bidang pertanian, hal ini dapat berupa hubungan antara hasil dan jumlah pupuk yang digunakan. Jelas, yang terakhir ini terlibat dalam pembentukan tanaman. Namun untuk setiap lahan atau plot tertentu, jumlah pupuk yang diberikan akan menyebabkan peningkatan hasil yang berbeda-beda, karena sejumlah faktor lain berinteraksi (cuaca, kondisi tanah, dll.), yang membentuk hasil akhir. Namun, rata-rata, hubungan seperti itu diamati - peningkatan massa pupuk yang diterapkan menyebabkan peningkatan hasil.



Menurut arah komunikasinya ada lurus, ketika variabel terikat meningkat seiring dengan meningkatnya atribut faktor, dan balik, dimana pertumbuhannya disertai dengan penurunan fungsi. Koneksi semacam itu juga bisa disebut positif dan negatif.

Mengenai bentuk analitisnya, koneksinya adalah linier Dan nonlinier. Dalam kasus pertama, hubungan linier muncul rata-rata antar karakteristik. Hubungan nonlinier dinyatakan dengan fungsi nonlinier, dan variabel-variabelnya berhubungan satu sama lain secara rata-rata nonlinier.

Ada karakteristik koneksi lain yang cukup penting dalam hal faktor-faktor yang berinteraksi. Jika hubungan antara dua sifat dicirikan, maka biasanya disebut ruang uap. Jika lebih dari dua variabel dipelajari − banyak.

Kriteria klasifikasi di atas paling sering ditemukan dalam analisis statistik. Tapi selain yang terdaftar, ada juga langsung tidak langsung Dan PALSU komunikasi. Sebenarnya esensi masing-masing sudah terlihat dari namanya. Dalam kasus pertama, faktor-faktor tersebut berinteraksi langsung satu sama lain. Koneksi tidak langsung ditandai dengan partisipasi beberapa variabel ketiga yang memediasi hubungan antara karakteristik yang diteliti. Koneksi palsu adalah koneksi yang dibuat secara formal dan, sebagai suatu peraturan, hanya dikonfirmasi oleh perkiraan kuantitatif. Hal ini tidak memiliki dasar kualitatif atau tidak ada artinya.

Bervariasi dalam kekuatan lemah Dan kuat komunikasi. Karakteristik formal ini dinyatakan dalam jumlah tertentu dan ditafsirkan sesuai dengan kriteria kekuatan hubungan yang diterima secara umum untuk indikator tertentu.

Dalam bentuknya yang paling umum, tugas statistika di bidang mempelajari hubungan adalah mengukur keberadaan dan arahnya, serta mengkarakterisasi kekuatan dan bentuk pengaruh beberapa faktor terhadap faktor lain. Untuk mengatasinya digunakan dua kelompok metode, yang satu meliputi metode analisis korelasi, dan yang lainnya meliputi analisis regresi. Pada saat yang sama, sejumlah peneliti menggabungkan metode ini ke dalam analisis korelasi-regresi, yang memiliki beberapa dasar: adanya sejumlah prosedur komputasi umum, saling melengkapi dalam interpretasi hasil, dll.

Oleh karena itu, dalam konteks ini, kita dapat berbicara tentang analisis korelasi dalam arti luas - ketika hubungan tersebut dikarakterisasi secara komprehensif. Pada saat yang sama, ada analisis korelasi dalam arti sempit - ketika kekuatan hubungan diperiksa - dan analisis regresi, di mana bentuk dan dampak beberapa faktor terhadap faktor lain dinilai.

Tugas-tugas itu sendiri analisis korelasi direduksi menjadi mengukur kedekatan hubungan antara berbagai karakteristik, menentukan hubungan sebab akibat yang tidak diketahui, dan menilai faktor-faktor yang memiliki pengaruh terbesar terhadap karakteristik yang dihasilkan.

Tugas analisis regresi terletak pada bidang penentuan bentuk ketergantungan, penentuan fungsi regresi, dan penggunaan persamaan untuk memperkirakan nilai-nilai yang tidak diketahui dari variabel terikat.

Pemecahan masalah ini didasarkan pada teknik, algoritma, indikator yang tepat, yang penggunaannya memberikan dasar untuk berbicara tentang studi statistik tentang hubungan.

Perlu dicatat bahwa metode korelasi dan regresi tradisional banyak terdapat dalam berbagai paket perangkat lunak statistik untuk komputer. Peneliti hanya dapat mempersiapkan informasi dengan benar, memilih paket perangkat lunak yang memenuhi persyaratan analisis dan siap untuk menginterpretasikan hasil yang diperoleh. Ada banyak algoritma untuk menghitung parameter komunikasi, dan saat ini hampir tidak disarankan untuk melakukan jenis analisis yang rumit secara manual. Prosedur komputasi merupakan kepentingan independen, namun pengetahuan tentang prinsip-prinsip mempelajari hubungan, kemungkinan dan keterbatasan metode tertentu dalam menafsirkan hasil merupakan prasyarat untuk penelitian.

Metode penilaian kekuatan suatu hubungan dibagi menjadi korelasi (parametrik) dan nonparametrik. Metode parametrik biasanya didasarkan pada penggunaan perkiraan distribusi normal dan digunakan dalam kasus di mana populasi yang diteliti terdiri dari nilai-nilai yang mematuhi hukum distribusi normal. Dalam praktiknya, posisi ini paling sering diterima secara apriori. Sebenarnya metode-metode ini bersifat parametrik dan biasa disebut metode korelasi.

Metode nonparametrik tidak memberikan batasan pada hukum distribusi besaran yang diteliti. Keuntungan mereka adalah kesederhanaan perhitungannya.

Bab 8. STUDI STATISTIK HUBUNGAN

8.1. Jenis fenomena sosial dan bentuknya

koneksi di antara mereka

Studi statistik tentang hubungan didasarkan pada asumsi adanya hubungan universal dan interaksi fenomena kehidupan sosial. Keterkaitan dan saling ketergantungan diamati ketika mempertimbangkan indikator kinerja suatu perusahaan. Misalnya, peningkatan produktivitas tenaga kerja berarti penurunan biaya per unit. Fenomena sosial (atau ciri-ciri individunya) yang mempengaruhi orang lain dan menyebabkan perubahannya disebut faktorial. Fenomena sosial (atau karakteristik individualnya) yang berubah di bawah pengaruh faktor faktor disebut efektif (indikator faktor adalah produktivitas tenaga kerja, dan biaya produksi adalah indikator efektif).

Berdasarkan sifat ketergantungan fenomena, dibedakan antara hubungan fungsional (lengkap) dan korelasi (tidak lengkap) di antara keduanya. Fungsional adalah hubungan di mana setiap nilai indikator faktor berhubungan dengan nilai yang sangat spesifik dari indikator yang dihasilkan. Ketergantungan fungsional banyak digunakan dalam ilmu eksakta. Adapun fenomena sosial berkembang di bawah pengaruh banyak faktor, yang pada gilirannya saling berinteraksi. Selain itu, diketahui secara pasti sejauh mana masing-masing hal tersebut mempengaruhi besarnya fenomena tersebut. Hubungan seperti ini disebut korelasi. Dalam korelasi antara sebab dan akibat, tidak ada korespondensi yang lengkap, tetapi hanya hubungan yang diketahui yang diamati. Setiap nilai indikator faktor berhubungan dengan sejumlah nilai karakteristik yang dihasilkan. Namun yang sangat penting, dengan adanya perubahan nilai karakteristik faktor maka nilai rata-rata karakteristik yang dihasilkan pun berubah.

Hubungan antar fenomena dapat diklasifikasikan menurut kriteria lain:

  • Dalam arah (maju, mundur).
  • Dengan ekspresi analitis (linier, nonlinier).
  • Menurut kedekatan hubungan atau derajat pendekatannya terhadap fungsional (kuat, lemah).

Hubungan antara dua sifat disebut korelasi berpasangan, pengaruh beberapa sifat faktor terhadap sifat yang dihasilkan disebut korelasi berganda.

8.2. Metode untuk mempelajari hubungan antara fenomena dan karakteristiknya

Studi tentang hubungan adalah tugas kognitif statistik yang paling penting, yang diselesaikan dengan bantuan metode khusus. Selain pengelompokan analitik, metode tersebut antara lain: metode perbandingan deret paralel, metode keseimbangan, dan metode berdasarkan ketentuan dan teorema statistika matematika (korelasi, faktor, dispersi).

Inti dari metode perbandingan seri paralel adalah ringkasan yang dihasilkan dan pengolahan materi disusun dalam baris paralel baik berdasarkan ruang maupun waktu. Kajian bersama rangkaian semacam ini memungkinkan untuk menelusuri hubungan dan arah perubahan karakteristik yang dibandingkan dari fenomena yang diteliti. Kondisi penting untuk memperoleh hasil yang dapat diandalkan dari penggunaan metode ini adalah deteksi awal hubungan sebab-akibat antara karakteristik yang diteliti.

Inti dari metode keseimbangan adalah mengkarakterisasi sumber daya dari fenomena yang diteliti dan distribusinya. Saldo yang paling sederhana adalah saldo sumber daya material pada perusahaan, yaitu: saldo awal periode analisis + penerimaan = pengeluaran + saldo akhir periode analisis. Jelaslah bahwa karena penerimaan dan pengeluaran sumber daya material harus sesuai (misalnya dalam kesetaraan), maka harus dijaga proporsionalitas tertentu antara bagian kanan dan kiri (elemen) keseimbangan di atas. Ciri-ciri proporsionalitas ini harus ditemukan dari hasil konstruksi neraca. Kemungkinan untuk mengkarakterisasi hubungan dan proporsi diperluas secara signifikan jika pendapatan di neraca dibagi berdasarkan sumber (pemasok), dan pengeluaran berdasarkan tujuan (pelanggan). Dalam hal ini, neraca akan menunjukkan hubungan tidak hanya antara penerimaan, pengeluaran dan saldo dalam perusahaan, tetapi juga antara perusahaan ini dengan perusahaan lain, beberapa di antaranya memasok sumber daya material, sementara yang lain mengkonsumsi produknya. Dengan menggunakan metode neraca, Anda dapat mempelajari perputaran tidak hanya material, tetapi juga sumber daya tenaga kerja, uang tunai, dan aset tetap.

Sehubungan dengan ciri-ciri ketergantungan korelasi yang ditunjukkan, metode mempelajari hubungan berdasarkan ketentuan statistik matematika menghadapi dua tugas:

1). mendeteksi ketergantungan ini pada materi faktual dan menetapkan ekspresi analitis dari hubungan tersebut;

2). mengukur kekuatan sambungan.

Untuk mengatasi masalah pertama, perlu dilakukan pemilihan faktor dan indikator kinerja, mengumpulkan materi faktual yang relevan, dan mengolahnya menggunakan konstruksi grafis.

Masalah kedua diselesaikan dengan menghitung koefisien korelasi dan parameter regresi.

Mari kita tunjukkan metode analisis korelasi dengan menggunakan contoh membangun hubungan erat antara indikator peralatan listrik tenaga kerja dan produktivitas tenaga kerja, jika tersedia materi faktual berikut:

Sekarang, untuk menyelesaikan masalah pertama, tinggal menentukan mana dari dua indikator yang dianalisis yang merupakan faktorial (X) dan mana yang efektif (Y), dan kemudian menyajikan hubungan di antara keduanya secara grafis. Terlihat jelas bahwa dari dua indikator yang dianalisis, tenaga listrik tenaga kerja merupakan salah satu faktornya, dan produktivitasnya merupakan indikator efektif. Oleh karena itu, dalam sistem koordinat persegi panjang, nilai yang pertama akan diplot sepanjang sumbu absis, dan nilai yang kedua sepanjang sumbu ordinat (lihat Gambar 3).

Beras. 3 Nilai faktor dan indikator kinerja

Seperti yang dapat dilihat dari Gambar. 3, nilai indikator efektif tidak terletak pada garis lurus yang menghubungkan nilai ekstrimnya, tetapi dalam bentuk “awan” yang memanjang sepanjang garis lurus tersebut. Ada teknik khusus yang memungkinkan Anda menemukan jenis ekspresi analitik suatu koneksi (garis lurus, hiperbola, parabola, dll.) yang paling sesuai dengan ketergantungan fungsional. Bentuk paling sederhana dari ketergantungan korelasi dinyatakan dengan persamaan y=a+bx, dimana, sehubungan dengan contoh yang kita pertimbangkan, y adalah tingkat pertumbuhan produktivitas tenaga kerja; x tingkat pertumbuhan peralatan listrik; a b parameter persamaan.

Mengukur keeratan hubungan (menentukan nilai a, b) antara dua indikator (x, y) yang dihubungkan oleh ketergantungan linier dapat dilakukan dengan menyelesaikan sistem persamaan berikut:

di mana n adalah jumlah observasi (dalam kasus kami n=7).

Untuk menyelesaikan sistem persamaan tersebut, kita akan membuat tabel yang didalamnya beserta data awal kita akan menempatkan hasil semua perhitungan perantara yang diperlukan, yaitu:

Maka sistem persamaan dengan dua hal yang tidak diketahui (a, b) berbentuk:

dan solusinya memungkinkan kita menentukan nilai spesifiknya: a = -0,45;

dalam = 1,542. Jadi, y = 1,542x 0,45. Mengganti nilai x tertentu ke dalam persamaan ini (yang disebut persamaan regresi), kita memperoleh nilai fungsi yang dihitung -:

Membandingkan nilai “y” dan “” kita melihat bahwa keduanya berdekatan, tetapi tidak bertepatan satu sama lain. Artinya, laju pertumbuhan produktivitas tenaga kerja tidak hanya dipengaruhi oleh laju pertumbuhan pasokan energinya, tetapi juga oleh faktor-faktor lain yang tidak diperhitungkan. Ciri kuantitatif keeratan hubungan antara pasangan indikator yang diteliti adalah koefisien korelasi antara keduanya r, yang nilainya bervariasi dari

(1) hingga (+1) dan semakin besar nilai absolutnya, semakin kecil pengaruh distorsi dari faktor-faktor yang tidak terhitung.

Studi tentang ketergantungan statistik suatu karakteristik efektif pada beberapa karakteristik faktor mengasumsikan bahwa karakteristik yang paling signifikan akan dipilih sebagai yang terakhir. Masuknya sejumlah besar faktor memperumit pemecahan masalah. Pengurangannya yang tidak dipertimbangkan dengan baik mengarah pada fakta bahwa persamaan tersebut tidak akan mereproduksi fenomena yang diteliti. Faktor-faktor yang mempunyai hubungan fungsional atau dekat dengan fungsi satu sama lain tidak dapat dimasukkan ke dalam persamaan. Ketika dimasukkan ke dalam persamaan, fenomena kolinearitas (jika ada dua faktor) atau multikolinearitas (jika ada lebih dari dua faktor) diamati. Identifikasi fenomena di atas dilakukan dengan menghitung koefisien korelasi antar faktor. Apabila nilai koefisien korelasi antar faktor lebih besar atau sama dengan 0,8, maka pada penelitian selanjutnya salah satu faktor tersebut dibuang. Prosedur seperti itu tidak diperlukan bila analisis faktor digunakan. Analisis faktor berbeda karena, tanpa bergantung pada daftar faktor yang telah ditentukan sebelumnya, analisis ini membantu mengidentifikasi faktor yang paling penting. Misalnya, seorang ekonom secara langsung mengamati berbagai indikator statistik yang berbeda dari aktivitas suatu perusahaan untuk mengidentifikasi pola yang mempengaruhi pertumbuhan produktivitas tenaga kerja (tingkat pendidikan pekerja, rasio pergantian peralatan, peralatan listrik, usia peralatan, dll.). Dengan satu atau lain cara, semua faktor yang tercermin dalam indikator-indikator ini mempengaruhi produktivitas tenaga kerja. Selain itu, banyak di antaranya yang saling berhubungan, mencerminkan fenomena yang pada dasarnya sama dari sudut yang berbeda. Dengan menggunakan teknik analisis faktor dari hubungan-hubungan ini, kita dapat menemukan bahwa sebenarnya hanya ada beberapa faktor generalisasi (misalnya, ukuran perusahaan, tingkat organisasi buruh, sifat produk) yang tidak secara langsung mempengaruhi hubungan tersebut. diamati selama penelitian memiliki pengaruh yang menentukan terhadap pertumbuhan produktivitas tenaga kerja. Oleh karena itu, tugasnya adalah mengidentifikasi faktor-faktor generalisasi yang tersembunyi. Faktor-faktor yang teridentifikasi memungkinkan untuk membangun persamaan regresi berganda dengan jumlah koefisien yang relatif kecil.

Analisis varians dirancang untuk mengidentifikasi pengaruh faktor individu terhadap hasil percobaan. Inti dari metode ini adalah sekumpulan observasi dikelompokkan menurut karakteristik faktornya, mencari hasil rata-rata dan varians untuk setiap kelompok. Kemudian ditentukan varians totalnya dan berapa besarnya yang dihitung tergantung pada kondisi umum pada semua kelompok, bagian mana yang bergantung pada faktor yang diteliti, dan bagian mana yang bergantung pada sebab-sebab acak. Dan terakhir, dengan menggunakan kriteria khusus, mereka menentukan seberapa signifikan perbedaan antara kelompok observasi dan, oleh karena itu, apakah pengaruh faktor-faktor tertentu dapat dianggap nyata. Intinya, analisis varians berfungsi sebagai tahap awal dalam analisis regresi data statistik, yang memungkinkan untuk mengidentifikasi sejumlah kecil parameter regresi, namun cukup untuk keperluan penelitian.

Bibliografi

Statistik sosial ekonomi: lokakarya / ed. V.N. Salina, EP. Shpakovsky. M.: Keuangan dan Statistik, 2006.

Jenis-jenis fenomena sosial dan bentuk keterkaitannya. Metode untuk mempelajari hubungan antara fenomena dan ciri-ciri yang menjadi cirinya.

Kami memiliki database informasi terbesar di Runet, sehingga Anda selalu dapat menemukan pertanyaan serupa

1.8.1. Studi statistik tentang hubungan, klasifikasinya.

1.8.2. Masalah mempelajari hubungan.

1.8.3. Konsep analisis korelasi-regresi, syarat penerapannya.

1.8.4. Indikator keeratan hubungan, koefisien korelasi linier.

1.8.5. Langkah-langkah untuk menilai kedekatan koneksi untuk karakteristik atribut.

1.8.1. Studi statistik tentang hubungan, klasifikasinya

Studi statistik tentang hubungan adalah salah satu cabang statistik yang paling penting. Studi tentang hubungan antara berbagai fenomena kehidupan sosial memungkinkan kita untuk memprediksi perkembangan proses yang bergantung pada orang lain, dan, pada akhirnya, mempengaruhinya. Dengan demikian, studi tentang hubungan memungkinkan kita beralih dari menjelaskan fakta ke mengubah fakta.

Suatu hubungan adalah perubahan terkoordinasi bersama dalam dua atau lebih karakteristik.

Adanya hubungan antara berbagai fenomena dan proses dinyatakan dalam perubahan data statistik yang disepakati bersama yang menggambarkan proses-proses tersebut.

Misalnya, pengalaman kerja menjadi salah satu faktor peningkatan produktivitas tenaga kerja. Oleh karena itu, peningkatan pengalaman biasanya mengarah pada peningkatan output. Statistik tersebut mencerminkan konsistensi perubahan pada kedua indikator.

Seluruh variasi hubungan biasanya diklasifikasikan menurut berbagai kriteria: Bentuk manifestasi:

hubungan sebab-akibat- dalam hal dimungkinkan untuk membedakan sebab dan akibat dari dua tanda yang berinteraksi, suatu faktor tanda (X) dan tanda hasilnya ( X).

Misalnya, hubungan antara volume produksi dan biaya per unit produksi diwujudkan sebagai berikut: dengan peningkatan volume produksi, biaya per unit produksi menurun. Di sini, volume produksi merupakan atribut faktor, dan biaya merupakan atribut hasil.

Tautan kepatuhan - dalam hal tidak mungkin membedakan sebab dan akibat, khususnya, kedua tanda yang berubah secara koheren tersebut merupakan akibat dari tanda ketiga. Mekanisme Komunikasi:

Fungsional;

Stokastik (statistik).


Di bawah ketergantungan fungsional antar fenomena dipahami sebagai hubungan yang dapat diungkapkan untuk setiap kasus secara pasti dengan rumus matematika yang ketat. Dengan ketergantungan fungsional, setiap nilai suatu besaran berhubungan dengan satu atau beberapa, tetapi nilai-nilai yang terdefinisi dengan baik dari besaran lain. Misalnya hubungan antara sisi dan luas persegi (S = sebuah 2), waktu dan jarak ketika bergerak dengan kecepatan konstan ( S = ay) dan besaran serupa yang sering ditemukan dalam geometri dan mekanika. Fenomena sosial massal dicirikan oleh jenis ketergantungan yang berbeda-beda, yang timbul sebagai akibat interaksi banyak sebab dan kondisi dan diperumit oleh tindakan keacakan obyektif dan kesalahan pengamatan. Tidak mungkin untuk menyatakan ketergantungan seperti itu dengan menggunakan rumus yang jelas dan tepat yang cocok untuk menggambarkan setiap kasus.

Pada koneksi statistik nilai yang berbeda dari satu variabel sesuai dengan distribusi nilai yang berbeda dari variabel lain.

Kasus khusus komunikasi statistik adalah komunikasi korelasi.

Ketergantungan korelasi- hubungan antar tanda, terdiri dari fakta itu nilai rata-rata nilai-nilai suatu karakteristik berubah tergantung pada perubahan karakteristik lainnya (misalnya, hubungan antara produksi dan pengalaman kerja, antara jumlah hukuman seorang penjahat dan waktu luangnya di antara mereka, dll.). Di sini, berbeda dengan ketergantungan fungsional, dalam kasus-kasus individual, ketika menentukan nilai suatu fitur, mungkin terdapat nilai-nilai lain yang berbeda, yaitu, hubungan yang ditemukan sama sekali tidak perlu dikonfirmasi dalam setiap kasus tertentu. .

Misalnya saja perubahan tenaga pengajar ke arah peningkatan jumlah

guru yang bergelar akademik pada akhirnya bermuara pada peningkatan mutu pendidikan. Namun hal ini tidak berarti bahwa setiap individu lulusan akan memiliki pengetahuan yang lebih banyak dibandingkan lulusan suatu lembaga pendidikan yang memiliki tenaga pengajar yang “lebih lemah”.

Akibatnya, dalam analisis statistik, ketergantungan korelasi tidak muncul antara setiap pasangan data yang dibandingkan, tetapi antara perubahan rangkaian distribusi sekumpulan nilai yang bersesuaian.

Selain fakta bahwa ketergantungan korelasi tidak bersifat fungsional, ada dua ciri yang harus diperhatikan:

Kesimpulan hanya dapat diambil berdasarkan analisis populasi statistik yang cukup besar sehingga memungkinkan penyusunan rangkaian statistik yang relatif panjang;
- jumlah observasi yang diinginkan setidaknya 5-6 kali lebih besar dari jumlah faktor.

Analisis korelasi hanya masuk akal jika kemungkinan adanya hubungan sebab akibat antara karakteristik yang dianalisis secara teoritis dibenarkan setidaknya pada tingkat hipotesis substantif.

Jika, dengan perubahan nilai suatu karakteristik, nilai rata-rata karakteristik lain tidak berubah secara teratur, tetapi karakteristik statistik lain berubah secara alami (misalnya indikator variasi), maka hubungannya tidak korelasional, tetapi bersifat korelasional. statistik.

Dalam hal hubungan statistik, diasumsikan bahwa kedua karakteristik mempunyai variasi acak nilai individu relatif terhadap nilai rata-rata, yaitu masing-masing karakteristik mengambil beberapa nilai acak. Jika salah satu ciri mempunyai variasi seperti itu, dan nilai ciri lainnya ditentukan secara ketat, maka kita bicarakan regresi, tapi bukan tentang hubungan statistik. Saat menganalisis deret waktu, seseorang dapat mengukur regresi tingkat deret (yang memiliki fluktuasi acak) pada angka tahun. Misalnya saja dinamika produksi produk. Namun, tidak mungkin membicarakan korelasi (hubungan) antara output produk dan waktu serta menilai kedekatan hubungan di antara keduanya.

Arah komunikasi:

Balik.

Jika sifat faktor meningkat, maka sifat hasil meningkat, yang kita bicarakan korelasi langsung. Misalnya, semakin tinggi tingkat alkoholisasi dalam suatu masyarakat, semakin tinggi tingkat kejahatannya, dan kejahatan spesifik (“mabuk”). Jika, dengan bertambahnya tanda sebab, tanda akibat berkurang, kita menyebutnya korelasi terbalik. Misalnya, semakin tinggi kontrol sosial dalam masyarakat, maka semakin rendah pula tingkat kejahatannya.

Formulir kontak:

Garis lurus;

Melengkung.

Koneksi maju dan mundur bisa lurus Dan melengkung. Secara matematis, hubungan linier dapat digambarkan dengan menggunakan persamaan garis lurus:

y = a + masuk,

Di mana pada- hasil tanda; X- faktor tanda.

Koneksi lengkung memiliki sifat yang berbeda. Peningkatan nilai suatu karakteristik faktor memberikan pengaruh yang tidak merata terhadap nilai karakteristik yang dihasilkan.

Misalnya saja hubungan kejahatan dengan usia pelaku. Awalnya, aktivitas kriminal individu meningkat berbanding lurus dengan bertambahnya usia (sampai kurang lebih 30 tahun), dan kemudian mulai menurun. Secara matematis, hubungan tersebut digambarkan dengan menggunakan kurva (hiperbola, parabola).

Korelasi garis lurus dapat menjadi satu faktor ketika hubungan antara satu tanda faktor dan satu tanda konsekuensi dipelajari (korelasi berpasangan). Mereka bisa bersifat multifaktorial, ketika pengaruh banyak faktor tanda yang berinteraksi terhadap konsekuensi tanda dipelajari (korelasi ganda).

Anotasi: Bagi sebagian besar studi statistik, penting untuk mengidentifikasi hubungan yang ada antara fenomena dan proses yang sedang berlangsung. Hampir semua fenomena kehidupan ekonomi masyarakat yang dapat diamati, betapapun independennya fenomena tersebut pada pandangan pertama, pada umumnya merupakan konsekuensi dari tindakan faktor-faktor tertentu. Misalnya, laba yang diterima suatu perusahaan dikaitkan dengan banyak indikator: jumlah karyawan, pendidikan mereka, nilai aset produksi tetap, dll.

12.1. Konsep hubungan fungsional dan korelasi

Ada dua jenis hubungan utama antara fenomena sosial dan ekonomi - fungsional dan statistik (juga disebut stokastik, probabilistik, atau korelasi). Sebelum membahasnya lebih detail, mari kita perkenalkan konsep karakteristik independen dan dependen.

Independen, atau faktorial, adalah karakteristik yang menyebabkan perubahan pada karakteristik terkait lainnya. Tanda-tanda yang perubahannya di bawah pengaruh faktor-faktor tertentu perlu ditelusuri disebut ketergantungan, atau efektif.

Dalam hubungan fungsional, perubahan variabel independen menghasilkan nilai variabel dependen yang ditentukan secara tepat.

Paling sering, hubungan fungsional muncul dalam ilmu alam, misalnya, dalam mekanika fungsional, ketergantungan jarak yang ditempuh suatu benda pada kecepatan pergerakannya, dll.

Dalam hubungan statistik, setiap nilai variabel bebas X berhubungan dengan sekumpulan nilai variabel terikat Y, dan tidak diketahui sebelumnya yang mana. Misalnya, kita mengetahui bahwa keuntungan suatu bank umum dalam beberapa hal berhubungan dengan besarnya modal dasar (fakta ini tidak diragukan lagi). Namun, tidak mungkin menghitung jumlah pasti keuntungan untuk nilai tertentu dari indikator terakhir, karena hal ini juga bergantung pada banyak faktor lain, selain besarnya modal dasar, beberapa di antaranya bersifat acak. Dalam kasus kami, kemungkinan besar, kami hanya akan menentukan nilai keuntungan rata-rata yang akan diterima secara keseluruhan untuk sekumpulan bank dengan jumlah modal dasar yang sama. Dengan demikian, hubungan statistik berbeda dari hubungan fungsional dengan adanya pengaruh sejumlah besar faktor terhadap variabel terikat.

Perhatikan bahwa hubungan statistik hanya muncul “secara umum dan rata-rata” dengan sejumlah besar observasi terhadap fenomena tersebut. Jadi secara intuitif kita dapat berasumsi bahwa ada hubungan antara volume aktiva tetap suatu perusahaan dengan laba yang diterimanya, yaitu dengan bertambahnya yang pertama maka jumlah laba pun bertambah. Namun hal ini dapat dibantah dan memberikan contoh suatu perusahaan yang mempunyai peralatan produksi modern dalam jumlah yang cukup, namun tetap mengalami kerugian. Dalam hal ini, kita memiliki contoh yang jelas tentang hubungan statistik, yang hanya muncul dalam populasi besar yang berisi puluhan dan ratusan unit, berbeda dengan hubungan fungsional, yang dikonfirmasi untuk setiap pengamatan.

Korelasi adalah hubungan statistik antar karakteristik dimana perubahan nilai variabel bebas X menyebabkan perubahan alami dalam ekspektasi matematis variabel acak Y.

Contoh 12.1. Mari kita asumsikan bahwa ada data perusahaan tentang jumlah laba ditahan tahun sebelumnya, volume investasi modal utama dan atas jumlah yang dialokasikan untuk pembelian surat berharga (ribuan unit moneter):

Tabel 12.1.
Nomor perusahaan Laba ditahan tahun sebelumnya Pembelian surat berharga Investasi dalam aset tetap
1 3 010 190 100
2 3 100 182 250
3 3 452 185 280
4 3 740 170 270
5 3 980 172 330
6 4 200 160 420
7 4 500 145 606
8 5 020 120 690
9 5 112 90 800
10 5 300 30 950

Tabel tersebut menunjukkan bahwa terdapat hubungan langsung antara laba ditahan suatu perusahaan dan investasinya modal utama: Ketika laba ditahan meningkat maka volume investasi juga meningkat. Sekarang mari kita perhatikan hubungan antara indikator laba ditahan dan volume surat berharga yang dibeli. Di sini sifatnya sangat berbeda: peningkatan indikator pertama mengarah pada efek sebaliknya - biaya sekuritas yang diperoleh, dengan pengecualian yang jarang terjadi (yang jelas-jelas mengecualikan adanya koneksi fungsional), menurun. Analisis data visual seperti itu, di mana observasi diberi peringkat dalam urutan menaik atau menurun dari nilai independen x, dan kemudian perubahan nilai nilai dependen y dianalisis, disebut metode reduksi data paralel.

Dalam contoh yang dipertimbangkan, dalam kasus pertama koneksinya langsung, dll. Kenaikan (penurunan) pada satu indikator menyebabkan peningkatan (penurunan) pada indikator lainnya (korespondensi perubahan indikator diamati), dan pada indikator kedua, sebaliknya, dan seterusnya. penurunan suatu indikator menyebabkan peningkatan indikator lainnya, atau peningkatan suatu indikator menyebabkan penurunan indikator lainnya.

Ketergantungan langsung dan terbalik mencirikan arah hubungan antar karakteristik, yang dapat diilustrasikan secara grafis menggunakan bidang korelasi. Jika disusun dalam sistem koordinat persegi panjang, nilai variabel bebas x ditempatkan pada sumbu absis, dan variabel terikat y ditempatkan pada sumbu ordinat. Perpotongan koordinat ditunjukkan dengan titik-titik yang melambangkan pengamatan. Bentuk dan keeratan hubungan dinilai dari bentuk titik-titik yang tersebar pada bidang korelasi. Gambar 12.1 menunjukkan bidang korelasi yang berhubungan dengan berbagai bentuk komunikasi.


Beras. 12.1.

a - koneksi langsung (positif);

b - koneksi umpan balik (negatif);

c - kurangnya komunikasi

Cabang ilmu statistika yang mempelajari hubungan sebab akibat antara fenomena dan proses sosial ekonomi yang berekspresi kuantitatif adalah analisis korelasi-regresi. Pada dasarnya ada dua arah analisis yang terpisah – korelasi dan regresi. Namun karena dalam prakteknya paling sering digunakan secara komprehensif (berdasarkan hasil analisis korelasi dilakukan analisis regresi), maka digabungkan menjadi satu jenis.

Melakukan analisis korelasi dan regresi melibatkan pemecahan masalah berikut:

Dari tugas-tugas yang terdaftar, dua tugas pertama berhubungan langsung dengan tugas analisis korelasi, tiga tugas berikutnya berhubungan langsung dengan analisis regresi dan hanya dalam kaitannya dengan indikator kuantitatif.

12.1.1. Persyaratan informasi statistik dipelajari dengan metode analisis korelasi dan regresi

Metode analisis korelasi dan regresi tidak dapat diterapkan pada semua data statistik. Kami mencantumkan persyaratan utama untuk informasi yang dianalisis:

  1. observasi yang digunakan untuk penelitian harus dipilih secara acak dari populasi umum objek. Jika tidak, data awal yang mewakili sampel tertentu dari populasi umum tidak akan mencerminkan karakternya, dan kesimpulan yang diambil dari data tersebut tentang pola pembangunan akan menjadi tidak berarti dan tidak mempunyai nilai praktis;
  2. persyaratan bahwa pengamatan harus independen satu sama lain. Ketergantungan observasi satu sama lain disebut autokorelasi, untuk menghilangkannya diciptakan metode khusus dalam teori analisis korelasi-regresi;
  3. kumpulan data asli harus homogen, tanpa observasi yang anomali. Memang benar, satu pengamatan yang sangat menonjol dapat menimbulkan konsekuensi yang sangat buruk bagi model regresi: parameternya akan menjadi bias, kesimpulannya akan tidak masuk akal;
  4. Data awal yang akan dianalisis diharapkan mematuhi hukum distribusi normal. Hukum distribusi normal digunakan agar kriteria tertentu dapat digunakan saat memeriksa signifikansi koefisien korelasi dan membangun batas intervalnya. Jika tidak perlu memeriksa signifikansi dan membuat estimasi interval, variabel dapat memiliki hukum distribusi apa pun. Dalam analisis regresi, ketika membangun persamaan regresi, persyaratan distribusi normal dari data awal hanya dikenakan pada variabel resultan Y, faktor independen dianggap sebagai variabel non-acak dan sebenarnya dapat memiliki hukum distribusi apa pun. Seperti halnya analisis korelasi, persyaratan normalitas distribusi diperlukan untuk memeriksa signifikansi persamaan regresi, koefisiennya, dan mencari interval kepercayaan;
  5. jumlah observasi yang membentuk hubungan karakteristik dan membangun model regresi harus melebihi jumlah karakteristik faktor setidaknya 3-4 kali (dan sebaiknya 8-10 kali). Seperti disebutkan di atas, hubungan statistik hanya muncul dengan sejumlah besar pengamatan berdasarkan hukum bilangan besar, dan semakin lemah hubungan tersebut, semakin banyak pengamatan yang diperlukan untuk membangun hubungan tersebut; semakin kuat, semakin sedikit;
  6. karakteristik faktor X tidak boleh bergantung secara fungsional satu sama lain. Hubungan yang signifikan antara karakteristik independen (faktorial, penjelas) menunjukkan multikolateralitas. Kehadirannya mengarah pada konstruksi model regresi yang tidak stabil, regresi yang “salah”.

12.1.2. Koneksi linier dan nonlinier

Hubungan linier dinyatakan dengan garis lurus, dan hubungan nonlinier dinyatakan dengan garis lengkung. Hubungan linier dinyatakan dengan persamaan garis lurus: y = a 0 + a i *x. Garis lurus paling menarik dari sudut pandang kesederhanaan penghitungan parameter persamaan. Hal ini selalu dilakukan, termasuk dalam kasus hubungan nonlinier, ketika tidak ada ancaman kerugian yang signifikan dalam keakuratan perkiraan. Namun, untuk beberapa dependensi, merepresentasikannya dalam bentuk linier menyebabkan kesalahan besar (kesalahan perkiraan) dan, sebagai akibatnya, kesimpulan yang salah. Dalam kasus ini, fungsi regresi nonlinier digunakan, yang secara umum dapat berbentuk apa pun, terutama karena perangkat lunak modern memungkinkan Anda membangunnya dengan cepat. Paling sering, persamaan nonlinier berikut digunakan untuk menyatakan hubungan nonlinier: pangkat, parabola, hiperbolik, logaritma.

Parameter model ini, seperti halnya ketergantungan linier, juga diperkirakan berdasarkan metode kuadrat terkecil (lihat bagian 12.3.1).

12.2. Analisis korelasi dan regresi

Tujuan utama analisis korelasi adalah untuk menentukan adanya hubungan antara karakteristik yang dipilih, menetapkan arahnya dan mengukur kedekatan hubungan tersebut. Untuk melakukan ini, dalam analisis korelasi, matriks koefisien korelasi berpasangan diestimasi terlebih dahulu, kemudian, berdasarkan matriks tersebut, ditentukan koefisien korelasi dan determinasi parsial dan ganda. Setelah nilai koefisien ditemukan, signifikansinya diperiksa. Hasil akhir dari analisis korelasi adalah pemilihan karakteristik faktor X untuk konstruksi lebih lanjut persamaan regresi yang memungkinkan gambaran hubungan secara kuantitatif.

Mari kita perhatikan tahapan analisis korelasi lebih detail.

12.2.1. Koefisien korelasi berpasangan (linier).

Analisis korelasi diawali dengan perhitungan koefisien korelasi berpasangan (linier).

Koefisien korelasi berpasangan adalah ukuran hubungan linier antara dua variabel terhadap variabel lain yang dimasukkan dalam model.

Bergantung pada prosedur penghitungan mana yang lebih nyaman bagi peneliti, koefisien ini dihitung menggunakan salah satu rumus berikut:

Koefisien korelasi berpasangan bervariasi dari -1 hingga +1. Nilai absolut sama dengan satu menunjukkan bahwa hubungan tersebut fungsional: -1 - terbalik (negatif), +1 - langsung (positif). Nilai koefisien nol menunjukkan tidak adanya hubungan linier antar karakteristik.

Penilaian kualitatif terhadap nilai kuantitatif yang diperoleh dari koefisien korelasi berpasangan dapat diberikan berdasarkan skala yang disajikan pada Tabel. 12.2.

Catatan: nilai koefisien yang positif menunjukkan hubungan antar karakteristik bersifat searah, nilai negatif menunjukkan hubungan yang berbanding terbalik.

12.2.2. Menilai pentingnya hubungan

Setelah nilai koefisien diperoleh, signifikansinya harus diperiksa. Karena data awal yang membentuk hubungan ciri-cirinya adalah sampel tertentu dari populasi umum objek tertentu, maka koefisien korelasi berpasangan yang dihitung dari data ini akan bersifat selektif. Dengan demikian, mereka hanya memperkirakan hubungan tersebut berdasarkan informasi yang dibawa oleh unit observasi terpilih. Jika data awal “dengan baik” mencerminkan struktur dan pola populasi secara umum, maka koefisien korelasi yang dihitung dari data tersebut akan menunjukkan keterkaitan nyata yang melekat dalam kenyataan dengan seluruh populasi objek yang diteliti. Jika data tidak “menyalin” hubungan populasi secara keseluruhan, maka koefisien korelasi yang dihitung akan membentuk gagasan yang salah tentang hubungan tersebut. Idealnya, untuk membuktikan fakta ini, perlu menghitung koefisien korelasi berdasarkan data seluruh populasi dan membandingkannya dengan yang dihitung dari observasi yang dipilih. Namun, dalam praktiknya, hal ini biasanya tidak dapat dilakukan, karena keseluruhan populasi sering kali tidak diketahui atau jumlahnya terlalu besar. Oleh karena itu, seberapa realistis koefisien tersebut mewakili kenyataan hanya dapat dinilai secara kasar. Berdasarkan logika, mudah untuk menyimpulkan bahwa, tentu saja, dengan bertambahnya jumlah pengamatan (pada ) kepercayaan terhadap koefisien yang dihitung akan meningkat.

Signifikansi koefisien korelasi berpasangan diperiksa dengan salah satu dari dua cara berikut: menggunakan tabel Fisher-Yates atau uji-t Student. Mari kita pertimbangkan metode pengecekan menggunakan tabel Fisher-Yates sebagai yang paling sederhana.

Pada awal pengujian, tingkat signifikansi ditetapkan (paling sering dilambangkan dengan huruf alfabet Yunani “alpha” - ), yang menunjukkan kemungkinan pengambilan keputusan yang salah. Kemungkinan terjadinya kesalahan muncul karena untuk menentukan hubungan tersebut digunakan data bukan dari seluruh populasi, melainkan hanya sebagian saja. Biasanya mengambil nilai berikut: 0,05; 0,02; 0,01; 0,001. Misalnya, jika = 0,05, maka ini berarti bahwa rata-rata, dalam lima dari seratus kasus, keputusan yang dibuat tentang signifikansi (atau tidak signifikannya) koefisien korelasi berpasangan akan salah; di = 0,001 - dalam satu dari seribu, dll.

Parameter kedua dalam pengecekan signifikansi adalah banyaknya derajat kebebasan v, yang dalam hal ini dihitung sebagai v = n - 2. Dengan menggunakan tabel Fisher-Yates, dicari nilai kritis koefisien korelasi r cr. ( = 0,05, v = n - 2). Koefisien yang nilai absolutnya lebih besar dari nilai kritis yang ditemukan dianggap signifikan.

Contoh 12.2. Misalkan pada kasus pertama ada 12 observasi, dan dihitung koefisien korelasi berpasangannya, yang ternyata sama dengan 0,530, pada kasus kedua ada 92 observasi, dan koefisien korelasi berpasangan yang dihitung adalah 0,36. Tetapi jika kita memeriksa signifikansinya, dalam kasus pertama koefisiennya ternyata tidak signifikan, dan dalam kasus kedua - signifikan, meskipun besarnya jauh lebih kecil. Ternyata pada kasus pertama observasi terlalu sedikit sehingga meningkatkan persyaratan, dan nilai kritis koefisien korelasi berpasangan pada tingkat signifikansi = 0,05 adalah 0,576 (v = 12 - 2), dan pada kasus kedua ada observasinya jauh lebih banyak dan cukup melebihi nilai kritis 0,205 ( v = 92 - 2), sehingga koefisien korelasi pada level yang sama menjadi signifikan. Jadi, semakin sedikit observasi, nilai kritis koefisiennya akan selalu semakin tinggi.

Pengujian signifikansi pada dasarnya menentukan apakah hasil penghitungan bersifat acak atau tidak.

12.2.3. Penentuan koefisien korelasi berganda

Tahap analisis korelasi selanjutnya dikaitkan dengan perhitungan koefisien korelasi berganda (kumulatif).

Koefisien korelasi berganda mencirikan keeratan hubungan linier antara satu variabel dengan sekumpulan variabel lain yang dipertimbangkan dalam analisis korelasi.

Jika hubungan antara karakteristik resultan y dan hanya dua karakteristik faktor x 1 dan x 2 dipelajari, maka untuk menghitung koefisien korelasi berganda dapat menggunakan rumus berikut, yang komponen-komponennya merupakan koefisien korelasi berpasangan:

di mana r adalah koefisien korelasi berpasangan.

Membagikan: