Kosakata Statistik

Yuk, tambah pengetahuan kamu tentang Statistik dengan kosakata ini!

A

Absolute Value - Absolute Value adalah nilai suatu bilangan, dengan mengabaikan tandanya. Dilambangkan dengan sepasang “|”. Misalnya modulus dari –2,5 adalah |-2,5| = 2.5.

Alternative Hypothesis - Alternative Hypothesis adalah teori yang berlawanan dalam kaitannya dengan Null Hypothesis. Alternative Hypothesis selalu mengambil sikap yang berlawanan dengan Null Hypothesis. Jika Null Hypothesis memperkirakan sesuatu itu benar, maka Alternative Hypothesis memperkirakannya salah.

ANOVA (Analysis of Variance) - ANOVA adalah suatu metode analisis statistik yang digunakan untuk menentukan perbedaan rata-rata dari dua kelompok atau lebih pada suatu variabel. Variabel bebas biasanya nominal, dan variabel terikat biasanya interval.

Assumptions - Dalam analisis statistik, assumptions adalah asumsi atau anggapan general tentang sebuah populasi.

Average - Rata-rata.

B

Bar Chart - Bar Chart adalah bagan atau grafik yang menyajikan data kategorikal dengan batang persegi panjang dengan tinggi atau panjang yang sebanding dengan nilai yang diwakilinya.

Bias - Bias adalah kecenderungan statistik untuk melebih-lebihkan (overestimate) atau meremehkan (underestimate) parameter.

Binomial Distribution - Binomial Distribution dapat dianggap sebagai probabilitas hasil SUKSES atau GAGAL dalam eksperimen atau survei yang diulang beberapa kali. Binomial adalah jenis distribusi yang memiliki dua kemungkinan hasil (awalan “bi” berarti dua, atau dua kali). Misalnya, lemparan koin hanya memiliki dua hasil yang mungkin: kepala atau ekor, dan mengikuti ujian dapat memiliki dua kemungkinan hasil: lulus atau gagal.

Boxplot (or “Box and Whisker” Plot) - Boxplot adalah cara standar untuk menampilkan kumpulan data berdasarkan ringkasan lima angka: minimum, maksimum, median sampel, dan kuartil pertama dan ketiga.

C

Categorical Variable - Variabel dengan nilai yang berkisar pada kategori, bukan numerik. Contohnya termasuk jenis kelamin (pria, wanita), warna cat (merah, putih, biru), jenis hewan (gajah, macan tutul, singa).

Causal Relationship - Asosiasi antara dua variabel di mana yang satu menyebabkan perubahan pada yang lain.

Central Limit Theorem - Central Limit Theorem mengatakan bahwa, selama ukuran sampel cukup besar, distribusi sample mean tentang
population mean akan kira-kira normal, apa pun distribusi datanya.

Central Tendency - Pengukuran ini menunjukkan titik tengah atau pusat dalam sebuah distribusi

Chi-square Test - Uji statistik yang biasa digunakan untuk membandingkan data yang sedang diobservasi dengan data yang diharapkan menurut hipotesis tertentu.

Cluster Sample - Pendekatan sampling yang dapat digunakan ketika suatu populasi dibagi menjadi beberapa kelompok (misalnya, kelas, nilai, jurusan). Semua peserta dalam kelompok yang dipilih adalah bagian dari sampel.

Confidence Interval - Confidence interval memberikan perkiraan rentang nilai yang dapat juga mencakup parameter populasi yang tidak diketahui.

Confidence Level - Confidence level, atau sering juga dikenal sebagai level of confidence, adalah istilah statistik yang menggambarkan tingkat kepercayaan terhadap hasil kalkulasi.

Continuous Variable - Continuous variable dapat mengambil jumlah nilai yang tidak terbatas antara titik pengukuran terendah dan tertinggi. Continuous variable mencakup hal-hal seperti kecepatan dan jarak.

Convenience Sample - Memilih peserta yang paling mudah diakses untuk berpartisipasi dalam penelitian.

Correlation - Correlation, biasanya disingkat r, adalah analisis statistik yang mengukur tingkat hubungan antara dua variabel interval dalam sebuah sampel.

Cumulative Frequency Graph - Cumulative frequency graph menunjukkan jumlah total nilai yang berada di bawah batas atas setiap variabel.

D

Decile - Decile digunakan untuk membagi variabel numerik menjadi 10, sedangkan quartile membaginya menjadi seperempat, dan percentile menjadi 100.

Descriptive Statistics - Jika kamu memiliki kumpulan data yang besar, maka descriptive statistics menyediakan cara grafik (misalnya boxplot) dan
numerik (misalnya tabel ringkasan, rata-rata, quartile) untuk memahami data.

Deviation - Jarak antara mean dan titik data tertentu dalam suatu distribusi.

Discrete Variable - Satu set data dianggap discrete jika nilai-nilai di dalamnya berbeda dan data dapat dihitung. Beberapa contoh adalah jumlah anak dalam satu keluarga, jumlah hari hujan dalam sebulan.

Distribution - Rentang nilai dari variabel tertentu.

Dot Plot - Dot plot adalah alternatif dari boxplot di mana setiap nilai dicatat sebagai titik

E

Estimation - Estimation adalah proses dimana data sampel digunakan untuk menunjukkan nilai kuantitas yang tidak diketahui dalam suatu populasi.

Estimator - Estimator adalah besaran yang dihitung dari data sampel, yang digunakan untuk memberikan informasi tentang besaran yang tidak diketahui (biasanya parameter) dalam populasi.

F

Factor - Dikenal juga sebagai categorical.

Five-number Summary - Untuk variabel numerik, terdiri dari (secara berurutan) nilai terkecil (minimum), kuartil bawah, median, kuartil atas, dan nilai terbesar (maksimum). Secara visual biasanya ditunjukkan melalui boxplot.

Frequencies - Frequencies adalah berapa kali nilai tertentu diperoleh dalam suatu variabel.

Frequency Table - Frequency mengacu pada berapa kali suatu peristiwa atau nilai terjadi. Frequency table adalah tabel yang mencantumkan suatu item dan menunjukkan berapa kali item tersebut muncul.

G

Generalizability - Sejauh mana temuan penelitian dan kesimpulan dari studi yang dilakukan pada sampel dapat diterapkan pada populasi secara luas.

H

Hypothesis Test - Pengujian hipotesis adalah tindakan dalam statistik dimana seorang analis menguji asumsi mengenai parameter populasi.

I

Inference - Inference adalah proses membuat generalisasi dari sampel ke populasi.

Inter-quartile Range - Inter-quartile range adalah selisih antara quartile atas dan bawah. Jika quartile bawah dan quartile atas masing-masing dilambangkan dengan Q1 dan Q3, maka jangkauan inter-quartile nya adalah (Q3 - Q1).

Interval Variable - Variabel di mana urutan titik data dan jarak antara titik data dapat ditentukan, tetapi tidak ada titik nol nyata (real zero points), misalnya suhu (terdapat suhu di bawah 0).

IT-Test - Sebuah tes statistik yang digunakan untuk menentukan apakah skor dari dua kelompok berbeda pada satu variabel.

L

Levels - Levels adalah jumlah kategori dalam Categorical Variable. Categorical Variable untuk jenis kelamin (laki-laki, perempuan) memiliki 2 level. Ada 5 level dalam variabel dengan kategori (Sangat buruk, Buruk, Sedang, Baik, Sangat baik).

Line Graph - Line graph adalah scatter plot di mana titik-titik individu dihubungkan oleh sebuah garis. Garis merepresentasikan rentetan dalam waktu, ruang, atau kuantitas lainnya.

M

Maximum - Maximum adalah nilai tertinggi dalam variabel numerik. Pada variabel dengan nilai 12, 15, 11, 18, 13, 14, 18 maka 18 adalah "Maximum".

Mean - Mean adalah ukuran "tengah", kadang-kadang disebut "average". Hal ini sering diberikan simbol x̄. Untuk menghitung mean, jumlahkan semua nilai data, dan bagi dengan jumlah mereka. Sebagai contoh dengan 7 nilai 12, 15, 11, 18, 13, 14, 18, rata-ratanya adalah: x̄ = (12 + 15 + 11 + 18 + 13 + 14 + 18) / 7 = 101/ 7 = 14.4

Mean Deviation - Mean deviation digunakan untuk menghitung seberapa jauh sebuah value dari titik tengah dataset atau kumpulan data.

Median - Median adalah "nilai tengah" dari sebuah list angka. Jika list tersebut memiliki jumlah entri ganjil, median adalah entri tengah setelah mengurutkan daftar ke dalam urutan dari kecil ke besar. Jika daftar memiliki jumlah entri genap, median adalah setengah jalan antara dua angka tengah setelah pengurutan. Misalnya dengan 7 nilai yang sama yang ditunjukkan untuk Mean dan Maximum di atas data yang diurutkan adalah sebagai berikut: 11 12 13 14 15 18 18. Oleh karena itu median adalah nilai ke-4 dalam daftar yang diurutkan, yaitu 14.

Minimum - Minimum adalah nilai terendah dalam variabel numerik. Pada variabel dengan nilai 12, 15, 11, 18, 13, 14, 18 maka 11 adalah "Minimum".

Mixed Variable - Mixed varible adalah variable yang sifatnya di antara categorical dan numerical.

Mode - Mode adalah value yang paling sering muncul dalam distribusi.

N

Nominal Variable - Sebuah variabel ditentukan oleh kategori yang tidak dapat diurutkan, misalnya jenis kelamin dan warna.

Normal Distribution - Normal distribution digunakan untuk memodelkan beberapa variabel kontinu. Ini adalah kurva berbentuk lonceng simetris yang sepenuhnya ditentukan oleh dua parameter. Mereka adalah rata-rata distribusi (atau populasi), μ ,dan standard deviation, σ.

Null Hypothesis - Null hypothesis, H0, merupakan sebuah teori yang telah diajukan, biasanya sebagai dasar untuk
suatu argumen.

Numerical Variable - Mengacu pada variabel yang nilainya adalah angka (lawan dari categorical variable).

O

Ordinal Variable - Ordinal varible adalah variabel kategori di mana kategorinya memiliki urutan yang jelas, misalnya
(sangat tidak setuju, tidak setuju, netral, setuju, sangat setuju), atau (kering, hujan ringan, hujan lebat).

Outlier - Outlier adalah observasi yang terletak pada jarak abnormal (sangat berbeda) dari nilai-nilai lain dalam sampel acak dari suatu populasi.

P

P – value - Nilai Probabilitas (P-Value) dapat diartikan sebagai besarnya peluang (probabilitas) yang diamati dari statistik uji. Semakin kecil P-Value, menunjukkan bahwa null hypothesis tidak mungkin benar. Semakin kecil, semakin meyakinkanlah untuk mereject null hypothesis.

Parameter - Parameter adalah nilai numerik dari suatu populasi, contohnya rata-rata populasi.

Pattern - Pattern (pola) adalah sekumpulan data yang mengikuti bentuk yang dapat dikenali.

Percentage - Salah satu cara paling umum untuk merepresentasikan statistik adalah dengan percentage. Persen berarti "per seratus" dan simbol yang digunakan untuk menyatakan persentase adalah %.

Percentile - Percentile (atau centile) adalah ukuran yang digunakan dalam statistik yang menunjukkan nilai di bawah persentase pengamatan tertentu dalam kelompok pengamatan.

Population - Population adalah kumpulan dari unit yang sedang diobservasi. Contohnya: himpunan semua orang di suatu negara. Satuannya dapat berupa orang, tempat, benda, tahun, obat-obatan, atau banyak hal lainnya.

Probability - Probability adalah besarnya peluang atau kemungkinan sesuatu terjadi atau tidak terjadi

Proportion - Untuk variabel dengan sejumlah "n" observasi, di mana frekuensi karakteristik tertentu adalah r, proporsinya adalah r/n. Misalnya jika frekuensi penanaman kembali (reboisasi) adalah 11 kali dalam 55 tahun, maka proporsinya adalah 11/55 = 0,2 tahun, atau seperlima tahun.

Q

Quantiles - Quantiles adalah sebuah set "titik potong" yang membagi variabel numerik menjadi kelompok-kelompok yang mengandung jumlah observasi yang sama. Contoh quantile adalah quartile, quintiles, deciles, and percentiles.

Quartiles - Dalam statistik, quartile adalah jenis quantile yang membagi jumlah titik data menjadi empat bagian, atau perempat, dengan ukuran yang kurang lebih sama.

Quintile - Seperti quartiles, tetapi membagi data menjadi lima set, bukan empat.

R

Range - Range adalah perbedaan antara nilai maksimum dan minimum.

Ratio Variable - Variabel di mana urutan titik data dan jarak antara titik data dapat ditentukan, tetapi ada titik nol nyata (real zero points), misalnya berat dan jarak (tidak ada berat dan jarak yang di bawah 0).

Reliability - Reliability adalah sejauh mana suatu ukuran, prosedur atau instrumen menghasilkan hasil yang sama pada uji coba berulang.

Return Period - Return period adalah waktu rata-rata untuk satu kejadian dari suatu peristiwa. Misalnya, jika probabilitas suatu kejadian setiap tahun, katakanlah harus menanam kembali (reboisasi), adalah p = 0,2, atau 20%, maka return period = 1/p = 1/0.2 = 5 tahun. Jadi rata-rata acara tersebut akan “kembali” sekali dalam lima tahun.

Risk - Risk (atau Resiko) suatu peristiwa adalah kemungkinan terjadinya peristiwa itu. Contoh: jika penanaman kembali (reboisasi) diperlukan pada 10 tahun dari 50, ini adalah probabilitas, atau risiko, 0,2 (atau 20%).

S

Sample, Random Sample - Sample adalah sekelompok unit yang dipilih dari kelompok yang lebih besar (populasi). Dengan mempelajari sample diharapkan dapat menarik kesimpulan (inferensi) yang valid tentang populasi.

Sampling Distribution - Sampling distribution menggambarkan probabilitas yang terkait dengan estimator, ketika sampel acak diambil dari suatu populasi.

Scatter Plot - Visualisasi sederhana ketika data terdiri dari value yang berpasangan. Data diplot sebagai serangkaian titik.

Significance Level, of A Hypothesis Test - Significance level adalah probabilitas menolak null hypothesis padahal hipotesis itu benar.

Skew, Skewness - Jika distribusi (atau "bentuk") suatu variabel tidak simetris terhadap median atau rata-ratanya, hal ini
dikatakan skew (atau "miring").

Spread, Measures of - Spread menggambarkan jarak value individu dari pusat.

Standard Deviation - Standard deviation adalah ukuran penyebaran sekumpulan data dari rata-ratanya. Ini mengukur variabilitas absolut dari distribusi; semakin tinggi dispersi atau variabilitas, semakin besar standar deviasi.

Standard Error - Standard error adalah istilah statistik yang mengukur keakuratan distribusi sampel yang mewakili populasi dengan menggunakan standar deviasi

Stratified Sample - Strategi pengambilan sampel dimana populasi dibagi menjadi beberapa kelompok, kemudian diambil sampel dari masing-masing kelompok.

Symmetrical - List bilangan simetris jika nilai-nilai data didistribusikan dengan cara yang sama, di atas dan di bawah tengah.

T

Table - Ketika data dibagi menjadi beberapa kategori, table menyediakan ringkasan. Sebuah table sederhana memberikan frekuensi, atau persentase, di setiap kategori.

Test Statistic - Test statistics adalah kuantitas yang dihitung dari sampel data. Ini digunakan dalam pengujian hipotesis,
dimana nilainya menentukan apakah null hypothesis harus direject atau tidak.

Time Series - Serangkaian pengukuran variabel dari waktu ke waktu, biasanya secara berkala.

Transforming Variables - Transforming variables adalah merubah variable yang terbukti tidak simetris menjadi lebih simetris. Contohnya: 1, 4, 4, 1, 36 diubah menjadi 1, 2, 2, 1, 6 (akar kuadrat dari variable sebelumnya).

V

Validity - Validity adalah seberapa akurat sebuah studi menilai konsep tertentu yang sedang diukur oleh peneliti.

Variability or Variation or Dispersion - Variability (juga disebut variation atau dispersion) mengacu pada seberapa menyebar satu set data. Variability (atau "noise") dalam data juga dapat mengaburkan/ menyamarkan informasi penting.

Variable - Karakteristik yang diukur atau diamati ketika suatu observasi dilakukan. Variabel bisa jadi nonnumerik (categorical) atau numerik.

Variance - Dalam teori dan statistik probabilitas, Variance adalah cara untuk mengukur seberapa jauh sekumpulan angka tersebar.

Z

Z-score - Skor yang dinyatakan dalam satuan standar deviasi
dari rata-rata. Ini juga dikenal sebagai standard score.

Z-test - Z-test adalah jenis uji hipotesis—cara bagi kamu untuk mengetahui apakah hasil dari suatu pengujian valid atau dapat diulang.

Jika kamu tertarik untuk belajar Data Analytics, langsung saja daftar di program Data Analytics di RevoU!