R语言基础统计示例：标准分布

R语言教程

1.2K+

2023-4-12

R语言提供了许多用于处理概率分布的函数，其中标准分布（如正态分布、卡方分布、t分布和F分布等）尤为常用。以下是关于R语言中标准分布的详解和应用实例：

正态分布（Normal Distribution）：

正态分布是一种连续概率分布，其概率密度函数呈钟形，由均值（μ）和标准差（σ）两个参数决定。

R语言提供以下与正态分布相关的函数：

dnorm(x, mean = 0, sd = 1)：计算给定值x的概率密度函数（PDF）值。
pnorm(q, mean = 0, sd = 1)：计算给定值q的累积分布函数（CDF）值。
qnorm(p, mean = 0, sd = 1)：计算给定概率p的分位数（inverse CDF）值。
rnorm(n, mean = 0, sd = 1)：从正态分布中生成n个随机数。

应用实例：

# 计算正态分布的概率密度函数值

pdf_value <- dnorm(1.5, mean = 0, sd = 1)
# 计算正态分布的累积分布函数值

cdf_value <- pnorm(1.5, mean = 0, sd = 1)
# 计算正态分布的分位数值

quantile_value <- qnorm(0.95, mean = 0, sd = 1)

# 生成正态分布的随机数 random_numbers <- rnorm(100, mean = 0, sd = 1)

卡方分布（Chi-Square Distribution）：

卡方分布是一种特殊的伽马分布，用于独立正态随机变量的平方和。卡方分布由自由度（k）参数决定。

R语言提供以下与卡方分布相关的函数：

dchisq(x, df)：计算给定值x的概率密度函数值。
pchisq(q, df)：计算给定值q的累积分布函数值。
qchisq(p, df)：计算给定概率p的分位数值。
rchisq(n, df)：从卡方分布中生成n个随机数。

应用实例：

# 计算卡方分布的概率密度函数值

pdf_value <- dchisq(3.84, df = 1)
# 计算卡方分布的累积分布函数值

cdf_value <- pchisq(3.84, df = 1)

# 计算卡方分布的分位数值 quantile_value <- qchisq(0.95, df = 1)

生成卡方分布的随机数

random_numbers <- rchisq(100, df = 1)



3. t分布（Student's t-Distribution）：

t分布是一种连续概率分布，用于估计均值已知、样本量较小的正态分布总体。t分布由自由度（ν）参数决定。
R语言提供以下与t分布相关的函数：

  - `dt(x, df)`：计算给定值x的概率密度函数值。

  - `pt(q, df)`：计算给定值q的累积分布函数值。

  - `qt(p, df)`：计算给定概率p的分位数值。

  - `rt(n, df)`：从t分布中生成n个随机数。
应用实例：

```R

# 计算t分布的概率密度函数值

pdf_value <- dt(1.96, df = 10)
# 计算t分布的累积分布函数值

cdf_value <- pt(1.96, df = 10)
# 计算t分布的分位数值

quantile_value <- qt(0.975, df = 10)

# 生成t分布的随机数 random_numbers <- rt(100, df = 10)

F分布（F-Distribution）：

F分布是一种连续概率分布，用于比较两个独立卡方分布的方差。F分布由两个自由度参数（分子自由度ν1和分母自由度ν2）决定。

R语言提供以下与F分布相关的函数：

df(x, df1, df2)：计算给定值x的概率密度函数值。
pf(q, df1, df2)：计算给定值q的累积分布函数值。
qf(p, df1, df2)：计算给定概率p的分位数值。
rf(n, df1, df2)：从F分布中生成n个随机数。

应用实例：

# 计算F分布的概率密度函数值

pdf_value <- df(1.96, df1 = 10, df2 = 20)
# 计算F分布的累积分布函数值

cdf_value <- pf(1.96, df1 = 10, df2 = 20)
# 计算F分布的分位数值

quantile_value <- qf(0.95, df1 = 10, df2 = 20)

# 生成F分布的随机数 random_numbers <- rf(100, df1 = 10, df2 = 20)

通过以上介绍和实例，希望能帮助你了解R语言中标准分布的应用。在实际数据分析过程中，你可以根据需要选择合适的分布类型和函数进行分析。以下是一些其他常见分布及其在R中的实现：

二项分布（Binomial Distribution）：

二项分布是一种离散概率分布，描述了在n次独立伯努利试验中成功次数的概率。二项分布有两个参数：试验次数n和成功概率p。

R语言提供以下与二项分布相关的函数：

dbinom(x, size, prob)：计算给定值x的概率质量函数值（PMF）。
pbinom(q, size, prob)：计算给定值q的累积分布函数值（CDF）。
qbinom(p, size, prob)：计算给定概率p的分位数值（inverse CDF）。
rbinom(n, size, prob)：从二项分布中生成n个随机数。

应用实例：

# 计算二项分布的概率质量函数值

pmf_value <- dbinom(3, size = 10, prob = 0.5)
# 计算二项分布的累积分布函数值

cdf_value <- pbinom(3, size = 10, prob = 0.5)
# 计算二项分布的分位数值

quantile_value <- qbinom(0.95, size = 10, prob = 0.5)

# 生成二项分布的随机数 random_numbers <- rbinom(100, size = 10, prob = 0.5)

泊松分布（Poisson Distribution）：

泊松分布是一种离散概率分布，描述了在固定时间段或空间内，独立随机事件发生的次数。泊松分布有一个参数：事件发生的平均速率λ。

R语言提供以下与泊松分布相关的函数：

dpois(x, lambda)：计算给定值x的概率质量函数值。
ppois(q, lambda)：计算给定值q的累积分布函数值。
qpois(p, lambda)：计算给定概率p的分位数值。
rpois(n, lambda)：从泊松分布中生成n个随机数。

应用实例：

# 计算泊松分布的概率质量函数值

pmf_value <- dpois(3, lambda = 2)
# 计算泊松分布的累积分布函数值

cdf_value <- ppois(3, lambda = 2)
# 计算泊松分布的分位数值

quantile_value <- qpois(0.95, lambda = 2)