Bootstrap再抽样方法的SAS程序设计

发布时间:2021-10-23 07:22:50

Bootstrap 再抽样方法的 SAS 程序设计
*年来, 许多数理统计方法被引入到医学研究中, 有些理论在大样本的条件下才能获得稳定的解, 如项目反应理论、线性状态空间模壅等。但是在实际中.由于成本或者现场条件的限制而无法获 得大样本。在现有样本代表性好的条件下,可以通过 Bomt~p 再抽样方法扩大样本量.即在传统 的数理统计基础上进行统计模拟。 随着计算机技术的迅猛发展, 这一技术已经渗透到许多科学领 域. 解决了无法采集到大样本的难题。 目前医学中常用的统计软件还没有提供直接产生 Bootstrap 样本的程序。本文提供了这一方法的 SAS 程序.简短、通用,可以方便医学统计工作者的使用。

Bootstrap 再抽样方法简介

Bootstrap 方法是一种计算机模拟方法,它处理的是实际中可能发生的,但需要大样本来求出的 统计量。令 X = { x1, x2,x3, x4,…,xn},为一次采样, xi(i=1,2,… ,n”)是独立同分布 的随机变量. 服从分布 F。 为分布 F 的一个未知数字特征, 0 例如 x 的均值、 均方差及高次矩等。 根据经典数理统计理论,要获取 0 的估计子的经验分布。就需要多次重复采样和大样本。在小 样本条件下, 应用 Bomtmp 方法对 x 进行模拟重采样。 就能够在某种意义上获取 0 的经验分布. 并 确定其置信区间。

程序设计思想 Boots~ap 过程的机制是: 首先有一个实际观测到的数据集(称之为原始数据集), 它含有” 个观查 单位。从这个数据集中有放回地随机抽取”t 个组成一个新样本。称之为 Bootstrap 样 本。在这个随机抽样中.原始数据集中的每个观察单位每次被抽到的概率相等,为 1/”.这些 观察单位有的只被抽到 1 次。有的超过 1 次,也有的没有被抽到。根据取余数原理,将随机数 字表中数字除以某一数值后的余数作为新的随机数, 随机数可以重复出现, 并具有均匀性和独立 性。

实例及 SAS 程序 在含有 150 个观察单位的原有样本中.抽出观察单位数为 250 的新样本。 程序步骤: (1)产生效组(1~999)和序列号,并对数组进行随机化。 (2)以随机数除以 150,取商的余数部分,(随机数小于 150 商的整数部分为 0)。由于余数部分的

变动范围在 0~149 之间,应再加 1,与原有观察单位数相同。 (3)取序列号小于等于 250 的余数数字所对应的原有样本观察单位组成的新样本即为 Bootstrap 样本。

data a; do unit= 1 tO 999: unitl: unit; output; end; ILia ; proe plan seed=999998888444; factors unitl=999;/* unitl 为随机数 output data= a out b: run ; data c; set b; unit2=floor(unitl/150); unit3=(unitl—unit2*150);/* 取 unitl 的商作为新 的随机数 unitm = unit3+ 1: keep unit unitm ; run ; data one two; se t C; if unit< =250 then output one;/* one 为新样本数据集 if unit> 250 then output two; run ; 讨 论 1.实施 Bootstrap 过程需要满足的一个假设条件是:所观测到的样本能较好地反映总体。 Bootstrap 样本的标准差与原有样本的标准差相同。

2.Bootstrap 样本数为两位数时,产生随机数为 1~99。样本数为三位数时.产生随机数为 1~ 999,依此类推。 3.改变种子数(" seed),即可得到不同的 Bootstrap 样本。Bootstrap 样本也可以小于或等于原 有样本量。 4.该方法要求样本间满足独立同分布条件,对于时序数据不能直接采用 Bootstrap 方法。


相关文档

  • 常用抽样SAS程序
  • 随机抽样方法的SAS实现
  • 统计计算随机抽样SAS程序
  • SAS里使用自助法(bootstrap)求统计量的置信区间
  • 如何利用SAS进行随机抽样?
  • 分层随机抽样的SAS实现
  • 利用SAS进行分层随机抽样
  • spwm三种采样方法编程
  • 生物统*萄е杏肧AS程序讲解抽样分布
  • 分层抽样sas编程
  • 猜你喜欢

    电脑版