量化的调查偏差:Surveybias软件

 

调查偏差:量化调查偏差对任何严格的讨论 调查偏见 需要测量精度的标量

对于度量变量,这是微不足道的(例如,与总体中已知平均值的偏差)。但是对于诸如投票选择之类的分类变量,没有明显的解决方案。

Martin,Traugott和Kennedy(2005)提出了一项措施 A 用于量化二分(两方)情况下的调查偏见。 Arzheimer和Evans(2014)展示了如何衡量 A ^ {\prime}_{i}, B, B_ {w} 对于更常见的多方案例,可以通过将原始Martin,Traugott和Kennedy度量与熟悉的logit模型的关系标记出来,然后从二项式向多项式logit导出。的 A ^ {\prime}_{i} 是针对特定类别的调查偏见的量度,而 B 将调查偏见(针对一个类别变量)整齐地汇总在一个图中。 B_ {w} 是的加权变体 B 考虑到各个组的(真实)大小。

这些措施背后的数学不是很复杂,但是有点令人费解。您可以手动(抖动)进行计算,也可以在一些统计/数学软件包中进行一些编程,但这会很累。因此,我们为Stata创建了一个加载项(或更确切地说,是ado),它为您完成了繁重的工作。

该软件的最新版本(1.4)具有许多新功能,并且比以前的版本运行速度快得多。

Surveybias评估偏见的软件

安装

要从Stata中安装我们软件的最新版本,只需键入:

ssc 在stall 调查偏见

同样,您可以从以下网站安装:

net from //www.zxdzkj.com/stata/
net 在stall 调查偏见

如何使用Surveybias软件

Surveybias和基本方法适用于对多项式变量进行抽样的任何调查,该多项式变量的总体分布已知。该程序包包含三个单独的步骤。主要命令是 调查偏见。它计算 A ^ {\prime}_{i} , BB_ {w} 以及来自存储在存储器中的变量的标准错误和统计检验,以及有关总体中各个变量的真实分布的其他信息。

调查偏见 辅以 Surveybiasi,这是一个立即命令,可根据在命令行上键入为自变量的信息进行这些计算。使用 Surveybiasi,则当原始数据不可用时,可以根据发布的边距生成轮询准确性的估计值。

Surveybiasseries 使这一想法更进一步。选举后,研究人员通常会希望比较时间和公司之间的民意测验准确性,但是商业民意测验者往往只有在一定的冷静期之后,才将其原始数据提供给二级分析。 Surveybiasseries 从已发布页边距数据集中计算准确性指标,其中每一行代表一次调查的标题结果。 Surveybiasseries 将精度度量作为新变量存储在数据集中,因此很容易根据变量的函数(如实地调查的持续时间和时间,样本量或投票公司)对轮询精度进行建模。

调查偏见

[by varlist: 调查偏见 变量名 如果weight , 流行值(#..#) verbose numerical vce() cluster() svy subpop(var) level(#)

调查偏见 比较分类变量的分布 变量名 在数据集中显示其在人口中的真实分布。真正的分布以数字列表形式提交给命令 流行值。子样本可以通过 如果 限定词,以便可以评估特定于群体的预测的准确性。标准误差将基于缩减样本的大小。使用调查估算器时,应使用 subpop() 选项。

点击这里查看工作 展示了如何 调查偏见 可用于评估偏见 在一次法国大选民意测验中。

对于单独工作 证明了 在Surveybias中使用权重和信息进行抽样设计 在评估教育程度的偏见时,请单击此处。

Surveybiasi

Surveybiasi , 流行值(#..#) samplevalues(#..#) n(#) numerical level(#)

Surveybiasi 是一个直接命令,用于将调查中的类别变量的分布与其在人口中的真实分布进行比较。两种分布都需要通过各自的选项进行指定。

点击这里 展示了如何 Surveybiasi 可用于使用已发布的边距评估偏差 来自美国大选前民意测验。

Surveybiasseries

Surveybiasseries 如果 在 流行变量(varlist) 样本变量(varlist) nvar(varname) 生成(newvarstub)  missasnull 流行值 numerical descriptivenames

调查表系列 从调查边际数据集中估算准确性指标。每个观察值代表一个投票。对于每个调查,某些类别变量的分布由一系列 样本变量。可以用绝对频率,相对频率,频率或百分比来表示分布。可以通过在命令行上直接通过命令行指定真实分布的信息。 流行值 选项或作为其他一系列变量,通过 流行变量 选项。要么 流行值 要么 流行变量 必须给出,但不能同时给出。此外,另一个变量的名称将传递给程序中的 nvar 选项必须容纳相应的样本量。使用 如果 限定词,可以将分析限制在调查的子组中。

该命令留下了一系列新变量,其名称基于通过提交的存根。 生成 选项。 生成 是必须的。在这些变量中 调查表系列 存储将由以下等价系列生成的完整信息 调查偏见 命令。

单击此处查看更复杂的信息 展示了如何 Surveybiasseries 可用于快速分析大量民意调查中的偏见。包括估算房屋影响和针对单个房屋的房屋偏见。

概要

如果您担心或有兴趣使用Stata分析调查偏倚,请立即尝试使用我们的软件。它是免费的,可以通过输入以下内容快速安装或更新

ssc 在stall 调查偏见

现在就试试。

  3回应“量化的调查偏差:Surveybias软件”

  1. 我有一个问题与本帖子并不完全相关–我想知道一种统计模型,该模型可能会证实或驳斥选举学院的准确性,而不是普遍的投票。实际上,没有必要考虑这种大众投票:没有科学家或数学家会考虑对碰巧出现在民意测验中的选民进行准确计数。任何人都可以认真对待它的唯一方法“popular vote”如果所有合格选民都投票,或者至少在数学上可以辩护的百分比–不是55%!但是,我可以肯定的是,如果应用了正确的预测统计数据,则可以认为选举学院或类似的学院是准确的。你有做这个吗?

    • I’我不确定我是否正确理解您的问题。人们可能会根据选举人中偏好的二项式甚至多项式分配得出的结果来模拟EC中的投票。但是,从什么意义上说,我们可以评估这次投票的准确性?欧共体成员不是随机样本,它们是至少在任何给定总统选举年中欧共体成员的范围。如果我们谈论的是选民的真正偏爱,那么情况看起来比民众投票还要糟糕。在这种情况下,每个州的结果将构成一个非常大但有系统偏见的(选民与非选民)样本,并在州一级进行聚类。然后,通过权衡(EC投票数与选民人数不完全成正比)并在每个州内仅保留模态类别(获胜者将其全部保留),使事情变得更加复杂。简而言之,尚不清楚基于松散投票的欧共体如何使结果更类似于选民的未知意志,而不是普选本身。

提及

 发表评论

您可以使用这些 的HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

该网站使用Akismet减少垃圾邮件。 了解如何处理您的评论数据.