三月 312020
 
受调查的国会议员,在德国死去,Quanteda升至2.0,以及学术章节:我喜欢的4个链接1

德国’的宪法保护办公室(即鬼魂) 开始为国防部的三位现任国会议员建立档案。他们都是该组织的杰出成员 党内最激进的派系 (在德国)

在具有里程碑意义的裁决中, 德国’最高法院宣布禁止协助自杀违宪。法官说结束一件事的权利’生活是最基本的,所以援助可以’是非法的。德国最高法院为协助自杀铺平了道路。与我整齐地相吻合 生物伦理态度和立法行为研究 in 德国.

这看起来很棒: Quanteda 2.0版已准备就绪.

极好的建议:使用社交媒体和开放访问可以从根本上 提高各章的学术知名度 在编辑的书中。

四月 242019
 

tidyverse如何改变了我对#rstats 2的看法

时光倒流,当我 本来应该 在攻读博士学位时,我在书架上发现了一本蓝皮书,以前办公室的那个人已经把书放在那儿了。后来我了解到 蓝皮书 引入了S语言(R的前身)。我被束缚了(就像您所做的那样),并自学了如何在现在称为R的基础上生成漂亮的图,以及如何运行理解欠佳的时间序列分析(在SPSS中无法实现)这点)。

不久之后,我迷上了Stata,直到今天,正如Ben Stanley所说的那样,我拒绝为Stata感到羞耻。 95%的时间可以完成工作,而且很快。而且,该文档非常出色。

但是我时不时地回到R,因为我需要一些特定的东西。而且大部分时间都很有趣。能够访问所有这些API(实际上,同时在内存中拥有多个数据集)令人兴奋。我可以使用一种真正,相当直接的脚本/编程语言来代替Stata’三种(半数的图形语言)半熟语法令人振奋。仅凭略读工作论文(略过每个非平凡的方程式)就可以采用最新方法…我想有点像用电锯修剪头发。

但是查找,安装,更新然后加载三个软件包,只是为了使编码更直观?说真的,R?不太酷。事实上, 发现 一个变量(必须提供完整的名称和数据集)通常足以使我流连忘返。 连接() 不知何故,我从不做应该做的事情。因此,我将再次回到Stata,就像<插入尴尬的隐喻>.

然后,在我最后的一次尝试中,我开始玩tidyverse。就像年轻人一样容易说:我的心被震撼了。小贴士!管道!许多美味的助手功能!从长格式到宽格式再返回(以各种不同方式)!分组,汇总,甚至遍历一些pythonesque列表。这不再是我以前知道的引人入胜但有点slightly强的R。

与我在Stata中使用少量字母和缩写来完成事情(相对于重新编码)相比,这仍然很冗长,我必须查找所有内容。但是我真的很喜欢。喜欢, 喜欢它。因此,在R中做更多的事情就牢牢地排在我要研究的事物清单中。最后,以最积极的声音结尾,这里是只猫的免费图片。

tidyverse如何改变了我对#rstats 3的看法

四月 062019
 
AfD的非法捐款,嗜好,#rstats和社交媒体大战:5个链接,我喜欢4

更多关于 AfD的捐赠丑闻: 媒体报道,向爱丽丝·韦德尔(Alice Weidel)非法捐款的最终来源是德国亿万富翁王朝。该家庭还捐赠给了瑞士高级副总裁。听到他们拥有泛欧洲的全球利益,移居瑞士,成为双重国籍并在伦敦之间分配时间,您不会感到惊讶&苏黎世。当您是拥有大量资金的全球精英成员时,为民粹主义,民族主义和反移民政党提供支持是很有意义的。

我一直怀疑那个老 霍布斯(哲学家,而不是卡通人物)是一个聚会警察。我真的很惊讶这真的如此。

在R中处理软件包可能有些痛苦,至少对我而言。这是 ,声称可以进行安装的软件包 更多 一旦您成功安装,便无需麻烦。

距离欧洲议会选举还有不到两个月的时间,现在该是引发一些社交媒体道德恐慌的时候了。这是有充分的理由的。有人声称自己参与了YouTube推荐引擎的开发,这是一件有趣的作品。震惊,惊讶:显然他帮助创造了一个具有 学到了 普通的YouTube观众希望看到更多,更多,更多的反媒体内容。从我自己的建议来看,这只怪兽实现了。

保持这个主题,这是关于 社交媒体营销您的研究。我读了两次,以确保确实是讽刺。您将被震惊。现在,单击该织补链接以演示该技巧有效。

瞧,没有脱欧链接!

一月 272019
 
王牌,Wallace&Gromit,并最大化函数R:我喜欢的三个链接5

在德国,这是一个温暖而又阴暗而阴沉的周末,因此,我喜欢以下三个链接:

如果您想知道特朗普是a)邪恶,b)老年还是c)主要战略家: 这是一块 尽管a)和b)可能很容易同时成立,但认为c)不太可能。

这出奇的准确:通过华莱士讲述了学术生活& Gromit gifs

这就是学者的感觉 pic.twitter.com/3vwccD8wDP

—Stella Pedrazzini博士(@ StellaPe12) 一月21,2019

当我需要在给定的输入值范围内最大化二变量函数时,我发现了这一点 简要教程 有帮助的。

奖励:Gromit的照片:

一月 142019
 

Terminology matters for science. If people use different words for the same thing, or even worse, the same word for different things, scientific communication turns into a dialogue of the deaf. European 激进 对 Studies are a field where this is potentially a big problem: we use labels like “New”, “Populist”, “Radical”, “Extreme” or even “Extremist” with abandon. 

但是真的有多糟?在一个 最近一章(作者’s version, 不 paywalled), I argue that communication in 激进 对 studies still works。使用所有50种阴影的文字“Right”仍然被一起引用,表明后来的学者意识到他们都(或多或少)在谈论同一件事。

我写了许多关于 术语随时间变化共引网络的提取结果的解释。但是有时候,所有这些读物都有所增加,所以我尝试了一些不同的尝试:使用一些新颖的软件来满足新手的需求,我将发现变成了一段短片。看看自己,然后告诉我您的想法。

的 极端 / 激进 对 network of co-citations
看这个视频 在YouTube上.

一月 102019
 
Identifying topics in research papers with the 新闻地图 package for R (or: how the 激进 对 研究 Robot became slightly less dumb) 7

主题建模不适用于我的研究论文摘要

激进 对 研究 Robot is a 好玩 side project whose life began exactly one year ago. 的 Robot exists to promote the very large body of knowledge on 激进 对 parties and their voters that social scientists have accumulated over decades. At its core is a loop that randomly selects one of the 更多 than 800 titles on my online 参考书目 on the 极端/Radical 对 每隔几个小时,然后在Twitter上吐出。

然而,这个小机器人的目标始终是出于某种偶然性,因此它试图从摘要(如果有)中提取含义,有时会带来相当可笑的后果。机器人的第一个想法是利用 (结构)主题建模。 R中有一些实现方式,第一个结果看起来很有希望,但是最后,主题建模没有找到有意义的论文集,这些论文可以轻松地标有一个通用主题。一个可能的原因是摘要太短,并且摘要相对较少(少于400个)。因此,机器人恢复为使用一组很小且相当随意的关键字来标识主题。

这种方法产生了一些令人尴尬的how叫声:

媒体和 #RadicalRight D. Halikiopoulou和T. Vlandas。 “风险,成本和劳动力市场:解释极右翼政党在欧洲议会选举中的成功的跨国模式”。见:《 Jcms-共同市场研究杂志》 54.3(2016),第636-655页。 http:// _ pic.twitter.com/K4YHAoZvNL

— 激进 对 研究 Robot (@RRResRobot) 十二月23,2018

或这个(显然,机器人有用于媒体研究的东西– who 确实n’t?):

the media: K. Loxbo. “The Impact of the 激进 对: Lessons from the Local Level in Sweden, 2002-2006”. In: Scandinavian Political Studies 33.3 (2010), pp. 295-315. //t.co/p8JmK4ovXF. <URL: //t.co/GEDZ3p4MnI>. pic.twitter.com/QhSF914y4x

— 激进 对 研究 Robot (@RRResRobot) 十二月18,2018

这里有两个问题:首先,即使是给定摘要中关键字的单个实例也足以触发分类;其次,机器人的步行者实现会使用 持续 它检测到的关键字,即使它是几次匹配中最接近的关键字。显然,这不足以统治世界。

新smap works reasonably well for classifying topics in research paper abstracts

在寻找替代解决方案时,机器人遇到了 新闻地图 (现在也可在 定量),由 渡边晃平. 新smap is semi-supervised: it starts with a dictionary of proper nouns and adjectives that all refer to geographical entities, say

'France': [Paris, France, French*] 
'Germany': [German*, Berlin]
...

但是新闻地图能够提取其他单词,这些单词也有助于以较高的概率识别相应的国家/地区,例如“Macron”, “Merkel”, “Marseille”, “Hamburg”, or even “Lederhosen”。从(有限的)意义上讲,即使没有明确提及所涉及的国家,它也会学会识别地理环境。

但是该算法不限于地理实体。它还可以从列表中识别主题。这么一来,这些天来,机器人开始是一个种子词的词典,该词典正在进行中,但目前看起来像这样:

'religion & culture': [muslim*, islam*, relig*, cultur*]
'media': [TV, newspaper*, journalis*]
'group conflict': [group*,contact, prejudice, stereotyp*, competition]
...

结果并不完美,但至少比简单关键字方法的结果令人尴尬。剩下的一个问题是新闻地图在每个摘要中最多标记一个主题。实际上,任何给定的文章都将引用文献中的两个或多个主题。主题模型在这方面更具吸引力,因为它们将每个文本视为主题的混合,因此机器人将来可能不得不重新审视它们。

十二月 132018
 
Does use of 极端 对 / 激进 对 terminology predict co-citations? (Part 2) 8

Reprise: 的 co-citation network in European 激进 对 studies

在上一篇文章中,我试图 reconstruct the co-citation network in European 激进 对 studies 并最终得到这个整洁的图表。

前20名中的同人 titles in 极端 / 激进 对 studies

前20名中的同人 titles in 极端 / 激进 对 studies

标题按组排列,其中“极端 对” camp on the right, the “Radical 对” group in the lower-left corner, and a 少数既不致力于 在左上角。线的宽度表示连接标题的引用的数量。

模式是什么样的? Knigge(1998)和Bale等人的文章。 (2010)都在“没什么特别的”组,但永远不会一起引用,至少在我提取的数据中不会。一个潜在的原因是它们相距十二年,并且解决了完全不同的研究问题。

想观看此博客的视频吗?

的 极端 / 激进 对 network of co-citations
看这个视频 在YouTube上.

除了这个差距,网络是完整的,即每个人都被引用,其他人都排在前20名中。这已经成为反对将不兼容的两股分割为不兼容的想法的相当引人注目的内容。有趣的是,甚至有一些牢固的联系可以弥合所谓的知识分裂,例如在Kitschelt的专着和Golder的文章之间,或者一方面在Lubbers,Gijsberts和Scheepers之间,另一方面在Norris和Kitschelt之间。

虽然使用相同的术语似乎起着较小的作用,但图片也表明,同引语主要是由所涉及标题的普遍突出引起的。但是,众所周知,网络图可能会产生误导。

Modelling the number of co-citations in European 激进 对 studies

对共引次数进行建模可为这种直觉提供更正式的检验。有 \frac{20\times 19}{2}=190 前20个标题中的共引用计数(范围从0到5476),平均计数为695,方差为651,143。由于方差比均值大得多,因此假设一个负二项式分布(可以容纳这种过度分散)的回归模型比围绕Poison分布建立的模型更为合适。 “一般性突出”是指 外部 涉及的两个标题的共同引用。这是结果。

变量系数S.E.p
外部引用0.0004.00002<0.05
相同的术语0.4240.120<0.05
不变2.8520.219<0.05

 

研究结果表明,使用相同的术语(编码为“极端” /“激进” /“不确定”或“其他”)控制总体突出(可操作为前20名之外的引用之和) 确实 对预期的引文数量有积极影响。但是这些数字是什么意思?

该模型是日志中的累加。要恢复计数(并将模型转换为乘法形式),需要对系数取幂。因此,使用相同术语的效果转化为系数exp(0.424)= 1.53。

这些数字是什么意思?

但是,这在实际意义上有多重要?因为模型是非线性的,所以它’最好将合理/不相等术语的预期计数及其置信范围与合理的外部共同引用范围作图。

外部共引用和术语使用对前20名中预引用数量的影响

外部共引用和术语使用对前20名中预引用数量的影响

事实证明,对于外部引用次数在6,000至8,000之间的作品,术语对引用次数的预期影响很小。从这一点开始,具有相同术语的二元组的预期共引数增长得更快。但是,在6,000到12,000个外部引用的整个范围内,置信区间重叠,因此该差异在统计上并不显着。

除非两个标题具有很高的外部引用量,否则它们在第三部著作中被引用的可能性不取决于它们使用的术语。即使对于(很少)被大量引用的作品,也没有足够的证据来拒绝术语没有意义的零假设。

尽管分析仅限于20个标题之间的关系,但这些标题最重要,因为它们构成了ERRS的核心。如果我们在这里找不到分离,那并不一定意味着它不在其他地方发生,但是如果在其他地方发生,那就没有多大意义了。所以:没有两所学校。每个人都引用相同的著名文章,无论各自的作者是否喜欢“Radical” or “Extreme”。交流发生了,这对我来说似乎很好。

你惊喜吗?

去了 迷你系列的第一部分, 要么 read the 全文 on concepts in European 激进 对 research here:

  • 阿兹海默,凯。“Conceptual Confusion is 不 Always a Bad Thing: 的 Curious Case of European 激进 对 Studies.”民主与Entscheidung。埃德斯。 三月ker,Karl,Michael Roseneck,Annette Schmitt和JürgenSirsch。威斯巴登:斯普林格,2018. 23-40。 doi:10.1007 / 978-3-658-24529-0_3
    [BibTeX] [下载PDF] [HTML]
    @InCollection{arzheimer-2018,
    author = {Arzheimer, Kai},
    title= {Conceptual Confusion is 不 Always a Bad Thing: 的 Curious Case of
    European 激进 对 Studies},
    booktitle= {Demokratie und Entscheidung},
    publisher = {Springer},
    address = {Wiesbaden},
    pages = {forthcoming},
    year = 2018,
    url =
    {//www.zxdzkj.com/conceptual-confusion-european-radical-right-studies.pdf},
    doi = {10.1007/978-3-658-24529-0_3},
    pages = {23-40},
    html =
    {//www.zxdzkj.com/conceptual-confusion-european-radical-right-studies},
    editor = {Marker, Karl and Roseneck, Michael and Schmitt, Annette and Sirsch,
    Jürgen},
    dateadded = {01-06-2018}
    }

十二月 082018
 
的 极端 / 激进 对 network of co-citations: evidence for 2 different schools? (Part 1) 9

研究问题

长期以来,人们在 European 激进 对 Studies could 不 even agree on a common name for the thing that they were researching. Should it be the 极端 对, the 激进 对, or what? Utterly unimpressed 通过 this fact, 我在一份新闻稿中辩称,这种遗憾的状态并未严重阻碍作者之间的交流. Do I have any evidence to back up this claim? Hell yeah! Fasten your seatbelts and watch me turning innocent publications into tortured data, or 更多 specifically, a 激进 对 network of co-citations. Or was it the 极端 对?

想观看此博客的视频吗?

的 极端 / 激进 对 network of co-citations
看这个视频 在YouTube上.

如何将引文转化为数据

缺少训练超复杂且计算昂贵的神经网络(即研究生)来查看课文的实际内容的方法,分析引文模式是解决研究问题的最直接方法。因为我需要引用信息,所以收集了社会科学引用索引(中科院) 代替 我自己的书目。 中科院的Web of Science界面使您可以将记录保存为纯文本文件,这是必需的。 中科院数据的主要优点是,每个项目引用的所有来源也都被记录下来,并且可以与标题一起导出。其中包括SSCI本身未涵盖的(大多数)项目,从而打开了专着和章节的奇妙世界。为了识别这两种文献,我只查询了1980-2017年期间的“极权”和“无权”。我用了“TS”运算符以搜索标题,摘要和关键字。这些查询分别返回596和551次匹配。简单。

这是三个职位系列中的第二个。 单击此处查看此迷你系列的第一部分

但是,文学的两股相隔多远?为了找出答案,我首先研究了两者之间的重叠。重叠是指使用两个短语的项目。这适用于132件,约占全部储藏量的12%。这不是一种“ zilch”交流的状态,但是仅凭此标准,似乎确实存在两个相对不同的文献。但是,我真正感兴趣的是(共)引文模式,我该如何打败两个长长的纯文本文章列表,以及它们引用的可用来源数据集?

当您问这种问题时,通常“有一个R包”™,除非问题太愚蠢。就我而言,将信息从SSCI转换为易碎数据的神奇子弹是出色的书目包。 Bibliometrix从Web of Science / 中科院(以bibtex格式)读取保存的记录,并将其转换为数据帧。它还提供了从数据中提取文献计量信息的功能。在继续引用之前,这是读取数据并生成10个最被引用标题的便捷列表的代码要点:

library(bibliometrix)
  D <- readFiles("savedrecs-all.bib")
  M <- convert2df(D, dbsource = "isi", format = "bibtex")
# remove some obviously unrelated items
  M <- M[-c(65,94,96,97,104,105,159,177,199,457,459,497,578,579,684,685,719,723),]
  M <- M[-c(659,707),]
  M <- M[-c(622),]

  results <- biblioAnalysis(M, sep = ";")
  S=summary(object = results, k = 10, pause = FALSE)
  #Citations
  CR <- citations(M, field = "article", sep = ".  ")
  CR$Cited[1:10] 

So what are the most cited titles in 极端/Radical 对 studies?

726个SSCI项目中被引用次数最多的十个来源
资源引用次数
泥泞(2007)160
媚俗(1995)147
贝兹(1994)123
Lubbers等。 (2002年)97
诺里斯(2005)90
戈尔德(2003)86
杰克曼& Volpert (1996)77
卡特(2005)66
阿兹海默& Carter (2006)65
Brug等。 (2005年)65
重要的是,前十名中包含(非常突出的位置)许多专着。 中科院本身仅列出(一些)同行评审期刊中的文章。没有引用数据,我们将不知道哪些非同行评审的期刊项目很重要。话虽这么说,情况仍远非完美:我们仅通过1000多种SSCI出版物的镜头观察共引模式。但这总比没有好,对吧?这项工作的实质结果如何?该表清楚地显示了卡·穆德(Cas Mudde)的2007年著作(“激进的激进右派”)对该领域的影响。它是榜单上被引用最多,同时也是最年轻的项目,超过了Betz(“激进右翼民粹主义”)和Kitschelt(“激进右翼”)的更老的专着。卡特(Extreme 对)和诺里斯(Radical 对)的另外两本专着也经常被引用,但比贝茨,基茨切尔特和穆德的著作少得多。其他五项是期刊论文,主要具有实证性,并且几乎没有概念上的抱负。综上所述,这表明“极端权利”标签缺乏强有力的支持者,其概念性工作在文献中被广泛接受。一旦有人提出了使用“激进权利”标签的明确理由,许多学者便愿意跳船。

Getting to the co-citation network: are the 极端 / 激进 对 literatures separated from each other?

如果确实如此,则文献应显示两个标签使用者之间的隔离度较低。寻找 共引模式 是(缺乏)分离的直接操作。当两个出版物都被某个较晚的来源引用时,就会被引用。根据定义,共引反映了在较新的出版物中表达的对较旧文献的观点。当同时引用“极端权利”和“激进权利”文献中的两个标题时,这小小的证据表明该文献具有 split into two isolated streams. 的 中科院 aims at recording every source that is cited, even if the source itself is 不 in the 中科院. This makes for a very large number of publications that could be candidates for co-citations (18,255), even if most of them are peripheral European 激进 对 studies, and a whopping 743,032 actual co-citations.

为了解决这个问题,我从共引用及其相互联系的总数中抽取了20个出版物。它们代表着文学的骨干。我如何从文本数据重建此网络?再一次,R和它的包裹救出了我,并帮助我产生了一个相当不错的情节(经过一些额外的清理)

NetMatrix <- biblioNetwork(M, analysis="co-citation",network = "references", sep = ".  ")
# Careful: we are 不 interested in loops and 不 interested in separate connections between nodes. We convert the latter to weights 
g <- graph.adjacency(NetMatrix,mode="max",diag=FALSE)
# Extract the top 20 most co-cited items
f <- induced_subgraph(g,degree(g)>quantile(degree(g),probs=(1-20/ length(V(g)))))
# Now build a vector of relevant terms (requires knowledge of these titles)
# 1: extreme, 2: radical, 3:none/other
# Show all names
V(f)$name
term <- c(3,2,1,1,2,1,1,2,1,2,3,2,2,2,3,1,1,1,1,1)
mycolours <- brewer.pal(3, "Greys")
V(f)$term <- term
V(f)$color <- mycolours[term]

共引分析:结果

So, what are the results? First, here is the top 20 of co-cited items in the field of 极端/Radical 对 studies:

726个SSCI项目中被引用次数最多的二十个来源
资源前20名中的同人总引文
媚俗(1995)7457700
泥泞(2007)7408864
Lubbers等。 (2002年)6005212
诺里斯(2005)5685077
戈尔德(2003)5644687
贝兹(1994)5426151
杰克曼& Volpert (1996)4774497
Brug等。 (2005年)4623523
阿兹海默& Carter (2006)4603551
尼格(1998)4453487
卡特(2005)3893291
阿兹海默(2009)3763301
伊格纳兹(2003)3442876
伊瓦尔斯平丹(2008)3343221
伊格纳兹(1992)3313230
瑞格伦(2007)3003353
贝尔(2003)2973199
Brug等。 (2000年)2762602
麦奎德(2005)2462600
贝尔等。 (2010年)1342449

其中许多标题都很熟悉,因为它们也出现在被引用最多的标题的前十名中,并且是经典的入门书。这是另一个掘金:对于每个头衔,所有同名书目中约有10%都发生在前20名之内。这正是同语的(子)网络’我感兴趣。这是我答应的情节:

前20名中的同人 titles in 极端 / 激进 对 studies

前20名中的同人 titles in 极端 / 激进 对 studies

但这意味着什么?阅读 迷你系列的第二部分或前往 全文 (作者版本,无付费墙):

  • 阿兹海默,凯。“Conceptual Confusion is 不 Always a Bad Thing: 的 Curious Case of European 激进 对 Studies.”民主与Entscheidung。埃德斯。 三月ker,Karl,Michael Roseneck,Annette Schmitt和JürgenSirsch。威斯巴登:斯普林格,2018. 23-40。 doi:10.1007 / 978-3-658-24529-0_3
    [BibTeX] [下载PDF] [HTML]
    @InCollection{arzheimer-2018,
    author = {Arzheimer, Kai},
    title= {Conceptual Confusion is 不 Always a Bad Thing: 的 Curious Case of
    European 激进 对 Studies},
    booktitle= {Demokratie und Entscheidung},
    publisher = {Springer},
    address = {Wiesbaden},
    pages = {forthcoming},
    year = 2018,
    url =
    {//www.zxdzkj.com/conceptual-confusion-european-radical-right-studies.pdf},
    doi = {10.1007/978-3-658-24529-0_3},
    pages = {23-40},
    html =
    {//www.zxdzkj.com/conceptual-confusion-european-radical-right-studies},
    editor = {Marker, Karl and Roseneck, Michael and Schmitt, Annette and Sirsch,
    Jürgen},
    dateadded = {01-06-2018}
    }

四月 032018