LED设计里面有Jump pad断点的求法设计这种讲法吗

三代X86 寻址方式:

DOS时代的平坦模式不区分用户空间和内核空间,很不安全
IA32的带保护模式的平坦模式

①指令集结構ISA是机器级程序的格式和行为,定义了处理器状态、指令的格式以及每条指令对状态的影响

②机器级程序使用的存储器地址是虚拟地址,提供的储存器看上去是一个非常大的字节数组实际上是将多个硬件存储器和操作系统软件组合起来

立即数:常数值,表示为$c标准表示的整数
寄存器:表示某个寄存器的内容
存储器:根据计算出来的地址访问某个存储器位置

3.栈顶:总是从这端插入和删除元素
4.栈顶元素的地址是最低的
5.栈指针%esp保存着栈顶元素的地址

指针就是地址;局部变量保存在寄存器中

①加载有效地址:将有效地址写入目的操作数目的操作数必须是寄存器
②一元操作:只有一个操作数,既是源又是目的
③二元操作:源操作数是第一个可以是立即数、寄存器、存储器,目的操作数是第二个可以是寄存器、存储器,但两个不能同时为存储器
④移位:第一个是移位量用单个字节编码且只允许0-31位的移位,可以是立即数或者放在单字节寄存器%cl中(算术右移SAR填上符号位/逻辑右移SHR,填上0)目的操作数可以是一个寄存器或存储器

条件码访问常用的三种方法:

①根据条件码的某个组合将一个字节设置为0或1
②可以条件跳转到程序的某个其他部分
③可以有条件的传送数据

SET指令根据t=a-b的结果设置条件码

直接跳转:后面跟标号作为跳转目标
间接跳转:*后面跟一个操作数指示符

利用控制的条件转移,当条件满足时就程序沿着一条执行路径进行,而当条件不满足时就走另一路径。

call指令有一个目标即指明被调用过程起始的指令地址
call指令的效果是将返回地址入栈,并跳转到被调用过程的起始处

ret指从栈中弹出地址并跳转到这个位置
ret指令返回到call指令后的那条指令

用栈来传递过程参数、存储返回信息、保存寄存器用于以后恢复,以及本地存储为单个过程分配的那部分栈称为栈帧。
最顶端的栈帧以两个指针界定寄存器%ebp为帧指针,寄存器%esp为栈指针

  源码会进行行号提示

  如果需要查看在其他文件中定义的函数,在l后加上函数名即可定位到这个函数的定义及查看附近的其他源码或者:使用断点的求法或单步运行,到某个函数处使用s进入这个函数

  这样会在运行到源码第6行时停止,可以查看变量的值、堆栈情况等;这个行号是gdb的行号

  可以键入"info b"来查看断点的求法处情况,可以设置多个断点的求法;

  在程序暂停时鍵入"p 变量名"(print)即可;

  GDB在显示变量值时都会在对应值之前加上"$N"标记,它是当前变量值的引用标记以后若想再次引用此变量,就可以直接寫作"$N"而无需写冗长的变量名;

在某一循环处,往往希望能够观察一个变量的变化情况这时就可以键入命令"watch"来观察变量的变化情况,GDB在"n"設置了观察点;

9)程序继续运行  (gdb) c

  使程序继续往下运行直到再次遇到断点的求法或程序结束;

代码調试中的问题和解决过程

解决方法,可能是git pull -rebase用嘚太多了不用新建文件夹,直接保存在上周代码的那个文件夹上传就可以了

学习时间(新增/累积)
}

选定一定数量的箱体, 求结果变量茬每个箱体内的均值, 画出均值对箱体中间点的散点图;接着再画出使用多项式模型对结果变量做出的拟合曲线, 其中多项式一般是4次多项式┅定要求了局部平均值后再画图。如果直接画原始数据的散点图, 那么噪音太大, 看不出潜在函数的形状如果结果变量的均值在断点的求法處存在跳跃, 则意味着处理变量有影响。用图来显示结果变量和配置变量之间的关系, 已经成为运用RDD的标准作法Lee和Lemieux(2010) [2]指出, 画图在RDD经验文章中是洳此重要, 以致没有图的文章会让人自然而然地怀疑图形证据对文章不利。

使用全样本数据进行参数估计以精确断点的求法回归为例, 估计模型如下:

其中y、x、treatment和W分别为结果变量、配置变量、处理变量 (当x≥c时, treatment=1, 否则treatment=0) 和前定变量。α、ρ、β和γ为待估计的参数, ε为随机扰动项。ρ显著鈈为0, 表明处理对结果变量有影响

参数估计的要点是确定模型 (1) 中的多项式次数K。一般从一次尝试到八九次8, 然后挑选赤池信息准则 (AIC) 取值最小嘚模型另外一个比赤池信息准则更好的方法是, 在多项式模型的自变量中先加入表示箱体的虚拟变量, 然后不断加入配置变量的多次项, 只到丅述原假设成立:所有箱体虚拟变量的系数均等于零。

5.子样本非参数估计

非参数估计就是对最优带宽内的子样本做加权局部线性回归。非參数估计的要点是确定最优带宽确定最优带宽的方法有两种9:拇指规则法 (rule of thumb, ROT) 和交叉验证法 (cross validationprocedure, CV) 。加权可用矩形核密度函数、三角形核密度函数等其中, 使用矩形核密度函数加权的非参数估计, 等于是基于子样本的参数估计。使用三角形核密度函数与使用矩形核密度函数的唯一区别是, 湔者给临近断点的求法的观测值更大的权重但是, 要想给临近断点的求法的观测值更大的权重, 更透明的做法是在更小的带宽内使用矩形核密度函数。使用矩形核密度函数得到的结果也更易解释值得庆幸的是, 实践中不同核密度函数得到的结果一般是一致的。具体研究中, 参数估计和非参数估计都要做, 在两种方法下都稳定的结果更可信

(二) 运用断点的求法回归设计做研究的新进展

、参数估计中只应使用配置变量嘚低次项和利用配置变量做适用性检验的Frandsen法[21]等。此处归纳比较重要的三种新做法如下:

1. 非参数估计中最优带宽的确定

[18]进一步指出, 尽管IK法具備这些优点, 但研究人员不能只看这一个最优带宽下的估计结果, 而应把这一带宽作为基准、检验结果对不同带宽的稳健性。Calonico、Cattaneo和Titiunik(2014) [19]认为, ROT、CV和IK这些方法得出的最优带宽过大, 导致相应的置信区间有偏, 会过度拒绝“没有处理效应”的原假设, 结果把“没有”处理效应说成“有”CCT法校正叻过大带宽带来的偏误。

甜甜圈RDD用来克服数据堆积 (heaping) 问题对估计结果的影响10数据堆积指取配置变量某些值的观测值过多的现象。导致这一現象的原因包括受访者自报告某些信息时倾向于向某个数值近似, 测量标尺的精读有限等譬如, 调查数据中受访者自报告的身高在160cm、170cm和180cm等取徝上堆积, 新生儿体重会在3000克、3500克和4000克等取值上堆积。数据操纵现象源自经济个体的逐利动机, 只出现在断点的求法处然而, 数据堆积不是源洎经济个体的逐利动机, 且可能出现在除断点的求法之外的其他地方。如果结果变量受配置变量的堆积现象影响, 那么RDD估计量可能是有偏的[22]此时, 可以去掉断点的求法附近的某些观测值再做RDD估计。由于去掉断点的求法附近的某些观测值后的数据就像一个“甜甜圈”, 故称作“甜甜圈RDD”至于去掉断点的求法附近多少观测值为适, 文献中尚未达成共识。

3. 全样本参数估计的缺点

根据Lee和Lemieux(2010) [2], 配置变量多项式要尝试到八九次。泹是, Gelman和Imbens (2014) [23]认为, 不能尝试配置变量多项式的高次项, 只能使用局部一次或局部二次多项式, 理由有三点:第一, 断点的求法回归设计的估计量可以写成處理组结果的加权平均值和控制组结果的加权平均值之差, 其中加权权重是配置变量的函数运用全域高阶多项式方法时, 当配置变量取值较夶时, 使用不同次数多项式得到的权重差别巨大。然而, 局部线性回归方法给临近断点的求法处的观测值赋予要大的权重, 理论上讲更合理第②, 处理效应的估计值对全域高阶多项式的次数十分敏感。使用不同次数多项式得到的估计值差别很大第三, 在本身不存在断点的求法的情況下, 全域多项式方法得到错误结果 (认为有断点的求法) 的概率高于实际水平, 而局部一次 (或二次) 多项式方法得到错误结果的概率和实际水平差鈈多。

三、断点的求法回归设计的国外应用情况

年, 五大英文顶级经济学期刊共发表39篇运用RDD做的经验研究论文, 涉及公共经济学、新政治经济學、劳动经济学和教育经济学等众多领域39篇论文中有33篇使用行政管理数据11, 由此可见开放行政管理数据对于RDD应用的重要性。第二部分提到嘚三个新进展的应用情况如下:首先, 使用非参数估计的26篇论文中, 用IK法、CCT法确定最优带宽的分别为13篇、6篇,

第一, Lee和Lemieux(2010) [2]建议参数估计和非参数估计均偠做12, 但这样做的只有16篇只使用参数估计、只使用非参数估计的分别为13篇和10篇。在16篇同时使用了两种估计方法的文章中, 将两种方法视为同等重要的有4篇, 参数估计仅只是做稳健性检验、非参数仅只是做稳健性检验的分别为4篇和8篇因此, 总体来看, 文献中偏重于参数估计。值得一提的是, ECMA上的4篇文章都只用非参数估计, 而QJE上的5篇文章, 除Malamud和Pop-Eleches(2011) [26]同时使用了两种方法外, 其余4篇都只用参数估计ECMA由国际计量经济学会主办, QJE由哈佛大學经济系主办。二者在RDD应用上的差异可能体现了两个主办方不同的学术风格

第二, Lee和Lemieux(2010) [2]建议用前定变量做适用性检验时, 应该做似不相关检验, 泹没有一篇文献这样做。

第三, Lee和Lemieux(2010) [2]建议画描述统计图中的拟合曲线时, 用配置变量的4次多项式, 但仅有3篇论文用了4次多项式39篇论文中, 仅有Chetty et al (2014) [27]这一篇没在描述统计图中画上对散点的拟合曲线。在画了的38篇中, 未说明用的什么方法、使用局部线性回归 (local linearregression) 、使用局部线性平滑 (local linearsmoother) 、移动平均法 (running-meansmoothing) 和哆项式方法的分别为3篇、3篇、3篇、1篇和28篇, 可见多项式方法是主流方法在画拟合曲线所用方法上的差异具有明显的期刊特色:使用局部线性囙归法的3篇文章有1篇来自QJE、2篇来自JPE, 使用局部线性平滑法的3篇文章均来自ECMA, 使用移动平均法的一篇文章来自RES, AER上的文章都使用多项式方法。在使鼡多项式方法的28篇论文中, 使用1次、2次、3次、4次、8次及同时使用1次和2次多项式的分别为8篇、11篇、4篇、3篇、1篇和1篇, 使用1次多项式和2次多项式的奣显居多值得一提的是, Meng (2017) [28]在同一张图中同时画了1次多项式和2次多项式的拟合曲线。

第四, Lee和Lemieux(2010) [2]建议参数估计时的配置变量多项式要尝试到八九佽, 然后挑选赤池信息准则 (AIC) 取值最小的模型但是, 使用过参数估计的29篇论文中, 仅有Clark和Martorell(2014) [29]和Deshpande (2016)[30]根据AIC来挑选模型。在明确说明尝试过的多项式次数的論文中,

第五, Lee和Lemieux(2010) [2]建议非参数估计时用矩形核密度函数但是, 在使用非参数估计且说明了所用核密度函数的16篇文献中, 使用矩形核密度函数的为7篇, 而使用三角形核密度函数的有8篇, 还有一篇使用帐篷型核密度函数 (tent-shaped edgekernel) 。

[2]发表在权威经济学期刊《Journal of Economic Literature》上, 其两位作者均是国际上知名的经济学者他们提出的RDD应用规范未被学界完全接受, 并不因为他们的观点不准确、不权威, 而是因为RDD的理论研究仍很活跃, 故应用上达成的共识不多;因为RDD應用涉及众多技术环节, 故更难达成共识。作为一个对比, IV和DID的理论研究相对成熟、应用涉及的技术环节单一13, 学者运用这两种方法做研究时的動作比较一致

四、断点的求法回归设计的国内应用情况

年间, CSSCI期刊共发表RDD经验研究论文46篇, 涉及公共经济学、环境经济学、财政学等众多领域, 其中使用行政管理数据的仅有王骏和孙志军 (2015) [32]一篇。总体而言, 对于两篇权威的RDD综述文章——Imbens和Lemieux(2008) [6]、Lee和Lemieux(2010) [2], 至少引用过其中一篇的中文论文有32篇, 占69.57%, 這意味着国内学者总体上了解运用RDD涉及的众多技术环节RDD应用的新进展也在被国内文献吸收。首先, 确定最优带宽的IK法已被广泛应用, CCT法也开始被使用使用非参数估计且说明了带宽确定方法的24篇文章中, 使用了IK法、CCT法的分别有10篇、3篇。其次, 李宏彬等 (2014) [33]、张川川等 (2015) [34]和张明 (2017) [35]都使用了甜憇圈RDD最后,

与国外文献一样, 国内文献运用RDD也存在很多与Lee和Lemieux(2010) [2]规范不一致的情况, 具体如下:首先, 同时使用参数估计和非参数估计的只有18篇 (占39.13%) 。只使用参数估计、只使用非参数估计的分别为17篇和11篇在18篇同时使用了两种估计方法的文章中, 将两种方法视为同等重要的有3篇, 参数估计仅只昰做稳健性检验、非参数仅只是做稳健性检验的分别为2篇和13篇。因此, 总体来看, 国内文献与国外文献一样, 偏重于参数估计其次, 用前定变量莋适用性检验时, 仅有曹静等 (2014) [40]、王骏和孙志军 (2015) [32]使用了似不相关回归。再次, 使用了参数估计的35篇文章中, 只有杨小聪 (2017) [41]、张英和陈绍志 (2015) [42]、曹静等 (2014) [40]3篇攵章尝试到配置变量八九次的多项式最后, 在使用非参数估计且说明了所用核密度函数的11篇文章中, 只使用矩形核密度函数、同时使用矩形囷三角形核密度函数以及只使用三角形核密度函数的分别为2篇、5篇和4篇。

由于运用RDD涉及众多技术环节, 国内对RDD的运用还存在不少问题, 主要表現在以下几个方面:首先, 5篇文章未做适用性检验, 2篇文章在适用性检验未通过时依然使用RDD张明 (2017) [34]既没有用配置变量也没有用前定变量做适用性檢验。陈强等 (2017) [43]、黄新飞和杨丹 (2017) [44]、高彦彦和王逸飞 (2017) [45]以及王旭光 (2017) [46]使用的配置变量不可能被操控, 无须检验, 但他们都没有检验前定变量的连续性鄒红和喻开志 (2015) [47]、邓婷鹤和何秀荣 (2016) [48]使用的配置变量“年龄”均在断点的求法 (60岁) 处不连续, 但依然运用RDD。邹红和喻开志 (2015) [47]做回归分析时去掉了60岁断點的求法上的样本, 但是出于男性实际停止工作的时间普遍是61岁这个考虑, 并没有从RDD适用性这个角度深化、细化研究内容, 譬如检验样本是否在50歲、60岁、70岁等年龄上存在堆积问题其次, 对描述统计图的运用不规范。如前所述, 画图在RDD应用研究中十分必需然而, 有11篇没有画描述统计图。根据Lee和Lemieux(2010) [2]和英文顶级期刊的实际, 画拟合曲线图以多项式方法居多然而, 在画有描述统计图的35篇文章中, 15篇没有说明拟合曲线图所采用的方法, 14篇采用局部多项式方法, 6篇采用了平滑、多元回归等其他方法。未画描述统计图和未说明画拟合曲线所采用方法的文章合计达26篇 (占56.52%) , 表明国内學界对画图重要性的认识不够最后, 使用非参数估计时的关键技术细节未说明。在29篇使用了非参数估计的文章中, 5篇没有报告带宽的确定方法, 18篇 (占62.07%) 未说明使用了哪个核密度函数

RDD在断点的求法附近的局部等价于一个随机试验, 这一特点使得其备受经验研究人员的青睐。在国外, RDD从20卋纪90年代末期开始被大量应用于经济学研究Lee和Lemieux(2010) [2]提出了运用RDD的必备技术环节, 相当于给出了RDD应用的规范。但是, 由于RDD的理论研究仍在不断深入, 臸今尚未定型, Lee和Lemieux(2010) [2]之后应用RDD的文献出现了新的技术环节, 譬如新的最优带宽确定方法、甜甜圈RDD和参数估计中最高只能使用二次多项式等国内運用RDD做研究始于2010年, 最近两年大幅增加。虽然国内熟悉Lee和Lemieux(2010) [2]提出的规范, 但运用RDD时存在不少问题, 譬如不做适用性检验、不重视描述统计图、不交玳清楚非参数估计的关键细节等为了使得研究结论更稳健, 基于五大英文顶级期刊发表的论文, 我们建议, 国内运用RDD时, 在完成Lee和Lemieux(2010) [2]提出的技术动莋后, 需要增加如下动作:考虑到学术界在最优带宽确定方法上尚未达成共识[26][49], 非参数估计时应该同时尝试CV、IK和CCT三种方法;在配置变量存在堆积现潒或被操纵的可能时, 使用甜甜圈RDD。尝试到四次多项式

RDD从理论上讲是更好的因果识别方法, 但运用此方法要求在断点的求法附近有较多观测徝、对数据要求很高。可喜的是, 最近几年, 我国经济社会的数字化进程加速, 越来越多的经济活动开始数据化, 越来越多的中央政府部门和地方政府公开了行政管理数据, 为运用RDD做研究提供了契机特别值得指出的是, 运用医疗卫生行业行政管理数据的研究已经成批量涌现。

来源:谢謙、薛仙玲、付明卫2019,“断点的求法回归设计方法应用的研究综述”《经济与管理评论》第2期,版权归作者所有!

}
不管建立什么模型时我们最常见嘚两个字母恐怕就是X和Y了而X和Y又存在着某种联系,所以我们才可以根据自己的研究内容建立不同的模型
如果想知道输入X对结果Y的因果影响,但是可能存在一些既影响X又影响Y的干扰变量C使得我们判断X和Y的因果关系时出现误差。而这种误差在统计学中被称为变量遗漏误差(Omitted Variable Bias)下面介绍五种可以帮助我们绕过干扰变量并准确估计因果关系的计量经济学方法。
控制回归背后的思想是我们可以直接控制Y对X的囙归中的干扰变量C。控制回归的统计要求是给定干扰变量C,潜在结果Y的分布应该有条件地独立于自变量X
假设我们想要了解一个现有产品特性的影响,例如在线聊天使用对产品销量的影响首先我们要搞清楚了解这个影响的目的:如果在线聊天的影响大到足以抵消成本,峩们可能会扩展在线聊天功能来提高利润;反之我们就不太会扩展功能,甚至可能为了节省成本而舍弃它
我们很容易发现聊天使用量與用户级销量间存在正相关关系(也就是原始相关性),于此同时我们也感觉到可能会有一些干扰变量。比如说年轻人会更多地使用茬线聊天且愿意为聊天付费,因为他们比其他人更适应这种聊天技术
由于年轻人与在线聊天使用量和销售量都呈现正相关关系,所以直接对聊天使用量和销售量进行回归会夸大它们之间的因果关系因此,我们可以通过控制年龄再对聊天使用量和销售量进行回归以获得哽加准确的因果关系估计。
断点的求法回归设计法(RDD)是一种利用随机性进行因果推论的统计方法在狭义上也可以看作是一个局部随机实验。断点的求法回归设计(regression discontinuity designRDD)之所以能做因果推断是因为控制了非观测因素。在断点的求法回归设计法中我们主要关注的是一个截断点嘚求法。
假设我们想估计通过一门技术课程对收入的影响由于存在一些非观测因素与通过课程和收入都相关(例如先天能力和内在动机),因此使用控制回归法是不够准确的
在这种情况下,我们可以设置一个及格“门槛”来给用户0分类:系统判定成绩在70分或以上的用户為通过而成绩在70分以下的用户则为不通过。假设在截断点的求法70分附近有一个极度狭窄的区间并且假设分数是连续的,那么分数落在這个区间内的学生其实是非常相似的(例如69分没通过和70分通过的学生)也就是说,其他的非观测因素已经被控制住了所以,既然没有幹扰因素的影响如果我们有足够的用户在70分附近的这个狭窄的范围内,我们可以使用这个截断点的求法来估计通过课程对收入的因果影響
倍差法也可以理解为差异中的差异法,最简单的方式是比较实验组和对照组之间在实验前后结果的差异该方法的基本思路是将测试樣本分为两组,一组是实验对象即“实验组”一组是非实验对象即“对照组”。根据实验组和对照组在实验实施前后的相关信息可以計算实验组在实验实施前后某个指标(如收入)的变化量(收入增长量),同时计算对照组在实验实施前后同一指标的变化量然后计算仩述两个变化量的差值(即所谓的“倍差值”)。
以定价示例假设我们想知道应该提高价格还是降低价格来增加收入。如果价格弹性大於1降低价格会增加购买量,从而增加收入;如果弹性小于1提高价格将增加收入。那么 我们如何知道我们的价格弹性呢

最直接的方法昰对价格进行A/B测试。但我们是否愿意进行定价A/B测试则取决于我们平台的性质、开发阶段以及用户的敏感性。如果价格变化对我们的用户來说很容易察觉例如他们会在网站上或在现实生活中相互交流,那么价格测试很可能会给我们带来风险因为定价上的差异会降低用户嘚信任度,在某些情况下甚至会导致负面的公关风暴

这时候,A/B测试的一个不错的替代方法是将准实验设计与因果推理方法相结合我们選择使用倍差法。
我们选择更改某些地理区域(例如州或国家/地区)的价格而不更改其他地理区域的价格。这些价格没有变化的地理区域为实验提供了自然的“控制”通过比较“控制”地区和非“控制”地区更改价格前后的收入变化,我们可以较为准确地估计出价格变囮对收入的因果影响
固定效应回归法是控制回归法的一种特殊类型,通过在模型中纳入个体效应固定项以及时间效应固定项控制非观测洇素要怎么理解呢?假设我们要研究基本药物政策对基本药物供应保障的影响回归模型可以这样设计:Y为“药品在不同医疗机构的配送率”,X为因变量“是否为基本药物”当然,我们知道其他因素例如药品本身属性(是否容易保存、生产规模等)以及医疗机构本身屬性(机构级别、地理位置等)都会对药品的配送率Y产生影响,但是在面板数据(Panel Data)中我们可以把这些因素“打包”全部放在个体固定效应项中,这些因素只随个体改变而不随时间改变
同理,宏观政策环境也会对药品配送产生影响而这类因素只随时间改变而不随个体妀变,所以也可以“打包”放进时间固定效应项中在固定效应模型的估计中,这些固定因素都是可以抵消的(原理类似于一阶差分)所以因变量X“是否为基本药物”系数的参数估计就是政策的直接效果,也就是因果效应了
工具变量(IV)方法可能是我们最喜欢的因果推断方法。还记得我们一开始的问题吗我们想估计X对Y的因果影响,但存在既与X又与Y相关的干扰变量C使得我们判断X和Y的因果关系时出现误差。偠想解决这个问题我们想做的就是找一个过滤器,把X中和C相关的部分过滤掉只剩下正交的部分。工具变量法就是实现这样一个过滤作鼡的方法
引入一个新的工具变量Z,它具有以下性质:

(1)强第一阶段:Z的变化与 X的变化相关

(2)排除限制的第二阶段:除了Z会间接的通過影响 X来影响 Y之外Z的变化不会导致 Y的变化

资料来源于MarTechCareer,资源仅供学术交流使用不得用于商业用途!如有侵权,请联系小编

}

我要回帖

更多关于 断点的求法 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信