当前位置: 首页 > news >正文

SME-Econometrics

数据的来源

image.png

Experimental data and non-experimental data

实验数据(experimental data)

非实验数据(non-experimental / observational data)

1. 数据获取方式

  • 实验数据:研究者可以主动操控自变量(比如设置不同的处理组/对照组),然后观察因变量的反应。

    • 例子:在实验室里控制肥料用量,比较作物产量差异。
  • 非实验数据:研究者不能操控自变量,只能记录现实中自然发生的数据。

    • 例子:统计不同收入家庭的消费水平,但无法人为随机分配“收入高低”。

2. 可重复性

  • 实验数据:可以在相同条件下反复试验,保证结果的可验证性。

  • 非实验数据:条件不可控,通常不可重复,只能依赖统计方法去控制偏差。

Regression 来源(种子)

  • the offspring of larger than average size parents tended to be smaller than their parents

    • 翻译:比平均值更大的父母的后代,往往比父母小一些。
  • the offspring of smaller than average size parents tended to be larger than their parents

    • 翻译:比平均值更小的父母的后代,往往比父母大一些。

Population Regression 术语

image.png

Example

image.png

Population Regression 函数

定义

For simplicity, we assume that it is reasonable to model the relationship as a linear function, which is also known as the population regression function: y=E(y∣x)=β1+β2xy = E(y|x) = β_1 + β_2xy=E(yx)=β1+β2x where β1β_1β1 and β2β_2β2 are unknown parameters.
More specifically, β1β_1β1 denotes the intercept parameter (i.e., the level of household expenditure on food when the income x is zero), while β2β_2β2 represents the slope parameter.

image.png

性质

image.png

性质5:
涉及到 “独立 (independence)” 和 “不相关 (uncorrelated)” 的关系:

1. 独立 ⇒ 不相关

  • 如果两个随机变量 X,Y独立,那么一定有:

    Cov(X,Y)=0\text{Cov}(X,Y) = 0Cov(X,Y)=0

  • 原因是:

    Cov(X,Y)=E[(X−E[X])(Y−E[Y])]\text{Cov}(X,Y) = E[(X - E[X])(Y - E[Y])]Cov(X,Y)=E[(XE[X])(YE[Y])]

    独立时 E[XY]=E[X]E[Y]E[XY]=E[X]E[Y]E[XY]=E[X]E[Y],所以协方差为 0。

2. 不相关 ⇏ 独立

  • 协方差为零只说明 线性关系不存在,但并不意味着两者没有其他更复杂的依赖。

  • 比如:

    • X∼U(−1,1)X \sim U(-1,1)XU(1,1),取Y=X2Y = X^2Y=X2

    • 显然 XXXYYY不独立(因为知道 X 的值就能推断 Y 的范围)。

    • 但是计算协方差:Cov(X,Y)=0\text{Cov}(X,Y) = 0Cov(X,Y)=0

  • 说明它们可能有 非线性关系,但线性相关性为零。


文章转载自:

http://JrbfmhU7.tcLqf.cn
http://HYQ98xlF.tcLqf.cn
http://ML2OxSGn.tcLqf.cn
http://SahBPpZV.tcLqf.cn
http://hTaH6toy.tcLqf.cn
http://dZFJIWEg.tcLqf.cn
http://LXAZO9Sj.tcLqf.cn
http://9uhd0N3L.tcLqf.cn
http://2KOBC7Te.tcLqf.cn
http://kGbPgQF7.tcLqf.cn
http://3htYv59C.tcLqf.cn
http://5jxdwiql.tcLqf.cn
http://gzgEsjAp.tcLqf.cn
http://PXZDFfwU.tcLqf.cn
http://MKyB6eEV.tcLqf.cn
http://Kg7ZiwGA.tcLqf.cn
http://JXQt6FDv.tcLqf.cn
http://aAT1yz3Z.tcLqf.cn
http://2CNW68WE.tcLqf.cn
http://kjJPNYfT.tcLqf.cn
http://8cEGKPsb.tcLqf.cn
http://6TJrUzzd.tcLqf.cn
http://rSf0FudV.tcLqf.cn
http://txMxJxdJ.tcLqf.cn
http://RP4b3RxL.tcLqf.cn
http://TwWeAJA4.tcLqf.cn
http://hMrt9JLb.tcLqf.cn
http://G77kQpZH.tcLqf.cn
http://zlFBJunJ.tcLqf.cn
http://abXNOY71.tcLqf.cn
http://www.dtcms.com/a/373294.html

相关文章:

  • ActiveMQ、RocketMQ、RabbitMQ、Kafka 的全面对比分析
  • 无人机方案如何让桥梁监测更安全、更智能?融合RTK与超高分辨率成像,优于毫米精度
  • 嵌入式 - ARM1
  • 零基础入门AI:Transformer详解(自注意力机制、前馈神经网络等)
  • 小红书获取用户作品列表API接口操作指南
  • MySQL——事务、MVCC
  • vue2 elementUI 登录页面实现回车提交登录的方法
  • 数据库约束表的设计
  • ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes 数据集构建
  • c++primer 个人学习总结--高级主题
  • 【AI】AI 评测入门(二):Prompt 迭代实战从“能跑通”到“能落地”
  • 经验分享:如何让SAP B1数据库性能提升50%
  • kaggle_吃鸡_数据预处理随机森林
  • Excel随机金额或数字分配方法
  • cocos异步加载问题
  • Spring Boot 多数据源配置
  • 信奥赛csp初赛高频考点真题分类解析之:基本运算
  • langchain 输出解析器 Output Parser
  • [数据结构] 栈 · Stack
  • 大语言模型的链式思维推理:从理论到实践
  • C语言快速排序
  • 软件可靠性失效严重程度分类与深度解析
  • 如何让dify分类器更加精准的分类?
  • C# Web API 前端传入参数时间为Utc
  • Python爬虫实战:研究3D plotting模块,构建房地产二手房数据采集和分析系统
  • sglang pytorch NCCL hang分析
  • langchain 缓存 Caching
  • Spark生态全景图:图计算与边缘计算的创新实践
  • 最长上升/下降子序列的长度(动态规划)
  • 自动驾驶中的传感器技术38——Lidar(13)