当前位置: 首页 > news >正文

视线估计的相关研究

什么是POG?

POG是每只眼睛在视网膜最高敏锐度的区域(中央凹陷区域)注视的点在图像中的呈现

如何得到POG?

大多数远视视线估计都是从图片中提取眼睛特征分析,有时也会提取头部特征分析。常见一种方法通过跟踪面部特征来估计三维头部姿态,得出眼睛旋转中心的位置,然后结合估计的虹膜或瞳孔中心位置,计算POG;另一种方法是利用虹膜-巩膜边界的透视投影来估计眼睛在空间中的位置和方向,从而计算POG。

远视POG估计最常见的方法是使用瞳孔中心,以及一个或多个角膜反射进行估计。瞳孔中心和角膜反射已经在视线估计中用了40多年,但此前缺乏一般性理论,论文提出了POG估计的一般性理论。

6D位姿

6D是指6个自由度,代表了3个自由度的位移 (也叫平移 (Translation)),以及3个自由度的空间旋转 (Rotation),合起来就叫位姿 (Pose)。位姿是一个相对的概念,指的是两个坐标系之间的位移和旋转变换。物体6D位姿和相机6D位姿是相似的,区别在于从哪个坐标系变换到相机坐标系。

极线融合

参考文章:

利用瞳孔中心和角膜反射的视线估计理论 - 知乎 (zhihu.com)

相关文章:

  • PHP 文件上传
  • prism
  • MahApps.Metro:专为 WPF 应用程序设计的 UI 框架
  • jmeter提取返回值到文件
  • Python高级爬虫之JS逆向+安卓逆向1.5节: 控制结构
  • 【问题】一招解决vscode输出和终端不一致的困扰
  • 三菱FX5U设置修改删除口令
  • dispaly: inline-flex 和 display: flex 的区别
  • vscode stm32 variable uint32_t is not a type name 问题修复
  • 代码随想录刷题|Day20(组合总数,组合总数2、分割回文串)
  • Python内置函数---all()
  • 「ollama」安装包
  • 开源语音合成模型SparkTTS使用
  • 深入理解 React 组件的生命周期:从创建到销毁的全过程
  • Java性能剖析工具箱
  • dbc文件解析CAN报文注意项
  • 四、探索LangChain:连接语言模型与外部世界的桥梁
  • 模板详细介绍
  • TPshop项目-服务器环境部署(部署环境/服务,检查部署环境/服务,上传TPshop项目到服务器,配置文件的更改,安装TPshop)
  • nodejs使用pkg打包文件
  • 上海博物馆展览进校园,“小先生”传递文物知识
  • 澳大利亚首例“漂绿”诉讼开庭:能源巨头因“碳中和”承诺遭起诉
  • 【社论】打破“隐形高墙”,让老年人更好融入社会
  • 腾讯一季度营收增长13%,马化腾:战略性的AI投入将带来长期回报
  • 国新办将就2025年4月份国民经济运行情况举行新闻发布会
  • 京东CEO许冉:外卖日单量接近2000万单,看到外卖对平台拉动和转化效应