当前位置: 首页 > news >正文

论文笔记:Instruction-Tuning Llama-3-8B Excels in City-Scale MobilityPrediction

2024 Sigspatial Hummob Workshop 第2/3名

  • 提出了 Llama-3-8B-Mob——一个基于 Llama-3-8B的指令微调版本,专为长期、多城市人类移动预测而设计。

1 问题定义

2 方法

  • 将轨迹预测问题重构为一个带有指令的问答任务
    • 通过 GPT-3.5 和 4 进行实验,发现虽然该问答框架能在零样本情况下得到可接受结果,但仍存在准确性差、API 成本高、数据泄露风险等问题。
    • ——>使用 LoRA对 Llama-3-8B 进行了指令微调,仅微调注意力层和投影,提升效率

3 结果

 

尽管 Llama-3-8B-Mob 预测效果强,但其训练和推理成本也显著高于 LP-Bert

http://www.dtcms.com/a/104359.html

相关文章:

  • vuex和pinia区别
  • 16 网络服务应用
  • 软考中级-软件设计师 2023年上半年上午题真题解析:通关秘籍+避坑指南
  • 在 Ubuntu 22.04 上安装 Docker Compose 的步骤
  • 帕累托分布的均值和方差
  • 【第一节】Python爬虫基础-HTTP基本原理
  • 基于 Hough 变换的直线检测
  • 高性能计算面经
  • Docker学习之容器虚拟化与虚拟机的区别(day11)
  • python笔记:unsloth (Basic)
  • Python项目-基于Flask的个人博客系统设计与实现(2)
  • 【系统移植】(一)概念流程
  • 零基础玩转深度神经网络大模型:从Hello World到AI炼金术(详解版)
  • 如何在中科方德llinux系统上离线安装salt-minion
  • AIP-210 Unicode
  • 【初阶数据结构】队列
  • 浅谈多个虚拟机(WSL和VMWare)的网络配置
  • HarmonyOS 5.0.4(16) 版本正式发布,支持wearable类型的设备!
  • 【C++】vector常用方法总结
  • 深度学习入门:小白的奇妙之旅
  • 2025.4.1总结
  • 前端学习记录之HTML
  • GalTransl开源程序支持GPT-4/Claude/Deepseek/Sakura等大语言模型的Galgame自动化翻译解决方案
  • MCP over MQTT:EMQX 开启物联网 Agentic 时代
  • mongodb数据库的优缺点
  • 洛谷题单2-P5712 【深基3.例4】Apples-python-流程图重构
  • Java常用工具算法-2--加密算法1--对称加密算法(推荐AES算法)
  • spring druid项目中监控sql执行情况
  • 第30周Java分布式入门 消息队列 RabbitMQ
  • 【力扣hot100题】(033)合并K个升序链表