使用表征学习方法从人类活动中识别混合城市功能(学习笔记)
KEYWORDS:
Mixed urban function
human activity
representation learning
spatiotemporal data mining
1. Mixed urban function(城市混合功能)
核心定义
城市混合功能是指城市特定空间单元(如街区、地块、交通小区)内,同时存在两种及以上互补性城市功能(如居住、商业、办公、公共服务、休闲等)的空间组织形态,其核心特征是 “功能复合性” 与 “空间兼容性”,区别于传统 “单一功能分区”(如纯居住区、纯工业区)的规划模式。
专业内涵
- 功能关联逻辑:混合功能并非简单的功能叠加,而是基于 “人类活动需求联动” 的有机组合,例如 “居住 + 社区商业” 满足居民日常购物需求、“办公 + 餐饮 + 休闲” 匹配通勤人群的工作与生活场景,需通过功能间的 “时空互补性”(如白天办公活跃、夜间居住活跃)实现高效协同。
- 量化表征维度:在学术研究中,城市混合功能通常通过 “功能类型数量”(单元内包含的功能类别数)、“功能占比均衡度”(各类功能的面积 / 业态占比差异)、“功能活力协同性”(不同功能的人流活跃时段重合度)三个维度量化,常用模糊聚类、熵值法等方法计算 “功能混合度指数”。
- 实践价值:作为当代城市规划的核心理念之一,其价值在于缩短居民出行距离、提升空间利用效率、增强城市空间活力,同时缓解传统单一功能区 “潮汐式拥堵”“夜间空心化” 等问题,是实现 “紧凑城市”“15 分钟生活圈” 的关键空间载体。
2. Human activity(人类活动)
核心定义
在城市研究语境中,人类活动指城市居民在特定时空范围内开展的各类有目的行为(如通勤、购物、工作、社交、休闲等)的集合,是 “城市空间功能的核心驱动因子”—— 城市功能的形成、演变均以人类活动需求为导向,其数据化表征(如活动轨迹、行为时序、目的偏好)是解析城市空间规律的核心数据源。
专业内涵
- 数据化特征维度:学术研究中关注的人类活动特征主要包括三类:
- 时空特征:活动的 “时间动态性”(如日内 / 周内活动规律、高峰时段分布)与 “空间关联性”(如活动起点 - 终点(OD)分布、活动范围半径);
- 行为语义特征:活动的目的属性(如 “通勤”“就医”“娱乐” 等语义标签),需通过文本数据(如社交媒体、出行问卷)、场景数据(如 POI 类型匹配)挖掘;
- 互动特征:个体活动间的关联关系(如群体通勤流、社交活动网络),以及活动与城市空间的互动(如特定活动对商业空间的依赖、对交通设施的占用)。
- 与城市功能的关联:人类活动是 “城市功能的‘显影剂’”—— 例如某区域高频出现 “早高峰出发、晚高峰返回” 的轨迹,且日间存在大量 “办公 + 餐饮” 行为,可反推该区域具备 “居住 + 办公” 混合功能;其活动强度、时序规律的变化,也是判断城市功能演变(如 “老旧商业区向文创混合区转型”)的核心依据。
3. Representation learning(表示学习)
核心定义
表示学习是机器学习领域的重要分支,指通过算法自动从原始数据(如文本、图像、时序序列、网络结构)中学习 “低维、结构化、具有语义关联的特征向量” 的过程,核心目标是 “将原始数据的‘隐性信息’转化为机器可理解的‘显性特征’”,替代传统 “人工特征工程”(手动设计特征),解决高维原始数据 “维度灾难” 与 “信息冗余” 问题。
专业内涵
- 在城市研究中的技术路径:针对城市人类活动与时空数据的特性,常用的表示学习方法可分为三类:
- 时序表示学习:针对人类活动的时间序列数据(如每小时出行强度、活动持续时长),采用时序卷积网络(TCN)、长短期记忆网络(LSTM)等模型,提取 “活动时序模式特征”(如通勤高峰的周期性);
- 空间表示学习:针对人类活动的空间轨迹 / 交互数据(如区域间出行流、POI 访问序列),采用图神经网络(GNN)、Node2Vec 等模型,将空间单元(如街区、POI)映射为低维向量,表征 “空间关联语义”(如 A 区域与 B 区域的通勤关联强度);
- 多模态表示学习:针对 “轨迹 + 文本 + 图像” 等多源数据,采用跨模态注意力机制(如 Transformer),融合时空特征与语义特征(如将 “地铁轨迹” 与 “通勤文本标签” 关联,生成带语义的活动特征向量)。
- 核心优势:相比人工特征工程,其优势在于:
- ① 能捕捉原始数据中 “人工难以察觉的隐性规律”(如人类活动的潜在时序关联);
- ② 适应高维、异构的城市大数据(如多源时空数据);
- ③ 生成的特征向量具备 “可迁移性”,可直接用于后续任务(如城市功能分类、活动目的预测)。
4. Spatiotemporal data mining(时空数据挖掘)
核心定义
时空数据挖掘是数据挖掘领域的交叉分支,指针对 “同时包含空间维度(如地理位置、空间关联)与时间维度(如时序变化、时间依赖)信息” 的时空数据(如人类活动轨迹、交通流量、气象数据、POI 访问记录),通过统计学、机器学习、模式识别等方法,提取 “隐藏在数据中的时空关联模式、时序演变规律、空间分布特征” 的过程,核心目标是 “从时空数据中挖掘‘时空耦合的有价值信息’”。
专业内涵
- 核心挖掘任务:在城市研究中,时空数据挖掘的核心任务包括四类:
- 时空模式识别:提取人类活动或城市现象的规律性模式,如 “通勤轨迹的时空聚类模式”(识别主流通勤路线)、“商业 POI 访问的时序模式”(识别周末购物高峰规律);
- 时空关联分析:挖掘不同变量间的时空依赖关系,如 “人类活动强度与城市功能类型的时空关联性”(某区域办公功能占比与早高峰活动强度的正相关)、“交通流量与降雨事件的时空耦合关系”;
- 时空预测:基于历史时空数据预测未来状态,如通过历史通勤轨迹数据预测次日早高峰拥堵点、基于 POI 访问数据预测某区域的商业活力变化;
- 时空异常检测:识别偏离正常规律的时空现象,如 “异常人流聚集(可能对应大型活动)”“特定区域夜间活动强度突增(可能反映功能转型)”。
- 典型数据类型与技术工具:城市研究中常用的时空数据包括 GPS 轨迹数据、手机信令数据、地铁刷卡数据、POI 时空访问数据;核心技术工具包括时空索引(如 R 树、时空立方体)、时空聚类算法(如 ST-DBSCAN)、时序预测模型(如 ARIMA、Prophet)、图时空模型(如 ST-GNN),是连接 “城市大数据” 与 “城市空间规律解析” 的核心技术桥梁。
We proposed a framework(框架) to comprehensively extract (全面提取)deep features of human activities in big data, including activity dynamics, mobility interactions, and activity semantics, (活动动态、交互移动、活动语义)through representation learning methods. Then, integrating these features, we employed fuzzy clustering to identify the mixture of urban functions. 帮我解释一下这段论文中的这句话
句子核心含义拆解
该句阐述了一项 “基于人类活动大数据识别城市混合功能” 的研究框架,整体可分为 “特征提取” 和 “功能识别” 两大核心步骤,具体逻辑如下:
1. 第一步:通过表示学习(representation learning)全面提取人类活动深度特征
研究首先聚焦 “从人类活动大数据中挖掘关键信息”,明确了三类需重点提取的核心特征,这三类特征分别从动态、空间、语义三个维度刻画人类活动,确保信息覆盖的全面性:
- Activity dynamics(活动动态特征):指人类活动随时间变化的规律,比如某区域一天内 “早高峰通勤、午间休息、晚间休闲” 的人流强度变化、活动频率波动等时序特征。(参考摘要 3 中 “轨迹时序图的纹理 / 色彩语义”、摘要 6 中 “交通小区每小时出发 / 到达次数时间序列”,均为对 “活动动态” 的典型刻画)。
- Mobility interactions(交互移动特征):指不同区域之间因人类出行形成的关联关系,比如从 A 区域到 B 区域的通勤流、购物流强度,反映区域间的空间交互逻辑。(参考摘要 6 中 “出租车 OD 交互网络”—— 将区域视为节点、出行流视为边,通过图结构挖掘区域间的移动关联,与 “交互移动特征” 的内涵一致)。
- Activity semantics(活动语义特征):指人类活动的 “目的与属性”,比如某区域的活动是 “工作(办公、商务)”“居住(休息、日常购物)” 还是 “休憩(旅游、娱乐)”,需通过语义信息(如文本、场景标签)判断。(参考摘要 6 中 “微博文本的 doc2vec 向量”—— 通过社交媒体文本挖掘人类在区域内的行为目的,属于 “活动语义特征” 的典型提取方式)。
而 “representation learning(表示学习)” 是实现上述特征提取的关键技术:它能自动从原始数据(如出行记录、文本、时序数据)中学习 “低维、有意义的特征向量”,避免传统人工特征工程的局限性,让特征更贴合后续城市功能识别的需求(参考摘要 6 中用 “时序卷积网络提取活动动态”“node2vec 提取移动交互”“doc2vec 提取活动语义”,均属于表示学习的具体应用)。
2. 第二步:融合特征后,通过模糊聚类(fuzzy clustering)识别城市混合功能
在获取三类深度特征并完成融合后,研究采用 “模糊聚类” 算法实现城市功能的识别,核心逻辑如下:
- 特征融合:将 “活动动态、交互移动、活动语义” 对应的特征向量拼接为 “区域综合特征向量”,确保每个区域的信息被完整表征(参考摘要 6 中 “拼接三类特征向量形成场所综合向量” 的操作,目的是避免单一特征的片面性)。
- 模糊聚类(fuzzy clustering):与传统 “硬聚类”(如 K-means,每个区域仅属于一个功能类别)不同,模糊聚类允许一个区域 “部分属于多个功能类别”—— 通过计算区域对每个功能类别的 “隶属度”,直接得到该区域内各类功能的占比(例如某区域 “60% 属于居住功能、30% 属于商贸功能、10% 属于公共服务功能”),从而精准识别 “混合功能区域”(参考摘要 3 中 “模糊 C 均值聚类(FCM)计算功能占比”、摘要 6 中 “用隶属度表示功能比例”,均为该技术的实践)。
该框架的核心价值
结合参考文档中同类研究(如摘要 3、6)可知,这套框架主要解决了传统城市功能识别的两大痛点:
- 特征刻画不全面:传统研究多依赖单一数据(如土地利用数据),而该框架从 “动态 + 空间 + 语义” 三维度提取人类活动特征,更贴合真实城市中 “人类活动决定区域功能” 的逻辑;
- 无法识别混合功能:传统方法常将区域归为 “单一功能”(如纯居住、纯商业),而该框架通过模糊聚类直接输出功能占比,能精准捕捉城市中普遍存在的 “混合功能”(如 “住商混合”“产城融合” 区域),为城市规划(如建设紧凑型社区、优化出行路线)提供更科学的依据。
A city is a complex system composed of various forms of functional areas (Zhong et al. Citation2014). Urban function is defined as the type of occurring activities and the recognized human uses of urban space (Crooks et al. Citation2015; Tu et al. Citation2017; Zhong et al. Citation2014), which is a key attribute(关键属性) within a city. Its heterogeneous distribution in a city underlies location semantics and interactions. (其在城市中的异质分布构成了位置语义和相互作用的基础。)
A reliable identification of urban functions is essential to developing an understanding of locations (Hu et al. Citation2020, Citation2021; Tu et al. Citation2017; Yao et al. Citation2017). With rapid urbanization increasing in recent decades, various urban functions are integrated in a land parcel, (一个地块)enhancing the diversity and sophistication (复杂性)of urban structures (Grant Citation2002).
1. Complex system(复杂系统)
核心定义
复杂系统是指由大量具有动态交互关系的组分(或子系统)构成,且整体行为呈现出 “非线性、涌现性、自组织性” 等特征的系统,其核心区别于 “简单系统”(组分间关系线性、整体功能等于各组分功能之和),无法通过单一组分的属性直接推导系统整体规律。
专业内涵(城市语境下)
在城市研究中,“城市作为复杂系统” 的核心逻辑在于:城市由 “空间单元(地块、街区)”“人类活动(通勤、消费、社交)”“基础设施(交通、能源、通信)”“功能业态(居住、商业、办公)” 等多类组分构成,这些组分通过 “时空关联”(如交通网络连接不同空间单元)、“供需互动”(如人类活动需求驱动功能业态布局)形成动态网络。系统整体呈现的 “城市活力”“功能混合度” 等特征,是各组分交互产生的 “涌现性结果”,而非单一组分属性的叠加。例如,某区域 “居住 + 商业 + 交通枢纽” 的组分组合,会涌现出 “高人流聚集度”“多时段活力” 等整体特征,这一过程无法通过单独分析居住功能或商业功能推导。
2. Functional areas(功能区)
核心定义
功能区是指城市空间中,因 “人类活动类型相对集中”“空间使用目的高度一致” 而形成的、具有特定功能属性的区域单元,是城市功能在空间上的具象化载体,其边界可根据研究尺度(微观地块、中观街区、宏观片区)灵活界定。
专业内涵
- 分类逻辑:城市功能区的划分以 “人类活动与空间使用的匹配关系” 为核心依据,常见类型包括:居住功能区(以居民日常生活、休憩活动为主,空间载体为住宅、社区配套)、商业功能区(以商品交易、消费服务活动为主,空间载体为商场、商业街)、办公功能区(以商务办公、生产服务活动为主,空间载体为写字楼、产业园区)、公共服务功能区(以教育、医疗、文化活动为主,空间载体为学校、医院、场馆)等。
- 识别依据:在学术研究与规划实践中,功能区的识别通常依赖两类数据:一是 “静态空间属性”(如土地利用类型、POI(兴趣点)业态分布),二是 “动态人类活动特征”(如人流时序规律、活动目的标签)。例如,某区域若 POI 以住宅为主,且夜间人流活跃度高、日间人流相对稳定,可判定为居住功能区。
3. Urban function(城市功能)
核心定义
城市功能是指城市空间单元(从地块到区域)满足人类特定活动需求的 “属性与能力”,其本质是 “空间使用价值” 的体现,核心关联 “人类活动类型” 与 “空间使用目的”—— 某一空间单元具备 “居住功能”,本质是其能满足人类 “休憩、日常生活” 的活动需求;具备 “商业功能”,则是能满足 “商品消费、服务获取” 的需求。
专业内涵
- 定义延伸:与 “功能区”(空间载体)不同,“城市功能” 是抽象的 “属性概念”,同一功能可对应多个空间载体(如 “居住功能” 可对应高层住宅区、低层别墅区等不同功能区),同一空间载体也可承载多种功能(如某综合体同时承载商业、办公、休闲功能)。
- 核心价值:城市功能是城市存在与发展的核心依据 —— 城市的形成源于人类对 “集中化活动与专业化服务” 的需求(如早期城市的商业功能、防御功能),城市的演变则是功能体系的迭代(如从传统 “居住 + 商业 + 工业” 向现代 “居住 + 商业 + 办公 + 公共服务 + 生态休闲” 的多元功能拓展)。其合理布局直接影响城市运行效率(如职住功能平衡可缩短通勤距离)与居民生活质量(如公共服务功能覆盖度影响就医、教育便利性)。
4. Heterogeneous distribution(异质分布)
核心定义
在城市研究语境中,异质分布指城市功能(或人类活动、空间属性)在城市空间范围内呈现的 “非均匀、差异化” 的分布状态,即不同空间单元的功能类型、活动强度、属性特征存在显著差异,是城市空间结构的基本特征之一,区别于 “均质分布”(各空间单元属性无明显差异)。
专业内涵
- 表现形式:城市功能的异质分布主要体现在两个维度:一是 “类型异质”(不同区域的主导功能不同,如城市中心以商业、办公功能为主,郊区以居住、工业功能为主);二是 “强度异质”(同一功能在不同区域的活跃程度不同,如核心商业区的商业功能强度(人流量、业态密度)远高于社区商业功能)。
- 形成机制与意义:其形成源于 “自然条件差异”(如滨水区域易形成休闲功能区)、“规划引导”(如城市总体规划划定的功能片区)、“市场需求驱动”(如人口聚集区周边自发形成商业功能)的共同作用。这种异质分布是城市空间 “分工与协作” 的基础 —— 通过不同区域承担差异化功能,实现城市整体资源的高效配置(如核心区聚焦高附加值的办公、商业功能,郊区聚焦低成本的居住、生产功能),同时构成 “位置语义”(如 “城市中心” 的语义关联 “商业密集、活力高”)与 “空间交互”(如郊区居住功能与核心区办公功能通过交通网络形成通勤交互)的前提。
5. Location semantics(位置语义)
核心定义
位置语义是指城市特定空间单元(如某一地块、某一街区)因 “功能属性、活动特征、空间关联” 而被赋予的 “抽象意义标签”,其核心是 “空间位置与人类认知、活动需求的关联映射”,让 “物理位置” 转化为人类可理解的 “功能场景”(如 “XX 路与 XX 路交叉口” 的物理位置,因周边有商场、地铁站,被赋予 “商业便利、交通便捷” 的位置语义)。
专业内涵
- 构成要素:位置语义的形成依赖三大要素:一是 “自身功能属性”(如空间单元的主导功能是商业还是居住);二是 “周边环境特征”(如周边是否有学校、医院、交通枢纽等配套设施);三是 “人类活动关联”(如该位置常被用于通勤换乘、购物消费等活动)。例如,某位置若自身是写字楼(功能属性)、周边有地铁站与咖啡馆(环境特征)、且日间有大量办公人群聚集(活动关联),其位置语义可概括为 “办公集中、交通便利、商务氛围浓”。
- 研究价值:在城市大数据分析中,位置语义是连接 “物理空间” 与 “人类行为” 的关键桥梁 —— 通过挖掘位置语义,可精准理解人类活动的空间偏好(如通勤人群倾向选择 “交通便捷” 语义的位置),也可指导城市功能布局优化(如在 “居住语义” 的区域补充教育、医疗等公共服务语义)。
6. Land parcel(地块)
核心定义
地块是指城市土地被 “道路、河流、权属边界” 等要素分割形成的、具有明确空间范围与权属属性的最小土地单元,是城市空间规划与管理的基本操作单元,也是城市功能落地的 “微观空间载体”(如一块地块可建设住宅、商场或公园,承载相应的城市功能)。
专业内涵
- 核心属性:地块具有 “空间固定性”(边界与范围长期稳定)、“权属唯一性”(每块地块对应唯一的土地使用权主体)、“用途限定性”(受城市规划 “用地性质” 管控,如规划为居住用地、商业用地等)三大核心属性。这些属性决定了地块是城市功能 “微观布局” 的基础 —— 城市总体规划、详细规划对城市功能的安排,最终需落实到具体地块的 “用地性质”“建设强度”(如容积率、建筑高度)管控上。
- 研究尺度意义:在城市功能识别、混合功能研究中,地块是 “微观尺度” 的核心分析单元。例如,研究 “地块尺度的城市混合功能”,可通过分析单块地块内是否同时包含居住、商业、办公等多种用途(如商住混合用地),或相邻地块间的功能互补性(如居住地块与商业地块相邻),精准刻画城市功能混合的微观形态,区别于 “街区、片区” 等中宏观尺度的分析。
7. Urbanization(城市化)
核心定义
城市化(又称城镇化)是指 “人口向城市聚集、城市规模扩大、城市功能与空间结构不断演变、乡村地域向城市地域转化” 的动态过程,其核心是 “人口结构、经济结构、空间结构” 的协同转型,通常以 “城镇化率”(城市人口占总人口的比例)作为量化指标。
专业内涵(结合文本语境)
文本中 “快速城市化” 背景下 “地块层面的功能整合”,核心关联城市化进程中的两大趋势:一是 “人口聚集与需求多元化”—— 随着大量人口涌入城市,单一地块若仅承载居住或商业等单一功能,无法满足居民 “就近居住、就近消费、就近就业” 的复合需求,推动地块功能从 “单一化” 向 “整合化” 转变(如商住混合地块、产城融合地块);二是 “土地资源约束与空间高效利用”—— 快速城市化导致城市土地供需矛盾加剧,通过在单一地块内整合多种功能(如容积率提升 + 功能混合),可实现土地利用效率的最大化,缓解城市 “摊大饼” 式扩张带来的资源浪费问题。例如,我国一线城市核心区的 “商办住混合用地”,便是快速城市化背景下 “功能整合、高效用地” 的典型体现。
8. Urban structures(城市结构)
核心定义
城市结构是指城市内部 “功能、空间、人口、基础设施” 等要素的 “组织方式与空间配置关系”,是城市整体形态与运行逻辑的抽象概括,主要包括 “功能结构”(各类功能区的分布与组合关系)、“空间结构”(城市的形态格局,如单中心、多中心)、“交通结构”(交通网络的布局与连接关系)等维度,其核心是 “要素间的有序关联”。
专业内涵(结合文本语境)
文本中 “城市化提升城市结构的多样性与复杂性”,主要指向城市功能结构的演变:传统城市化早期,城市功能结构相对简单,表现为 “功能分区明确、类型单一”(如居住片区、工业片区、商业片区相互分离);随着城市化进程加快,人口、产业、资本的高度聚集推动功能需求多元化,城市功能结构逐渐向 “多类型、高关联” 的复杂形态转变 —— 一方面,功能类型从传统的 “居住、商业、工业” 拓展到 “办公、文创、生态、公共服务” 等更多元类别;另一方面,功能组合从 “分离式分区” 转向 “整合式混合”(如地块层面的商住混合、街区层面的产城融合),且不同功能间的交互关联更紧密(如居住功能与办公功能通过交通网络形成通勤关联,商业功能与休闲功能通过人流形成消费关联),最终使城市结构呈现出 “多样性”(功能类型丰富)与 “复杂性”(功能关联紧密)的特征。