专栏主题:大数据与数据技术
为了解决传统职住模型测算规则的单一性和局限性,降低各区域居民用户因作息规律差异或临时性变化而造成的职住地识别误差,创新性提出一种基于不同区域居民出行特征的职住地精细化识别方法。首先,采用“3 min切片”和“角度+驻留时间+连接次数”等多种方式对手机信令数据进行降噪提炼;然后,基于时空约束密度聚类进行驻留点识别分析;最后,根据各城市居民日常出行特征,通过引入加权驻留时长动态更新各城市区域居民用户职住地测算规则,进而精细化识别不同城市用户职住地分布。实验结果表明,所提方法涉及的过程均合理有效,且最终的职住地识别效果要明显优于传统单一职住模型测算规则,适用于同时批量处理多个区域职住地问题,尤其对因突发状况而产生作息时间变化的城市效果更为显著。
信令数据 出行特征 密度聚类 加权驻留时长 职住地识别
黄兴如,李奕萱,刘中亮,等.基于居民出行特征的职住地精细化识别[J].网络安全与数据治理,2024,43(8):44-48.
精准有效识别不同区域居民职住地以及挖掘居民处于职住地的时空规律可为城市职住规划、经济发展布局、公共资源分配和交通管理决策提供数据支持。手机具有覆盖广、延迟低、时效高、周期长等特点,因此借助手机信令位置数据进行居民活动分析研究具有良好的基础和开端,能够从大规模时空轨迹信息中挖掘居民的活动范围、出行时长、驻留兴趣点和出行方式等重要时空属性特征[1-3]。
由于设备测量、计算方法、数据传输等因素影响,致使获得的轨迹数据多存有误差,而研究表明利用空间聚类算法将邻近的位置点进行聚合形成累计停留时间可减少该影响[4-5]。在此基础上,通过设置多日夜间和多日日间的驻留日长以及每日的最短驻留时长等指标,可对用户的居住地、工作地和惯常性活动点进行识别[6]。Zang等[7]依据手机用户在自定义的职住时间段内分别产生的业务频繁程度来确定职住地。Isaacman等[8]基于手机通话定位,通过空间聚类识别用户的重要活动地点,进而通过时间分析确定职住地。唐小勇等[9]提出一种职住计算框架,识别用户在一天内的多日稳定点和综合工作日与节假日稳定点,基于此来判断用户的职住地。张天然[10]利用每日20:00至次日8:00和工作日9:00~18:00的手机数据训练识别,将出现概率最高且超过 60%的区域作为用户的职住地。可见当前职住地测算方法的基本原理是采用某种规则对居住、工作行为的时间、空间特征进行归纳测算。然而,上述方法中所设定的时间规则具有一定的局限性,并未兼顾到不同区域因地理位置、经济条件,甚至重大事件造成的各种作息时间差异,进而导致识别的用户职住地可能存在误差;尤其是疫情期间各区域居民职住地会存在不规律性变化[11]。
职住地测算的关键问题是如何解决手机信令数据的时间连续性(用户信令事件记录的时间间隔不固定),以时间特征作为识别规则的相关方法可以分类四种:累积时间法、特征时间法、信息熵法、时间阈值法[12]。现基于累积时间法、特征时间法和时间阈值法,提出一种适用于全国不同区域的职住地精细化识别方法,以消除不同区域用户因作息时间差异造成的误差。
黄兴如,李奕萱,刘中亮,冯瀚斌,王希昭,闫龙,胡博文,李炫孜,李大中
(联通数字科技有限公司数据智能事业部,北京100010)
本文收录于《网络安全与数据治理》2024年8期!
点击杂志封面进入电子期刊专栏
👇⬇⬇⬇
了解更多请关注我们---
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……




还没有评论,来说两句吧...