当前位置:首页潮流科技商场商圈潜客挖掘模型

商场商圈潜客挖掘模型

本文分享自天翼云开发者社区《商场商圈潜客挖掘模型》,作者:石泽涛

超速数据清洗算法:

1)针对同一用户,顺次选取两条记录(第n条、第n+1条),根据第n条记录的停留时间TSn(两停留点时间差),以及与第n+1条记录的距离Dn(两记录点经纬度距离),计算第n条记录的穿越速度(Dn/TSn),如果该速度大于350km/h,则第n条记录的坐标修改为第n-1条记录的坐标,否则不作修改;

2) 如果为首条记录不合格,则继续计算第2条记录的速度,第2条记录与第3条记录的距离D2,直到找到速度合格的记录,将其坐标赋予首条记录。

3)最后一条记录始终保留。

4)重复步骤2

5)删除重复记录

乒乓切换清洗算法:

1)针对同一用户(Mdn),顺次选取三条记录(第n-1条、第n条、第n+1条),如果第n-1条记录与第n+1条记录BSID相同,第n条记录和第n-1条两条记录时间小于5分钟且与第n条记录不同,则标记第n条记录为一条乒乓记录,连续标记的乒乓记录记录为一个乒乓记录重复组;例如:CABABABAD标黄的部分为一个乒乓重复组,红字表示乒乓记录,这个情况属于具有5条乒乓记录的重复组。

2)对于只有一条乒乓记录的重复组(CABAD),考虑两点间的距离和事件发生的时间。首先,计算第n条记录的穿越速度(Dn/TSn),当第n条记录与第n+1条记录距离小于1km时,穿越速度如果大于步行平均速度(6km/h),则第n条记录坐标修改为第n-1条记录的坐标;否则不作修改。

3)对于大于等于两条乒乓记录的重复组(CABABD、CABABAD、CABABABD),将第一个乒乓记录坐标替换为其相邻的记录坐标,一个重复组内沿用相同规则进行替换,不再依次进行判断。比如CABABD替换为CAABBD、CABABAD替换为CAABAAD。

4)遍历结束后重复步骤2)。

5)重复2)3)4),直到所有记录均合格。

6)删除重复记录。

顾客识别算法:

1)判断目标区域的范围。

2)使用居住地工作地最近的地点与目标区域的距离。按下面条件进行筛选:(D为距离)

D<1公里 停留时长>10min

1公里<D<2公里 停留时长>30min

D>2公里 停留时长>45min

满足以上条件即为商场顾客

使用三组速度(进入前,里面,离开后)计算方差,大于1的去掉,计算进入前的最近三个速度的平均速度,和在目标区域里面的平均速度,如果相差小于于10km/h为非顾客则去掉,否则是顾客。

 

温馨提示:

文章标题:商场商圈潜客挖掘模型

文章链接:https://www.cutrui.cn/4002.html

更新时间:2025年06月25日

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
人已打赏
潮流科技

天翼云“一云多芯”构建通算智算一体化混合云新范式!

2025-6-25 22:16:16

潮流科技

基于运营商数据的用户关系模型建立示例

2025-6-25 22:16:34

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索

你有新的私信

请务必要查看您的私信哟~~