1 Geolife数据集介绍
2 数据预处理
在此博客的基础上计算速度值,使用原则排除异常速度值,即轨迹的异常点,处理完成后将原来的.plt文件保存为.csv文件,以便进行后续的展示和处理。
下面代码以用户003轨迹数据为例
# 定义文件夹路径
import os
import pandas as pd
from geopy import distance
folder_path = 'data/003/Trajectory' # 替换为实际的文件夹路径
output_folder = 'processed_data/003' # 替换为保存 CSV 文件的文件夹路径
# 遍历文件夹中的所有 .plt 文件
for file_name in os.listdir(folder_path):
if file_name.endswith('.plt'): # 只处理 .plt 文件
file_path = os.path.join(folder_path, file_name)
data = pd.read_csv(file_path, skiprows=6, header=None)
data.columns = ['Latitude', 'Longitude',