3.3_转换与处理时间序列数据

发布时间 2023-07-13 14:49:51作者: 嘲讽二百五的五百五

pandas 时间相关的类

类名称 说明
Timestamp 最基础的时间类。表示某个时间点。在绝大多数的场景中时间数据都是以Timestamp形式的时间
Period 表示单个时间跨度,或者某个时间段,例如某一天,某一小时等。
Timedelta 表示不同单位的时间,例如1天,1.5小时,3分钟,4秒等,而非具体的某个时间段
DatetimeIndex 一组Timestamp构成的Index,可以用来作为Series或者DataFrame的索引
PeriodtimeIndex 一组Period构成的Index,可以用来作为Series或者DataFrame的索引
TimedeltaIndex 一组Timedelta构成的Index,可以用来作为Series或者DataFrame的索引
import pandas as pd
order=pd.read_table('./data/meal_order_info.csv',sep=',',encoding='gbk')
print('进行转换前的订单信息表lock_time的类型为:',order['lock_time'].dtypes)

order['lock_time']=pd.to_datetime(order['lock_time'])
print('进行转换后的订单信息表lock_time的类型为:',order['lock_time'].dtypes)
进行转换前的订单信息表lock_time的类型为: object
进行转换后的订单信息表lock_time的类型为: datetime64[ns]
print('最小时间为:',pd.Timestamp.min)
print('最大时间为:',pd.Timestamp.max)
最小时间为: 1677-09-21 00:12:43.145225
最大时间为: 2262-04-11 23:47:16.854775807

DatetimeIndex与PeriodIndex函数

  • 除了将数据字原始DataFrame中直接转化为Timestamp格式外,还可以将数据单独提取出来将其转换为DatetimeIndex或者PeriodIndex
  • 转换为PeriodIndex的时候要注意,需要通过freq参数指定时间间隔,常用的时间间隔有
    Y 年
    M 月
    D 日
    H 小时
    T 分钟
    S 秒
dateIndex=pd.DatetimeIndex(order['lock_time'])
print('转换为')