小灰灰深度学习day5——数据预处理

发布时间 2023-05-30 19:44:46作者: 啥都不会的灰太狼

内容简介:

1.将数据写入.csv文件中        2.将数据从.csv文件中读出    3.利用插值法处理缺失的数据   4.将数据类型转化为torch张量类型

代码如下:

import os
os.makedirs(os.path.join('..', 'data'), exist_ok=True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with opeb = n(data_file, 'w') as f:
     f.write('NumRooms, Alley, Price\n')  #列名
     f.write('NA, Pave, 127500\n')     #每列的数据样本
     f.write('2, NA, 106000\n')
     f.write('4, NA, 178100\n')
     f.write('NA, NA, 140000\n')
    
import pandas as pd
data = pd.read_csv(data_file)
print(data)

#用插值法处理缺失的数据
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
inputs = inputs.fillna(inputs.mean(numeric_only=True)) #缺省值用未缺省值的平均值填充
print(inputs)

inputs = pd.get_dummies(inputs, dummy_na = True)
print(inputs)

#将数据类型inputs和outputs转换为张量格式
import torch
x, y = torch.tensor(inputs.values), torch.tensor(outputs.values)
print(x)
print(y)
'''

'''
import torch
a = torch.arange(12)
b = a.view((3, 4))            
b[:] = 2
print(a)
print(b)
a = torch.arange(12)
b = a.reshape((3, 4))      #reshape和view的作用相同。
b[:] = 2
print(a)
print(b)
'''