pandas

pandas-自定义函数映射

自定义函数 目录自定义函数自定义操作map()自定义操作apply()对指定轴的操作,聚合,统计对每个数值进行转换自定义操作applymap()参考资料 自定义操作map() map,用于Series实现每个值得处理 map() 是一个Series的函数,map()将一个自定义函数应用于Series ......
函数 pandas

pandas使用1

涉及的几个重要的类: pandas.core.frame.DataFrame:表示表格数据 pandas.core.series.Series:表示一组数据 data.xlsx数据 import pandas as pd df = pd.read_excel("./data.xlsx", index ......
pandas

【小睿的ML之路】Pandas数据预处理(含泰坦尼克号数据分析案例实战)

import pandas food_info = pandas.read_csv("food_info.csv",encoding="gbk") print(food_info) 名称 价格(元) 糖分(g) 重量(kg) 含水量(mg) 0 苹果 200 20 10 30 1 香蕉 100 50 ......
数据 数据分析 实战 案例 Pandas

pandas中的dataframe使用loc取数据之后进行操作后对原来的dataframe产生影响的bug

相关问题: Python pandas.DataFrame在用ix, loc, iloc 索引的时候就相当于拷贝copy了一个对象_reachHigher的博客-CSDN博客 针对这样子的dataframe: 如果进行单列选取后得到的是series类型的数据: 那么对part_1进行修改后会对原来的 ......
dataframe 数据 pandas bug loc

【小睿的ML之路】Pandas索引与计算

import pandas food_info = pandas.read_csv("food_info.csv",encoding="gbk") print(food_info) 名称 价格(元) 糖分(g) 重量(kg) 含水量(mg) 0 苹果 200 20 10 30 1 香蕉 100 50 ......
索引 Pandas

【小睿的ML之路】Pandas数据读取

import pandas food_info = pandas.read_csv('food_info.csv',encoding='gbk') print(type(food_info)) print(food_info.dtypes) print(help(pandas.read_csv)) ......
数据 Pandas

【Python】pandas 求风向数据中的主导风向

data = [342.8, 337.96, 336.68, 337.94, 337.35, 340.4, 342.42, 341.86, 339.4, 341.76, 342.9, 343.63, 338.88, 339.43] # 风向角度区分 directions = { "北": [(348 ......
风向 主导 数据 Python pandas

python pandas 读取msql并转置数据表

import random,string,json,pymysql import pandas as pd connect = pymysql.connect(user = '', password = 'h', db = 'g, host = 'r', port = 3306, charset = ......
数据表 数据 python pandas msql

Python pandas 读取 excel文件

参考:https://www.jb51.net/article/283627.htm # 单纯导出一个数据集 def exportData_pandas(excelFile='output.xlsx'): try: # data = {'Name': ['Alice', 'Bob', 'Charli ......
文件 Python pandas excel

pandas DataFrame 修改列名, 新增列的方法

pandas dataframe 修改列名的方法 加之rename函数,用字典的形式替换式的修改, df.rename(columns={'a':'A',"b":"B"}) df 三、obj[‘col’] = value 方法直接对 DataFrame 直接赋值即可 in [6]: data['d' ......
DataFrame 方法 pandas

通过pandas读取xls文件系统提示:no engine?

大家好,我是皮皮。 一、前言 前几天在Python最强王者群【wen】问了一个Python自动化办公的问题,一起来看看吧。 通过pandas读取xls文件(pd.read_excel)系统提示:no engine for filetyppe xls,请问应该如何处理呢? 二、实现过程 后来【隔壁😼 ......
文件 pandas engine 系统 xls

Pandas处理数据增、删、改、查操作

Pandas处理数据增、删、改、查,日常使用小结,清晰版 原创 ISEE小栈 ISEE小栈 2023-07-30 19:25 发表于北京 收录于合集 #Python26个 #Pandas4个 ISEE小语 论如何判断一个人是真有钱还是装有钱? 在网上看到这样的一个回答: “穷人是小心翼翼地大方,有钱 ......
数据 Pandas

python pandas学习

import pandas as pd m_list=[( 'join' ,25,' male'), (' 1isa', 30, ' female'), (' david',' 18',' male' )] df=pd.DataFrame(m_list, columns=[' Name' ,' ag ......
python pandas

pandas 分组 抽样

import pandas as pd data = pd.read_csv("data.csv") grouped_data = data.groupby("Group") sampled_data = grouped_data.apply(pd.DataFrame.sample, n=200, ......
pandas

Pandas - iloc[]函数

1.iloc[]函数作用: iloc[]函数,属于pandas库,全称为index location,即对数据进行位置索引,从而在数据表中提取出相应的数据。 开始准备: import pandas as pd df = pd.read_excel(r'D:\PyCharm\数据处理pandas\数据 ......
函数 Pandas iloc

Python学习笔记:pandas.Series.str.split分列

split() 方法通过指定分隔符对字符串进行切分,返回分割后的字符串列表 pandas.str.split分列 Series.str.split(pat=None, expand=False) 返回分割后的Series ......
笔记 Python pandas Series split

pandas-空值处理

## pandas-空值处理 [TOC] ## pandas中的None和NaN type(None) --类型是 NoneType 空的对象类型 type(NaN) --类型是 float 浮点型 Pandas中None 和 NaN 都视作np.nan numpy中的三个常量 np.NAN 、np ......
pandas

pandas-数值映射和替换

## pandas-数值映射和替换 [TOC] 映射列值是指将一个列中的某些特定值映射为另外一些值,常用于数据清洗和转换。 ### 映射map() ``` Series.map(arg,na_action=None) arg: 接收 function、dict 或 Series,表示映射关系; `` ......
数值 pandas

pandas-遍历和迭代

## pandas-遍历和迭代 [TOC] 遍历数据是最常见的一种方式,pandas同样也可以遍历。 iterrows() 或 itertuples():这两个方法用于遍历 DataFrame 的行。 iterrows() 返回一个迭代器,产生索引和行的元组,而 itertuples() 返回一个迭 ......
pandas

pandas-数据合并和拆分

## pandas-数据合并和拆分 [TOC] 数据集拆分是将一个大型的数据集拆分为多个较小的数据集,可以让数据更加清晰易懂,也方便对单个数据集进行分析和处理。 同时,分开的数据集也可以分别应用不同的数据分析方法进行处理,更加高效和专业。 数据集合并则是将多个数据集合并成一个大的数据集,可以提供更全 ......
数据 pandas

Pandas中的to_datetime函数用法

## Pandas中的to_datetime函数用法 ```python import datetime import pandas as pd import numpy as np ``` ### 将字符串转换为日期时间: ```python pd.to_datetime('2023-09-06' ......
to_datetime 函数 datetime Pandas to

pandas 的魔力

MultiIndex 是 Pandas 的一个多层索引对象,能够对数据进行直观、灵活的操作并且能够表示高维数据。 numpy与pandas Numpy 更注重运算效率,目的是运算;Pandas 更注重对二维表格等数据进行分析,能够直观地展示、处理数据。 pandas优点 Pandas 具有增强图表可 ......
魔力 pandas

Pandas DataFrame 数据存储格式比较

Pandas 支持多种存储格式,在本文中将对不同类型存储格式下的Pandas Dataframe的读取速度、写入速度和大小的进行测试对比。 https://avoid.overfit.cn/post/387acc48c7dd42a49f7bec90cc6d09ae ......
DataFrame 格式 数据 Pandas

pandas库

[toc] pandas官方文档:https://pandas.pydata.org/pandas-docs/stable/?v=20190307135750 pandas基于Numpy,可以看成是处理文本或者表格数据。pandas中有两个主要的数据结构,其中 - Series数据结构类似于Nump ......
pandas

pandas + excel : 数据存储

数据:data = [{1: 94, 3: 36, 7: 34}, {1: 96, 3: 34, 7: 46}, {1: 103, 3: 32, 7: 65}, {1: 61, 3: 16, 7: 7}, {1: 145, 3: 46, 7: 24}, {1: 210, 3: 81, 7: 34}, ......
数据 pandas excel

15个基本且常用Pandas代码片段

Pandas提供了强大的数据操作和分析功能,是数据科学的日常基本工具。在本文中,我们将介绍最常用的15个Pandas代码片段。这些片段将帮助简化数据分析任务,从数据集中提取有价值的见解。 https://avoid.overfit.cn/post/d5097a67e5c34a0ab42395d8c2 ......
片段 常用 代码 Pandas

Python 利用pandas多列分组多列求和

一、需求描述: 如下Excel数据 需要按 ASIN、SKU、品名、店铺 对 1-31 的列进行分组求和,实际数据是有很多重复的SKU数据 二、代码实现 import pandas as pd # 从Excel获取数据 df = pd.read_excel(r'C:\\Users\\liuchunl ......
Python pandas

pandas-重新索引

## pandas-重新索引 [TOC] ### reindex() ``` DataFrame.reindex(self, labels=None, index=None, columns=None, axis=None, method=None, copy=True, level=None, f ......
索引 pandas

pandas-修改列行名称

## pandas-修改列行名称 [TOC] ### 行和列名全部修改 ### columns属性 ```python import pandas as pd df = pd.DataFrame({'a':[1,2,3], 'b':[4,5,6], 'c':[7,8,9]}) print(df) # ......
名称 pandas

pandas 自动化处理Excel数据

需求: 如下一份这样的Excel数据 现在需要把学生的学号、姓名分离出来到单独的一列 ,将 测验、讨论、成绩三列转换成数值,并把讨论这列的“-”转换成 0 显示 最后把处理好的内容输出到新的Excel文件!!! 对应完整的代码和解释如下: import pandas as pd df = pd.re ......
数据 pandas Excel