dataframe pandas iloc loc

pandas python re模块匹配不同的sheet_name

3 You can use pandas.ExcelFile to have a peek at the sheet names, then select the sheets to keep with any method (here your regex), finally load with  ......
sheet_name 模块 pandas python sheet

Ceil and floor of the dataframe in Pandas Python – Round up and Truncate

In this article, we will discuss getting the ceil and floor values of the Pandas Dataframe. First, Let’s create a dataframe. Example: Python3 # import ......
and dataframe Truncate Pandas Python

【pandas小技巧】--拆分列

拆分列是`pandas`中常用的一种数据操作,它可以将一个包含多个值的列按照指定的规则拆分成多个新列,方便进行后续的分析和处理。拆分列的使用场景比较广泛,以下是一些常见的应用场景: 1. 处理日期数据:在日期数据中,经常会将年、月、日等信息合并成一列,通过拆分列可以将其拆分成多个新列,方便进行时间序 ......
技巧 pandas

【pandas小技巧】--反转行列顺序

反转`pandas` `DataFrame`的行列顺序是一种非常实用的操作。在实际应用中,当我们需要对数据进行排列或者排序时,通常会使用到Pandas的行列反转功能。这个过程可以帮助我们更好地理解数据集,发现其中的规律和趋势。同时,行列反转还可以帮助我们将数据可视化,使得图表更加易于理解。 除了常规 ......
行列 顺序 技巧 pandas

pandas模块------------------------筛选条件loc(多条件选择)

loc 在选择时应用条件。 单条件:选择大于90成绩的学生信息: import pandas as pdsource = pd.read_excel('C:/Users/Administrator/Desktop/source.xlsx')print(source)da = source.loc[( ......
条件 模块 pandas loc

pandas模块--------------------------------相同(不同)文件夹下相同格式的Excel表格数据,汇总到一张表里面

上代码:import pandas as pdimport os#文件路径file_dir = r'C:/Users/Administrator/Desktop/test/'#构建新的表格名称new_filename = file_dir + '/new_file.xlsx'#找到文件路径下的所有表 ......
文件夹 表格 模块 格式 文件

盘点一个Pandas中df转列表处理基础知识

大家好,我是皮皮。 ### 一、前言 前几天在Python黄金群【东哥】问了一个`Pandas`基础的问题,这里拿出来给大家分享下。 ![image.png](https://upload-images.jianshu.io/upload_images/26239789-eff729351811e3 ......
基础知识 基础 知识 Pandas

spark dataset dataframe 动态添加列

>需求 利用SparkSQL计算每一行数据的数据质量,如果数据不为NULL或者不为空字符串(或者符合正则表达式),那么该字段该行数据积一分 >网上解决方案 https://blog.csdn.net/Code_LT/article/details/87719115 https://blog.csdn ......
dataframe dataset 动态 spark

【pandas小技巧】--修改列的名称

重命名 `pandas` 数据中列的名称是一种常见的数据预处理任务。这通常是因为原始数据中的列名称可能不够清晰或准确。例如,列名可能包含空格、大写字母、特殊字符或拼写错误。 使用 `pandas` 的 `rename`函数可以帮助我们更改列名,从而使数据更加清晰和易于理解。此外,重命名列名还可以确保 ......
名称 技巧 pandas

pandas模块---------------------------------常用求平均average的用法

求平均值代码:import pandas as pd #导入模块df=pd.read_excel(r'C:\Users\Administrator/Desktop/test/1.xlsx')#文件路径a=lambda x : x.mean(1).round(2) #lambda函数m=a(df.il ......
模块 常用 average pandas

pandas模块---------------------求和,求平均

求和,求平均import pandas as pdstudent = pd.read_excel('C:/Users/Administrator/Desktop/1.xlsx')student = student.set_index('ID')temp = student[['Test_1','Te ......
模块 pandas

【pandas小技巧】--按类型选择列

本篇介绍的是`pandas`选择列数据的一个小技巧。之前已经介绍了很多选择列数据的方式,比如`loc`,`iloc`函数,按列名称选择,按条件选择等等。 这次介绍的是按照列的**数据类型**来选择列,按类型选择列可以帮助你快速选择正确的数据类型,提高数据分析的效率。 # 1. 类型种类 `panda ......
类型 技巧 pandas

pandas模块--------------------基础篇学习

1.读取Excel数据 Python通过pandas库可以轻松地读取Excel数据。pandas库是一个专门用于数据分析和处理的库,它可以将Excel中的数据读取为DataFrame格式,便于进行后续的数据分析和操作。 import pandas as pddata = pd.read_excel( ......
模块 基础 pandas

pandas模块-------------------一次读取多个excel文件并合并

合并不同excel表格的内容: 代码如下: import pandas as pdimport osinputdir=r'C:\\Users\\Administrator\\Desktop\\test'df_empty=pd.DataFrame(columns=['名称','列1','列2'])fo ......
模块 多个 文件 pandas excel

odoo pandas

fieldstr = '''id,debit,credit,balance''' self.env.cr.execute('''select %s from account_move_line order by id desc''' % fieldstr) try: a = self.env.cr. ......
pandas odoo

用concat比较两个dataframe

因为equals会比对索引等,可能出现内容相同但是行序不同比对失败,可以采用concat,去除重复后如果为空则表示数据一致。 1 #比对两个DataFrame 2 3 if df1.equals(df2): 4 return True, None 5 else: 6 diff_row = pd.co ......
dataframe 两个 concat

大数据量时生成DataFrame避免使用效率低的append方法

转载请注明出处:https://www.cnblogs.com/oceanicstar/p/10900332.html append方法可以很方便地拼接两个DataFrame df1.append(df2) > A B > 1 A1 B1 > 2 A2 B2 > 3 A3 B3 > 4 A4 B4 ......
DataFrame 效率 方法 数据 append

pandas模块-----------比对不同数据(部分相同)

代码如下: import pandas as pd# 学生成绩表df_grade = pd.read_excel("find.xlsx")df_grade.head()# 学生信息表df_sinfo = pd.read_excel("data.xlsx")df_sinfo.head()# 只筛选第二 ......
模块 部分 数据 pandas

Pandas学习笔记之常用功能

一、数值计算和统计 1.数学计算方法 # 主要数学计算方法,可用于Series和DataFrame(1) df = pd.DataFrame({'key1':np.arange(10), 'key2':np.random.rand(10)*10}) print(df) print(' ') prin ......
常用 功能 笔记 Pandas

Pandas学习笔记之时间处理

一、Pandas时刻数据 时刻数据代表时间点,是pandas的数据类型,是将值与时间点相关联的最基本类型的时间序列数据 1.pd.Timestamp date1 = datetime.datetime(2016,12,1,12,45,30) # 创建一个datetime.datetime date2 ......
时间 笔记 Pandas

Pandas学习笔记之Dataframe

一、Dataframe基本概念 # 二维数组"Dataframe:是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值、字符串、布尔值等。 data = {'name': ['Jack', 'Tom', 'Mary'], 'age': [18, 19, 20], 'gender': [' ......
Dataframe 笔记 Pandas

【pandas小技巧】--随机挑选子集

在 `pandas` 中,如果遇到数据量特别大的情况,随机挑选 DataFrame 的子集可以帮助我们更深入地了解数据,从而更好地进行数据分析和决策。 随机挑选子集的用途主要有: 1. 评估数据质量:随机挑选 DataFrame 的子集可以帮助我们检查数据集的质量,以便进一步探索和挖掘数据。例如,我 ......
子集 技巧 pandas

Pandas学习笔记之Series

一、Series基本概念及创建 1.基本概念 # Series 数据结构 # Series 是带有标签的一维数组,可以保存任何数据类型(整数,字符串,浮点数,Python对象等),轴标签统称为索引 # 导入numpy、pandas模块 import numpy as np import pandas ......
笔记 Pandas Series

使用pandas.to_html时怎么自定义表格样式

# 一、通过标签名设置`css`样式 使用`pd.to_html()`方法如果不指定文件路径,该函数会返回一个格式化的`html`字符串,我们可以对这个字符串进行自定义操作,比如直接用我们设置的`css`样式加上这个格式化的`html`,就可以实现自定义表格样式,如下: ```python data ......
样式 表格 to_html pandas html

DataFrame随机选行+纵向拼接

#### `Dataframe`随机选行 (1)`dataframe`实例: ``` city_data = {'city': ['beijing', 'shanghai', 'xining', 'dalian', 'xian', 'chongqing'], 'location': ['north' ......
纵向 DataFrame

DataFrame筛选多行和多列

#### Dataframe筛选多行 在实际数据筛选的时候,有时候需要选择多行,例如,有一个列表数据,需要在Dataframe里筛选,某列中在列表数据中的行。 在这种情况下可以使用`isin`语法。具体如下: ``` obj_df = df[df['obj_col'].isin(obj_list)] ......
DataFrame

rgi heatmap 报错AttributeError: 'DataFrame' object has no attribute 'append'

在使用rgi heatmap 时候运行时候报错: rgi heatmap -i rgi_json/ --output rgi_heatmap -cat gene_family -clus samples 报错: Traceback (most recent call last): File "/gp ......

【864】pandas dataframe根据规则批量赋值

ref: Pandas新增一列并按条件赋值? 把下图中的 NaN 都赋值为 0 df.loc[条件判断, 'value'] = 0 m = pd.merge(gdf_africa, df_af_mp, how='left', on='country') m.loc[m['value'].isna() ......
dataframe 规则 pandas 864

pandas-2023-07-20

1、用pandas读取文件,如果是字符串类型会被当做object类型。 2、用head可以传入要输出显示的行数,但是指定行数不包括表头(并且观察到表头行不作为索引值0),另外,如果不传入参数时会默认输出表头加5行表格内容,weather.csv文件引用自以下博客https://blog.csdn.n ......
pandas 2023 07 20

【pandas小技巧】--读取多个文件

日常分析数据时,只有单一数据文件的情况其实很少见,更多的情况是,我们从同一个数据来源定期或不定期的采集了很多数据文件;或者从不同的数据源采集多种不同格式的数据文件。 在这样的情况下,分析数据之前,需要将不同的数据集合并起来。合并数据一般有两个维度,一是同构的数据集合并后行数增加;一是异构的数据集合并 ......
多个 技巧 文件 pandas