dataframe columns rename pandas

【869】dataframe通过包含字符过滤 str.contains()

ref: [Pandas] 文本包含.str.contains() import pandas as pd df = pd.DataFrame([['liver','E',89,21,24,64], ['Arry','C',36,37,37,57], ['Ack','A',57,60,18,84], ......
dataframe 字符 contains 869 str

mysql Error 1264: Out of range value for column 'balance' at row 1

报错原因:值超出列的范围 可能原因: 原因1:值超出其可输入的范围。 解决方法: 设置的为INT ,可以把列的值改为BIGINT,或者改成其他数据类型。 原因2:新版本的MySQL对字段的严格检查。 解决方法: 修改my.ini,将sql-mode="STRICT_TRANS_TABLES,NO_A ......
balance column mysql Error range

pandas之rank函数的使用

# pandas排名函数的使用 在Pandas中,可以使用`rank()`函数来进行排名操作。 `rank()`函数可以用于为数据帧中的元素分配排名,并提供不同的排名策略,例如从小到大排名、从大到小排名等。 使用上面的一组模拟数据,介绍`rank`方法的使用。 其中参数`method`: - ave ......
函数 pandas rank

dataframe删除特定条件的行

#### dataframe删除特定条件的行 ##### 单条件删除行 ``` import pandas as pd a = ['Mary', 'Sellina','Zaca', 'mike', 'golla'] b = [26, 28, 27, 30, 40] data = {'name': a ......
dataframe 条件

将dataframe两列转为字典

#### 将dataframe两列转为字典 ``` import pandas as pd a = ['Mary','Sellina','Zaca'] b = [26,28,27] data = {'name':a,'age':b} df = pd.DataFrame(data) ``` 将两列转为 ......
字典 dataframe

【pandas小技巧】--列值的映射

映射列值是指将一个列中的某些特定值映射为另外一些值,常用于数据清洗和转换。 使用映射列值的场景有很多,以下是几种常见的场景: 1. 将字符串类型的列中的某些值映射为数字。例如,将“男”和“女”分别映射为 0 和 1,以便进行机器学习算法的训练和预测。 2. 将缩写替换为全称。例如,将“USA”和“U ......
技巧 pandas

【pandas小技巧】--字符串转数值

字符串转数字的用途和场景很多,其中主要包括以下几个方面: 1. 数据清洗:在进行数据处理时,经常会遇到一些数据类型不匹配的问题,比如某些列中的字符串类型被误认为是数字类型,此时需要将这些字符串类型转换为数字类型,才能进行后续的数值计算或统计分析。 2. 数据整理:有时候输入的原始数据可能存在格式问题 ......
字符串 数值 字符 技巧 pandas

DataFrame 使用 map() 和 apply() 方法结合 lambda 函数来对 DataFrame 中的数据进行转换或应用自定义函数。

import pandas as pd # 创建示例 DataFrame data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Salary': [50000, 60000, 45000] } df = pd.Data ......
函数 DataFrame 方法 数据 lambda

DataFrame 指定某列的格式

import pandas as pd # 创建示例 DataFrame data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25.0, 30.0, 35.0] # 注意:这里的年龄列是浮点数类型 } df = pd.DataFrame(dat ......
DataFrame 格式

DataFrame 按行转json数据

import pandas as pd # 创建示例 DataFrame data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Occupation': ['Engineer', 'Teacher', 'Doctor' ......
DataFrame 数据 json

DataFrame 按列分组groupby

import pandas as pd # 按列分组 data = {'A': ["aa", "bb", "cc", "bb"], 'B': [5, 6, 10, 7], 'C': [0, 10, 3, 12]} df = pd.DataFrame(data) print(df) print(df. ......
DataFrame groupby

DataFrame 重命名列名rename

import pandas as pd # 创建示例 DataFrame data = { 'OldName1': [1, 2, 3], 'OldName2': [4, 5, 6] } df = pd.DataFrame(data) # 重命名列名 new_column_names = { 'Old ......
DataFrame rename

DataFrame 去重,指定列去重drop_duplicates

import pandas as pd # 创建示例 DataFrame data = { 'Name': ['Alice', 'Bob', 'Alice', 'Charlie', 'Bob'], 'Age': [25, 30, 25, 35, 30] } df = pd.DataFrame(dat ......
drop_duplicates duplicates DataFrame drop

DataFrame 存为带格式的excel文件

import pandas as pd data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Salary': [50000, 60000, 45000], 'Location': ['NY', 'CA', 'TX'] ......
DataFrame 格式 文件 excel

DataFrame排序,单列排序,多列排序

import pandas as pd # 创建示例 DataFrame data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [30, 25, 35], 'Salary': [50000, 60000, 45000] } df = pd.Data ......
DataFrame

DataFrame 保留前几列和后几列

import pandas as pd data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Salary': [50000, 60000, 45000], 'Location': ['NY', 'CA', 'TX'] ......
DataFrame

根据DataFrame A列的值筛选DataFrame B中的数据

import pandas as pd # 创建示例 DataFrame A dataA = {'ID': [1, 2, 3, 4], 'Category': ['A', 'B', 'A', 'C']} dfA = pd.DataFrame(dataA) # 创建示例 DataFrame B dat ......
DataFrame 数据

merge连接两个DataFrame

import pandas as pd # 创建左边的示例 DataFrame data1 = {'ID': [1, 2, 3, 4], 'Name': ['Alice', 'Bob', 'Charlie', 'John']} df1 = pd.DataFrame(data1) df1.set_in ......
DataFrame 两个 merge

concat 连接两个DataFrame

import pandas as pd # 创建左边的示例 DataFrame data1 = {'ID': [1, 2, 3], 'Name': ['Alice', 'Bob', 'Charlie']} df1 = pd.DataFrame(data1) df1.set_index('ID', i ......
DataFrame 两个 concat

DataFrame 计数value_counts 后转成df

import pandas as pd # 创建示例 DataFrame data = {'Category': ['A', 'B', 'A', 'C', 'A', 'B', 'C', 'A', 'B']} df = pd.DataFrame(data) # 使用 value_counts() 方法 ......
value_counts DataFrame counts value

DataFrame拆分某列生成新列

import pandas as pd # 创建示例 DataFrame data = {'Name': ['Alice,25', 'Bob,30', 'Charlie,35']} df = pd.DataFrame(data) # 使用 str.split() 方法拆分 'Name' 列的数据 d ......
DataFrame

DataFrame 拼接几列生成新列

import pandas as pd # 创建示例 DataFrame data = {'First Name': ['Alice', 'Bob', 'Charlie'], 'Last Name': ['Smith', 'Johnson', 'Brown'], 'Age': [25, 30, 35 ......
DataFrame

DataFrame根据某列的值取另一列的值

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['apple', 'banana', 'orange', 'apple', 'banana'] } df = pd.DataFrame(data) # ......
DataFrame

DataFrame删除某列

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 使用 drop() 方法删除列 'B' ......
DataFrame

DataFrame 删除某行

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [10, 20, 30] } df = pd.DataFrame(data) # 使用 drop() 方法删除索引为 1 ......
DataFrame

DataFrame 对某列求和、平均值、计数、最大值、最小值

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50] } df = pd.DataFrame(data) # 对列 'B' 求和 column_sum = df['B ......
最大值 平均值 DataFrame

DataFrame 新增新列

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data) # 增加新列 'C' new_data = [10, 20, 30] df['C' ......
DataFrame

DataFrame修改某列的值

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] } df = pd.DataFrame(data) # 修改列 'A' 的值 new_values = [10, 20, 30] df ......
DataFrame

DataFrame使用iloc选择数据

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['a', 'b', 'c', 'd', 'e'], 'C': [10, 20, 30, 40, 50] } df = pd.DataFrame(data ......
DataFrame 数据 iloc

DataFrame 使用条件索引选择满足条件的行

import pandas as pd # 创建示例 DataFrame data = { 'A': [1, 2, 3, 4, 5], 'B': ['a', 'b', 'c', 'd', 'e'], 'C': [10, 20, 30, 40, 50] } df = pd.DataFrame(data ......
条件 DataFrame 索引