1484. 按日期分组销售产品

发布时间 2023-08-14 14:30:06作者: 吾执青剑向天涯

1484. 按日期分组销售产品

2023年8月14日09:49:54

1484. 按日期分组销售产品

简单

SQL Schema


Pandas Schema


Activities

+-------------+---------+
| 列名         | 类型    |
+-------------+---------+
| sell_date   | date    |
| product     | varchar |
+-------------+---------+
该表没有主键(具有唯一值的列)。它可能包含重复项。
此表的每一行都包含产品名称和在市场上销售的日期。

编写解决方案找出每个日期、销售的不同产品的数量及其名称。
每个日期的销售产品名称应按词典序排列。
返回按 sell_date 排序的结果表。
结果表结果格式如下例所示。

示例 1:

输入:
Activities 表:
+------------+-------------+
| sell_date  | product     |
+------------+-------------+
| 2020-05-30 | Headphone   |
| 2020-06-01 | Pencil      |
| 2020-06-02 | Mask        |
| 2020-05-30 | Basketball  |
| 2020-06-01 | Bible       |
| 2020-06-02 | Mask        |
| 2020-05-30 | T-Shirt     |
+------------+-------------+
输出:
+------------+----------+------------------------------+
| sell_date  | num_sold | products                     |
+------------+----------+------------------------------+
| 2020-05-30 | 3        | Basketball,Headphone,T-shirt |
| 2020-06-01 | 2        | Bible,Pencil                 |
| 2020-06-02 | 1        | Mask                         |
+------------+----------+------------------------------+
解释:
对于2020-05-30,出售的物品是 (Headphone, Basketball, T-shirt),按词典序排列,并用逗号 ',' 分隔。
对于2020-06-01,出售的物品是 (Pencil, Bible),按词典序排列,并用逗号分隔。
对于2020-06-02,出售的物品是 (Mask),只需返回该物品名。

通过次数

57K

提交次数

83.9K

通过率

67.9%

答案

import pandas as pd

def categorize_products(activities: pd.DataFrame) -> pd.DataFrame:

    df=activities.groupby('sell_date')['product'].agg(['nunique',lambda x:','.join(sorted(set(x)))])
    df.rename(columns={'nunique':'num_sold','<lambda_0>':'products'},inplace=True)
    df.reset_index(inplace=True)
    df.sort_values(by='sell_date',inplace=True)
    return df



    # result = activities.drop_duplicates().sort_values("product").groupby("sell_date",as_index=False)
    # df = result['product'].agg("count").rename(columns={"product":"num_sold"})
    # df["products"] = result['product'].apply(lambda x:','.join(x.values))[["product"]]

    # return  df