欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Python之Excel编辑-[小试牛刀]将表格内容按照类别进行统计和拆分

程序员文章站 2022-03-11 09:05:10
...

Pandas的DataFrame有个groupby的方法,能够按照指定的列进行分组,这样能够很方便的按照指定的类别对表格项进行分类统计。
下面来看一个例子。

任务1:将所有明细表进行合并,并按照产品类别拆分成多个页面

解决办法:
第一步:使用Pandas DataFrame的append方法,将所有的明细表中的内容合并到一个表格中
第二步:使用Pandas DataFrame的groupby方法,指定某个列,将表格的所有内容进行分类

app = xw.App(visible=True, add_book=False)
    file_list = os.listdir(file_path)
    table = pd.DataFrame() #创建一个空的DataFrame
    for file in file_list:
        if '~$' in file:
            continue
        if file.split('.')[-1] != 'xlsx':
            continue
        wb = app.books.open(file_path + '\\' + file)
        for sheet in wb.sheets:
            values = sheet.range('A1').expand().options(pd.DataFrame, header=1, index=False).value
            data = values.reindex(columns=['品类','产品','价格'])#提取所关注的列
            table = table.append(data, ignore_index = True)#将新提取的内容合并到列表中

        wb.save()
        wb.close()
    table = table.groupby('品类') #指定按照品类进行分类

    newbook = app.books.add()
    for idx, group in table: #从分类后的列表中逐组提取内容并写入到一个新的sheet中
        new_worksheet = newbook.sheets.add(idx)
        new_worksheet['A1'].options(index=False).value = group
    newbook.save(file_path+'\\物品分类.xlsx')
    newbook.close()
    app.quit()

基于上述方法,还可以很方便的对每组内容进行统计处理