欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

如何把xml文件转化成格式化的pandas数据

程序员文章站 2022-03-30 21:55:39
...

问题描述

我们在机器学习中往往把从网络上抓取的xml文件,转化为简单的格式化文件,从而更容易使用,我们应该如何操作呢?

导入函数库

from lxml import objectify
import pandas as pd

读取结构化的数据

datalist = []
xml = objectify.parse(open("XMLData.xml"))
root = xml.getroot()
for child in root.getchildren()
    str = []
    for obj in child.getchildren():
        str.append(obj.text)
    datalist.append(str)

把list转化为DataFrame数据结构

构建一个DataFrame数据库
df = pd.DataFrame(columns=(['Number','String','Boolean']))

转载于:https://www.jianshu.com/p/032e90d93b2e