在机器学习中如何处理xml格式数据

2019-03-08  本文已影响0人  崔吉龙

问题描述

在机器学习中,经常会抓去web网页,然后把网页信息转化为格式化的数据,今天我们就学习如何处理xml格式的数据。

原始数据

输入的数据文件 XMLData.xml

<MyDataset>
    <Record>
        <Number>1</Number>
        <String>First</String>
        <Boolean>True</Boolean>
    </Record>
    <Record>
        <Number>2</Number>
        <String>Second</String>
        <Boolean>False</Boolean>
    </Record>
    <Record>
        <Number>3</Number>
        <String>Third</String>
        <Boolean>False</Boolean>
    </Record>
</MyDataset>

导入函数库

from lxml import objectify

使用函数库

这里为了方便我们使用了本地的xml文件。

xml = objectify.parse(open('XMLData.xml'))
root=xml.getroot()
for obj in root.getchildren()
    print(obj.getchildren())  # list  

输出

[1, 'First', 'True']
[2, 'Second', 'False']
[3, 'Third', 'False']
上一篇下一篇

猜你喜欢

热点阅读