在机器学习中如何处理xml格式数据
2019-03-08 本文已影响0人
崔吉龙
问题描述
在机器学习中,经常会抓去web网页,然后把网页信息转化为格式化的数据,今天我们就学习如何处理xml格式的数据。
原始数据
输入的数据文件 XMLData.xml
<MyDataset>
<Record>
<Number>1</Number>
<String>First</String>
<Boolean>True</Boolean>
</Record>
<Record>
<Number>2</Number>
<String>Second</String>
<Boolean>False</Boolean>
</Record>
<Record>
<Number>3</Number>
<String>Third</String>
<Boolean>False</Boolean>
</Record>
</MyDataset>
导入函数库
from lxml import objectify
使用函数库
这里为了方便我们使用了本地的xml文件。
xml = objectify.parse(open('XMLData.xml'))
root=xml.getroot()
for obj in root.getchildren()
print(obj.getchildren()) # list
输出
[1, 'First', 'True']
[2, 'Second', 'False']
[3, 'Third', 'False']