用EXCEL的VBA将PHPCMS的备份文件转换成HTML的一次

2018-11-26  本文已影响0人  空气外

背景

有个PHPCMS的网站停了,但是网站的历史文章又想要看看,网站停了以后,管理员发来了网站的所有数据。

分析

因为不会PHP,所有本地环境跑网站不优先考虑。

有MySQL数据库文件,但是不熟悉MySQL数据库,也就不下载数据库了。

有PHPCMS导出的SQL文件,但是不是标准的SQL文件,不能用于导入数据库。不过这个文本格式的文件已经包含了所有文章的内容。

尝试

1.将v9_news 文章主表,v9_news_data 文章从表 用 vlook 函数拼接了一个 “news full”表。

2.用邮件合并的方式,直接生成了2000页的DOC 文档。

3.但是文章的附件图片未能显示……

行动

1.将几个SQL 合并成一个文件。(导出文件是按照2MB进行了分割)

2.下载了 PHPCMS的数据字典。

3. 用到的表有: v9_news 文章主表,v9_news_data 文章从表,v9_attachment 附件表, v9_attachment_index 附件关系表

4.将这几个表的插入语句用 VSCODE处理成 csv格式,导入EXCEL。

5.mysql 数据库的时间转换到 excel的时间,用公式  =(Q2+8*3600)/86400+70*365+19,再用函数拼接成字符串格式。

6.用 VBA 将记录读取到txt文件中。

1PrivateSub CommandButton1_Click() 2DimfsoAsObject, sFileAsObject 3ConstForReading =1, ForWriting =2, ForAppending =8, TristateFalse =0 4Setfso =CreateObject("Scripting.FileSystemObject") 5SetsFile = fso.OpenTextFile("d:\testfile.txt", ForAppending, TristateFalse) 6Forc =2To1818 7 8sFile.WriteLine"<div><h3>"+ Sheet1.Cells(c,"d").Value +"</h3>" 9sFile.WriteLine"<h5>日期:"+ Sheet1.Cells(c,"w").Value +"</h5>"10Forccccc =2To181811wenzhangID = Sheet2.Cells(ccccc,"a")12IfwenzhangID = Sheet1.Cells(c,"a")Then13NewsData = Sheet2.Cells(ccccc,"b").Value14sFile.WriteLine"<div>"& NewsData &"</div>"15EndIf16Next17'sFile.WriteLine "<div>" + getNewsData(Sheet1.Cells(c, "a")) + "</div>"181920DimkeyArray()AsSingle21DimiAsSingle'数组计数22i =023Forcc =2To82824aid = Sheet4.Cells(cc,"c")25Ifaid = Sheet1.Cells(c,"a")Then26ReDimkeyArray(i +1)27keyArray(i) = Sheet4.Cells(cc,"d")28i = i +129EndIf3031Next32Ifi >0Then33ForEachaaaIn keyArray3435' MsgBox aaa3637Forccc =2To7463839ID = Sheet3.Cells(ccc,"a")40IfID = aaaThen41'MsgBox Sheet3.Cells(ccc, "e").Value4243sFile.WriteLine"<img width=""100%"" src=uploadfile/"+ Sheet3.Cells(ccc,"e").Value +" />"44EndIf454647Next48495051Next5253EndIf54555657sFile.WriteLine"</div>"5859Next6061sFile.Close62Setfso =Nothing63SetsFile =Nothing64MsgBox"OKOK!!!"6566End Sub

遇到的问题

1. VBA 不熟悉,基本上都是粘贴复制。做了几个函数调用,总是有这样那样的问题,调用不成功,后来只好来个嵌套大法,层层嵌套了。

 几个不成功的函数

2.如果单元格里面有连续四个空格的话,FileSystemObject.WriteLine 会报错,不明白为什么。

3.还有两个单元格看起来没有什么特别的内容,FileSystemObject.WriteLine 也会报错,原因不明,也不知道该怎样分析,最后把单元格内容设定为“读取错误”给跳过了。

4.变量名,格式啥的非常随意,估计过几天自己也不认得了。

5.认为这样简单的任务用 VBA 搞定应该很宽,但是没想到在做循环的时候,竟然在怎样判断数组的元素个数上搜了半天。

想法:

下次这样的任务还是用 NOPI 做。

上一篇下一篇

猜你喜欢

热点阅读