# 主要组件介绍

2018-10-20  本文已影响0人  desert2017

1.Hawk的关键概念

目前系统仅仅提供了两个任务: 网页采集器和数据清洗, 双击即可加载一个新的模块。

[站外图片上传中...(image-e3c6e3-1540026541143)]

之前配置好的模块,可以保存为任务, 双击或点击右键可加载一个已有任务:

[站外图片上传中...(image-a0f8ce-1540026541143)]

2.线程管理

不论是调试还是执行模式,系统都会在任务管理视图中增加一个或多个线程。
你可以勾选,或取消勾选部分或全部线程,暂停或取消它们。当网站限制抓取时,可以暂停所有线程,等恢复后再次执行。

注意:

  1. 当工作流有误时(比如该列所有数据都空,却在该列添加了 空对象过滤器,那么所有数据都会被过滤)可能不会产生任何数据输出。此时进度条并不会向前推进,产生卡死的假象。此时可强行将其删除
  2. 线程删除的流程是:先安全将其取消,如果线程无响应,则会直接将其杀死

3.Hawk任务市场

为了方便用户间共享高质量的工程,形成良好的社区环境,在Hawk5中提供了市场功能。
//TODO

4.调试系统

除了在调试模式下进行操作之外,Hawk还提供了丰富的工具来确定错误的位置。

4.1.调试与探查窗口

//TODO
调试探查窗口可以方便地展示每个模块的输入量,输出量,因空而跳过的数量,一目了然

4.2.系统级窗口

如何了解总的http请求次数和错误数?在 系统设置-> http请求详情里,详细地给出了请求数,被禁止数,因错误而跳过等数量。 点击 清空数据,即可将计数器置0.

4.3.确定模块的输入和输出

在单步调试模式时,该模块输入的列,会在数据清洗的最上方用蓝色表示,输出列会用绿色表示。

5.日志功能

Hawk包含了几类日志功能, 使用log4net作为日志系统,分为INFO, DEBUG, ERROR, FATAL ,WARNING五种等级。

如何改变日志的级别? 当发现现有日志太多或太少,可以在主菜单-> 调试-> 日志级别 设置

6.多国语言

Hawk5支持了多国语言引擎,会根据操作系统语言自动切换显示的语言。 目前支持的语言包括;

还可以手工设置语言, 在 系统设置语言中切换,下一次启动时,会按上一次设置保存的语言显示。

Hawk凭借WPF的强大功能,一定程度上支持语言热切换,但依然会出现不能全部顺利切换的情形。因此建议在设置语言后,通过重启使语言生效。

6.1.新增其他语言

如果你愿意为Hawk的国际化贡献力量。欢迎新增语言,Hawk新增语言非常简单,在程序的执行目录的Lang文件夹,以xaml格式保存了各国语言的配置文件。拷贝zh_CH.xaml, 并将其中的中文内容替换为对应语言即可。注意:

如果只是希望国际化界面部分,则只需修改不带xml:space=preserve标签部分的内容。而包含该标签的内容,基本都用于显示文档。当然我更希望你可以翻译全部内容,否则没有文档的Hawk是非常难以使用的。

7.帮助文档系统

由于Hawk的使用较为复杂,因此提供了内置的文档系统。

Hawk的文档系统分为新手模式高手模式

7.1.文档编写和自动生成

由于软件在不停地优化升级,会出现模块和文档不一致的问题。为了降低作者编写文档的负担,Hawk采用了自动文档生成的方式:

如果你希望为Hawk编写和完善文档,本节会介绍文档的生成方式。核心文档都位于软件源码路径的Doc/DefaultLanguage.xaml

其语法非常简洁:

建议修改对应的xaml文件后,通过git向主干提交merge request,这样能保证文档质量。那如何预览生成的文档效果? 执行如下命令:

pip install mkdocs
pip install lxml
sh builddoc.sh
mkdocs serve

即可在http://127.0.0.1:8000/中查看预览。

您也可以在线上访问Hawk的全部文档:

https://ferventdesert.github.io/Hawk/

上一篇 下一篇

猜你喜欢

热点阅读