1.5 这本书不是什么
由于本书涉及计算机科学,地理,统计和图形设计领域,因此出于不同的原因,不同领域的专家很可能会误解它。 我们无法预料到所有这些原因,但是这里可能有几个原因。
1.5.1 不是命令语言
粗读这本书可能会导致一个结论,即其目的是提出一种新的图形脚本语言。 确实,每个图都有一个类似于命令语言的规范。 这一结论的推动力可能是偶尔与现有的定量图形语言(例如Mathematica®,SYSTAT®,S-Plus®和SASGraph®)相似。 这些软件包可以生成各种各样的统计图形,因为它们经过改进以满足统计人员对复杂而灵活的技术图形的需求。 但是,它们在开发时并未考虑全面的图形理论。 通常,由于图形世界的限制,它们的构造具有相似的规则性。 我们对所有这些系统都负有责任,因为它们能够与它们一起产生异常的图形并发现常见的隐式结构。 要了解此系统与基于命令的系统之间的真正区别,请参阅第17章。
简要浏览一下可能得出的另一个结论是,该系统被设计为静态规范语言,而不是动态的探索性系统。相反,通过规范图形框中图形行为的规则,它为动态和探索性图形提供了更丰富的环境。对于面板图形来说尤其如此,在大多数动态图形系统中完全避免使用了面板图形,或者将面板硬连线到特定的数据结构。实际上,我们感兴趣的主要焦点是设计一种足够灵活的系统,以更改状态而无需重新指定规格。实现这种系统的幼稚方法是从用户手势创建命令,将这些命令提供给解释器,然后显示结果。在某些现有软件包中采用的这种方法确实会将其约束为静态系统。本书提出的理论中没有任何东西可以暗示这是最好的,甚至是最合适的实现方法。
1.5.2 不是分类法
当分类学引发新理论或激发对以前的理论可能掩盖的问题的见解时,分类学对科学家很有用。但是,出于自身的考虑,分类在设计上和科学上一样没有生产力。在设计中,对象仅与其支持的系统一样有用。设计的测试在于其处理包括意外,异常和战略逆转在内的场景的能力。本书包括一些分类,但它们可用于开发在一致的系统中灵活而强大的对象。相同问题域的其他分类也是可能的,但是其中许多分类不会导致一个简约而通用的系统。基于对普通用户对真实统计图形之间相似性的视觉判断的聚类分析,已经尝试了一些分类方法(例如,Lohse等,1994)。这种方法对于开发接口可能有用,但是对更深入地了解图形没有任何帮助。习惯用法和标准会使我们对图形领域的多样性视而不见。正式的制度可以使我们摆脱传统的限制。
1.5.3 不是绘图包
该系统并非旨在产生任何可想象的图形。 的确,动机几乎相反:开发一个封闭的系统,然后检查它是否可以产生流行和深奥的图形。 我们试图避免添加不能在整个系统中独立运行的函数,图形或运算符。 毫无疑问,本书中的系统无法完全指定许多统计图形。 我们可以添加许多不同的图形,变换,轴的类型,注释等,但是在形式化系统中我们将始终面临两个限制。
第一个限制适用于任何手绘图。 显然,我们不能期望使用正式的数据驱动系统在鸡尾酒餐巾纸上绘制草图。 总是可以找到未正式链接到数据的创意设计。 制图系统主要涉及计算机辅助设计(CAD)和桌面发布(DTP)。 这些区域有其自己的规则,其驱动力更多是由真实对象的物理外观驱动,而不是功能和数据分析的理论构造。
第二个限制来自系统本身的句法结构。 正如我们将看到的,该系统中的操作员能够产生令人惊讶的各种各样的图形,这可能比任何其他正式系统或计算机绘图程序都要多。 然而,可以想象某些结构可能无法用此处介绍的运算符用一种语言来建模。 毕竟,它是一个封闭的系统。 设计该图形系统时要考虑统计图形使用情况的调查(例如Fienberg,1979年),并考虑到现有的商业和科学图形软件。 然而,当他们展示自己的想法时,不能高估实际用户的创造力和独创性。
1.5.4 不是一本美德的书
该系统能够产生一些可怕的图形。 它的设计中没有任何东西可以防止其被滥用。 我们偶尔会指出其中一些实例(例如,图9.25)。 系统可以产生这样的图形仅仅是由于它基于确定图形含义的数学规则,而不是我们有时用来产生图形的临时规则的结果。 这些规则不是基于个人喜好,而是基于我们在实践中绘制的图形所基于的数学和感知维度。 这些规则能够为《今日美国》和《科学美国人》制作图形。
但是,该系统无法生成无意义的图形。 这是一个强有力的主张,容易受到一个反例的影响。 这是基于系统正式规则的主张,而不是基于对系统可能产生的特定图形的评估。 这是本书中的方法与其他有关统计图形和可视化的方法之间的本质区别。 我们对设计或评估特定图形的兴趣要比了解生成图形的规则的兴趣少得多。 除非有人明确指定这些规则,否则无法开始声称某一特定图形是毫无意义的。
我们也不能完全不同意有关将强大工具置于新手手中的危险性的说法。 计算机代数,统计数据和图形系统为新手提供了很多绳索,使他们吊死自己,甚至可以帮助抑制研究人员所需的基本技能的学习。 但是,由这种情况引起的明显问题并不能证明我们的工具已经过时。 他们需要对这些工具进行富有想象力和纪律性的使用方面的培训。 他们呼吁更多地关注向新用户提供功能强大且复杂的工具的方式。
1.5.5 不是启发式系统
本书的标题是“图形语法”,而不是“一种图形语法”。 虽然启发式策略很有趣,很务实并且通常非常适应,但除非形式系统显示出不足或难以捉摸,否则很少有理由追求它们。 有时以人工智能的名义将启发式方法应用于定义明确的问题有时是时髦的。 如果我们采用这种方法,那么证明启发式系统可以完成正式系统可以完成的所有工作,就是我们的重担。 在我们定义正式系统的功能之前,没有办法进行这种比较。
定义正式系统在该领域具有实际意义。 直到最近,还是通过手工绘制图形来表示数学,统计和几何关系。 计算机图形程序,尤其是科学和数学绘图程序包,使这项任务变得容易得多,但它们并未改变其特别的方面。 生成更复杂图形的统计和数学程序包也没有有助于我们了解它们的创建方式。 这些程序中的每个新图形都是由工程师开发的,他本能地了解本书中的许多规则,并将其应用于特定的实例。
现在数据挖掘已经很流行,我们需要能够系统地构建图形,以便处理更复杂的多元环境。 不幸的是,数据挖掘算法的复杂性远远超过了其显示中使用的图形方法。 大多数数据挖掘系统仍然依赖于数据立方体切片的饼图,折线图和条形图(数据库子集的多路聚合)。 这些图表无法揭示它们表示的实体之间的关系,因为它们没有生成它们的深刻语法。 它们只是硬连接到数据多维数据集的各个方面。 如果我们下钻多维数据集以查看不同的数据片段,我们仍然会得到一个简单的饼图。 树分类器,神经网络和其他算法的显示中也存在类似的难题。
建立一个封闭的正式系统的显着结果是,尽管它解决了更复杂的应用问题,但对用户而言似乎更具适应性。 矛盾的是,封闭系统通常比开放系统更“开放”。 我们不应将启发式方法与灵活性相混淆。 最后,这本书也许是摆在极端的位置,但我们与雅克·贝尔汀(Jacques Bertin)共享的观点是:设计和制作统计图形不是一门艺术。
1.5.6 不是地理信息系统
本书包含几张地图(例如,图1.5)。 这可能会导致一些读者得出结论,我们将其视为地理信息系统(GIS)的框架。 实际上,我们从地理学家那里采用了该系统的一些基本部分,例如投影,层次和美学属性(图形变量)。 我们认为,许多对图形感兴趣的统计学家并未对地理学家的工作给予足够的重视。 得益于Daniel Carr和Linda Pickle等统计学家以及Mark Monmonier,Waldo Tobler和Alan MacEachren等地理学家的努力,这种情况最近正在改变。
本书中的系统不是GIS的模型,因为地理和统计数据在关键方面有所不同。 地理定位在实际时空中,而统计则定位在抽象维中。 这是一个连续的区别,而不是一个明显的突破。 毕竟,存在一个称为空间统计的整个领域(Cressie,1991)。 但是这种焦点上的差异显然意味着,当处理如图11.15所示的统计图形时,针对地理处理进行了优化的系统将不够美观,并且如果要求提供通过地理区域的实时导览,则本书中的系统效果不佳。 现场。 这种焦点差异还会带来许多其他后果。 地理学家已经开发了用于场景分析的拓扑代数(例如,Egenhofer等,1991),而我们已经使用设计代数来模拟析因结构。 地理学家关心肖像学。 我们关心关系。
有些地理学家可能不同意我们在这里的实际抽象区分。 毫无疑问,GIS的功能在可视化抽象数据方面可以证明是无价的。 正如平克(Pinker,1996)所言,统计图形在利用人类在竞争激烈的世界中努力生存而发展的思维模型时,通常最有效。 但这将我们带到了下一个问题。
1.5.7 不是可视化系统
本书包含一些可视化效果(例如,图9.55)。 科学可视化使用逼真的实体建模和渲染技术来表示真实和抽象的对象。 我们利用了可视化文献中开发的一些方法。 例如,可视化数据流模型用于该系统的主干。 与GIS一样,统计数据也有一定的交叉。 统计学家,例如Dianne Cook,JürgenSymanzik和Edward Wegman(例如Symanzik等,1997)采用了由计算机科学家(例如Carolina Cruz-Neira和Thomas DeFanti)开发的沉浸式可视化技术(Cruz-Neira等,1993)来显示数据。
我们可以广泛定义科学可视化,以包括GIS和统计图形。 我们认为,这将削弱其含义。 理解可视化和统计图形之间差异的一种更好的方法是将可视化程序(例如PV〜Wave®和DataVisualizer®)与统计图形包(例如SYSTAT®或S-Plus®)进行比较。 更极端的是,我们甚至可以使用CAD-CAM工程或插图包来制作统计图形。 因为我们不能意味着我们应该。