蜘蛛

您可以使用独立于 AppDNA 的独立定向蜘蛛来捕获 Web 应用程序的运行时 HTML 页面,以便将它们导入到 AppDNA 中。

要启动独立定向蜘蛛:

  • 从“Windows 开始”菜单中,选择“Citrix AppDNA”>“Web 应用程序捕获”。

注意:如果此选项不可用,请检查您是否已安装了独立的 Web 捕获工具。有关更 安装独立 Web 捕获工具多信息,请参阅。

概述

您可以在屏幕顶部输入要捕获的 Web 应用程序的 URL。URL 列表下面有三个选项卡。第一个提供了蜘蛛活动的日志,您可以使用其他两个选项卡输入设置和选项。这些问题在下面的单独标题下加以记录。

屏幕主要部分的选项如下所示:

URL。在此处指定 Web 应用程序的 URL,然后单击“添加 URL”将其添加到列表中。此 URL 必须是一个有效的 URL,并且可以从运行独立工具的计算机导航到该 URL。您可以添加多个 URL。例如,如果您想运行一系列 Web 捕获,这很有用。

删除 URL。从列表中删除 URL。点击此按钮之前,选择要删除的 URL。

**自动进行 **使用手动捕获选项时,可以使用此按钮更改为自动模式。然后,蜘蛛会自动跟随链接,只有在遇到输入表单或对话框时才会停止,具体取决于所选的设置。

手动捕捉。如果要使用手动模式,请选中此复选框。在此模式下,您可以按照相关链接手动浏览 Web 应用程序。对于大量使用 JavaScript 和相关技术(如 AJAX)的 Web 应用程序使用手动模式来修改页面,或者如果存在复杂的单点登录 (SSO) 方案,则可以使用手动模式。例如,您可以选择在捕获 SSO 和 AJAX 页面后切换到自动模式。如果希望蜘蛛以自动模式运行,并且仅在遇到输入表单或对话框时停止,具体取决于所选配置选项,请清除此复选框(默认值)。

导入 CSV。导入列出需要捕获的 URL 的 CSV 文件。

导出 CSV。导出列出已捕获的 URL 的 CSV 文件。

开始捕捉。单击以开始从顶部捕获 URL 列表。

取消所有。点击停止蜘蛛。

跳过网站。单击以跳过当前网站。

“常规设置”选项卡

“常规设置”选项卡提供了控制定向蜘蛛行为的选项。

生成微星。如果要生成 MSI 以导入到 AppDNA 中,请选中此复选框。通常,当您仅使用蜘蛛捕获 Web 应用程序时,您可以执行此操作。如果要将捕获的页面与源文件合并以进行更全面的分析,请清除此复选框。然后,您需要将蜘蛛的输出与 Web 应用程序的源文件结合起来,然后在组合的文件独立 Web 应用程序源到 MSI 转换器上运行。

捕获结果输出目录。设置要存储输出文件的位置。在这里你可以找到生成的 MSI 文件和捕获的网页。

站点遍历深度。指定您希望蜘蛛遵循的链接深度。例如,如果您指定深度为 1,则蜘蛛会从网站的索引页面开始,并查看它包含多少链接,并访问这些链接中的每个链接。如果其中一个链接包含更多链接,如果深度设置为 2 或更多的深度,蜘蛛会访问它们。默认值为 25。

形成用户交互。如果您希望蜘蛛(在自动模式下运行时)停止在具有表单的每个页面上并提示您填写它,请选中此复选框。当 Web 应用程序具有需要用户登录的页面时,这尤其有用。当选择此选项并且蜘蛛检测到网页上的表单时,它会打开一个对话框并以黄色高亮显示表单输入框。有关详细信息,请参阅网页捕获处理

浏览器超时(秒)。指定您希望蜘蛛在忽略该页面并移动到下一页面(在自动模式下运行蜘蛛时)之前等待页面加载的时间长度(以秒为单位)。当您在手动模式下运行蜘蛛时,此设置仅用于第一页。默认值为 15 秒。

延迟超时启动(秒)。在旧版本的 Internet Explorer 上指定一个额外的超时时间(以秒为单位),以便在浏览器超时(上面输入)开始之前导致延迟。这是必要的,因为旧版本的 Internet Explorer(特别是在旧版本的 Windows 上运行时)可能需要一些时间才能移动到下一个 URL。默认值为 1 秒。

捕获之间的延迟(毫秒)。如果您希望蜘蛛在捕获每个页面之间等待指定的时间段,请选中此复选框。如果您的企业防火墙会阻止蜘蛛在自动模式下运行,这将非常有用。在手动模式下运行蜘蛛时不使用此设置。输入等待期(以毫秒为单位)。

蜘蛛设置选项卡

“蜘蛛设置”选项卡提供了控制定向蜘蛛的其他选项。

URL 包含内容。默认情况下,AppDNA 蜘蛛不跟随外部域的链接。但是,您可以创建希望蜘蛛跟随链接的外部域的列表。

域名。此处指定外部域,然后单击“添加”将其添加到允许的外部域列表中。如果 Web 应用程序重定向到另一个域,请在此处输入该域。同样,如果使用不同域中的外部身份验证服务器,请在此处输入该域。

包括子域名。如果您希望蜘蛛跟踪指向 Web 应用程序主域的子域的链接(例如,http://staging.dev.myserver/myWebApp),请选中此复选框。如果 Web 应用程序重定向到主域的子域,请确保选中此复选框。如果您希望蜘蛛忽略指向子域的链接,请清除此复选框。

Web 应用程序限制到其虚拟目录。如果希望蜘蛛忽略 Web 应用程序虚拟目录之外的任何链接(例如,http://myserver/myWebApp),请选中此复选框。当同一服务器上有多个 Web 应用程序并且每个 Web 应用程序被 URL 的不同部分访问时,这很有用。如果您希望蜘蛛跟踪虚拟目录之外的链接,请清除此复选框。

自动关闭对话框和弹出窗口。如果希望蜘蛛自动关闭在自动模式下运行时遇到的对话框,请选中此复选框。例如,如果您希望使导入保持无人参与运行,则此功能非常有用。但是,请注意,蜘蛛无法关闭 Java 启动的弹出窗口。如果您希望蜘蛛等待您手动关闭对话框,请清除此复选框。

允许代理身份验证提示。如果 LAN 配置为使用代理服务器,并且您已选中“自动关闭对话框和弹出窗口”复选框,请选中此复选框。这意味着蜘蛛会等待您在身份验证对话框中填写您的登录信息。如果 LAN 未配置为使用代理服务器,请清除此复选框。

重复。此设置仅在手动模式下运行时会影响蜘蛛。如果您希望蜘蛛多次捕获同一页,如果页面更改,请选中此复选框。当捕获使用 JavaScript 和相关技术(如 AJAX)在加载页面后修改页面的 Web 应用程序时,这很有用。选中此复选框后,请使用以下命令配置选项:

  • URL 的最大重复数。输入您希望蜘蛛捕获页面的最大次数。
  • 要捕获的页面内容差异值。输入页面必须更改的百分比,以便再次捕获页面。

蜘蛛