在将代理集成到Octoparse之前,请确保你已经正确设置代理,以保障代理服务能够正常运行。
1.打开Octoparse应用程序。
2.在左上角菜单中,将滑鼠悬停在新建按钮上,然后点击高级模式。出于测试目的,我们将创建一个自定义任务。
3.在网站字段中,指定要从中提取数据的网站。然后点击保存按钮。
4.你现在应该位于「任务」选项卡中。要配置我们的代理,请选择「设置」按钮。
5.在弹出菜单中,向下滑动到防阻止设置并选中使用 IP 代理选项。现在你应该可以点击「设置」按钮。
6.在代理设置弹出窗口中,定义要使用的代理。由于Octoparse仅提供基于格式的代理网路身份验证,因此你需要使用我们的白名单IP功能在通过代理时跳过传统身份验证。
7.IP:PORT 准备好后,根据你的会话类型选择轮换间隔。如果你使用的是轮换会话类型,请将间隔设置为 1。如果你使用的是固定会话,请将其设置为 600。最后,点击确定按钮。
8.要验证一切是否正常工作,请在「防阻塞设置」下的「设置」选项旁边找到复选标记。确认后,点击「保存」继续。
9.要从我们的示例页面中提取数据,请点击 Octoparse 应用程序顶部看到的 IP 地址,然后选择提取所选元素的文本。
10.完成后,点击「保存」,然后点击「运行」。
11.根据你想要运行任务的方式,选择可用的提取选项之一。出于测试目的,你可以在设备上运行任务。
12.如果操作正确,任务完成后你应该在提取的数据表中看到我们的代理 IP。
通过以上步骤,你成功完成了Octoparse和代理的集成,为网络连接提供了更加安全和灵活的选项。