Octoparse

在将代理集成到Octoparse之前,请确保你已经正确设置代理,以保障代理服务能够正常运行。

1.打开Octoparse应用程序。

2.在左上角菜单中,将滑鼠悬停在新建按钮上,然后点击高级模式。出于测试目的,我们将创建一个自定义任务。

3.在网站字段中,指定要从中提取数据的网站。然后点击保存按钮。

4.你现在应该位于「任务」选项卡中。要配置我们的代理,请选择「设置」按钮。

5.在弹出菜单中,向下滑动到防阻止设置并选中使用 IP 代理选项。现在你应该可以点击「设置」按钮。

6.在代理设置弹出窗口中,定义要使用的代理。由于Octoparse仅提供基于格式的代理网路身份验证,因此你需要使用我们的白名单IP功能在通过代理时跳过传统身份验证。

7.IP:PORT 准备好后,根据你的会话类型选择轮换间隔。如果你使用的是轮换会话类型,请将间隔设置为 1。如果你使用的是固定会话,请将其设置为 600。最后,点击确定按钮。

8.要验证一切是否正常工作,请在「防阻塞设置」下的「设置」选项旁边找到复选标记。确认后,点击「保存」继续。

9.要从我们的示例页面中提取数据,请点击 Octoparse 应用程序顶部看到的 IP 地址,然后选择提取所选元素的文本。

10.完成后,点击「保存」,然后点击「运行」。

11.根据你想要运行任务的方式,选择可用的提取选项之一。出于测试目的,你可以在设备上运行任务。

12.如果操作正确,任务完成后你应该在提取的数据表中看到我们的代理 IP。

通过以上步骤,你成功完成了Octoparse和代理的集成,为网络连接提供了更加安全和灵活的选项。