Работа с прокси-серверами¶
Настройка прокси-сервера¶
Для использования проки-сервера вам нужно задать две опции: proxy и proxy_type. Опция proxy принимает значения в виде строки server:port. Опция proxy_type допускает значения трёх типов: http, socks4 и socks5. Пример:
g.setup(proxy='gate.somhost.com:444', proxy_type='http')
Если прокси-сервер требует авторизации, используйте опцию proxy_userpwd, которая принимает значение в виде строки username:password.
Обратите внимание, что в случае использования прокси-сервера, информация о нём будет отображаться в logging-сообщениях, соответствующих конкретному запросу.
Работа со списками прокси¶
Grab поддерживает работу со списком-прокси. Используйте метод setup_proxylist()
для задания списка проксей:
g.setup_proxylist(proxy_file='/path/to/file.txt', proxy_type='http')
Следующими аргументами метода setup_proxylist()
вы можете настроить работу со списком проксей:
proxy_file: | путь к файлу со списком прокси-серверов |
---|---|
proxy_type: | тип прокси-серверов. Возможные варианты: “http”, “socks4”, “socks5”. |
read_timeout: | Время, через которое файл с проксями, будет перечитан. |
auto_init: | Один раз выбирает случайный прокси-сервер, который используется для всех дальнейших запросов. |
auto_change: | Включает постоянную смену прокси-сервера для каждого запроса |
server_list: | Вы можете передать непосредственно список-проксей в python-списке, вместо указания файла с прокси-серверами. Аргументы proxy_file и server_list нельзя использовать одновременно. |
Строки в файле, передаваемом через proxy_file, или в списке, передаваемом через server_list могут быть в двух форматах:
- Простой формат “server:port”
- Сложный формат “server:port:username:password”. Используйте его, если прокси-сервер требует авторизации.