Scrapy proxy integation

Scrapy 프록시 통합

이 가이드는 구식일 수 있습니다. 최신 가이드는 당사 문서를 참조하십시오.

Scrapy란 무엇인가요?

Scrapy는 웹 크롤링 및 스크래핑을 위한 Python 프레임워크로, 사용자가 웹사이트에서 구조화된 데이터를 추출할 수 있게 합니다. 오픈소스이며 빠르고 확장 가능합니다. Scrapy는 데이터 마이닝, 모니터링, 자동화된 테스트 등 다양한 목적으로 사용될 수 있습니다.

Bright Data 프록시와의 Scrapy 통합

선호하는 IDE를 열고 새 스크래피 프로젝트를 시작하세요. 명령줄에 다음을 입력하세요:

      scrapy startproject <project_name>
    

이렇게 하면 프로젝트 이름으로 새 폴더가 생성되며, 해당 폴더 내에서 파이썬 파일을 엽니다.

  • Bright Data 제어판으로 이동하여 ‘프록시 및 스크래핑 인프라’ 아이콘을 클릭하세요
  • ‘추가’를 클릭하고 네트워크 유형을 선택한 후 프록시를 구성하고 저장을 클릭하여 새 프록시 영역을 생성하세요.
  • 프록시 영역의‘액세스 매개변수’탭에서‘사용자명(USERNAME)‘과‘비밀번호(PASSWORD)’값을 확인하세요.
  • 스크래피 스파이더 코드 파일에서 요청의 메타 매개변수 내 ‘proxy’ 값을 다음과 같이 설정하세요. 앞서 확인한‘USERNAME’‘PASSWORD’값을 사용합니다: “http://USERNAME:[email protected]:33335″
  • 예시:
      import scrapy

class BrightdatascrapyexampleSpider(scrapy.Spider):
name = "BrightDataScrapyExample"

def start_requests(self):
request = scrapy.Request(url="http://example.com",callback=self.parse)
request.meta['proxy'] = "http://USERNAME:[email protected]:33335"
yield request

def parse(self, response):
print(response.body)

그런 다음 명령줄에서 다음 명령을 실행하세요:

      scrapy runspider <Pythonfilename.py>
    

Scrapy와 함께 Bright Data 프록시 관리자를 사용하는 방법

  • 위 직접 통합과 동일한 프록시 영역 생성
  • 프록시 매니저 설치
  • ‘새 포트 추가’를 클릭하고 사용 사례에 맞게 구성하세요
  • Scrapy 스파이더 코드 파일에서 요청의 메타 매개변수 내 ‘proxy’ 값을 다음과 같이 설정하세요: “http://IP:PORTNUMBER”
  • 로컬 호스트 IP는 127.0.0.1입니다. 프록시 관리자가 본인의 머신에 설치된 경우 이 값을 사용해야 합니다. 프록시 관리자가 외부 서버에 설치된 경우 해당 서버의 IP 주소를 입력하십시오
  • 프록시 매니저에서 생성된 포트는 24XXX(예: 24000)입니다. 이는 기본 첫 번째 포트 번호입니다.
  • 예시:
      import scrapy

class BrightdatascrapyexampleSpider(scrapy.Spider):
name = "BrightDataScrapyExample"

def start_requests(self):
request = scrapy.Request(url="http://example.com",callback=self.parse)
request.meta['proxy'] = "http://127.0.0.1:24000"
yield request

def parse(self, response):
print(response.body)

⚠️중요 참고: Bright Data의 주거용 프록시, 웹 언락커 또는 SERP API를 사용하는 경우, 대상 웹사이트와의 종단 간 보안 연결을 활성화하려면 SSL 인증서를 설치해야 합니다. 이는 간단한 절차이며, 자세한 지침은 https://docs.brightdata.com/general/account/ssl-certificate#installation-of-the-ssl-certificate 를 참조하십시오.

Scrapy용 프록시 확보

수상 경력에 빛나는 프록시 인프라로 구동됩니다

400 million개 이상의 주거용 IP, 최고 수준의 기술력, 그리고 국가, 도시, 우편번호, 통신사, ASN을 대상으로 할 수 있는 능력은 저희 프리미엄 프록시 서비스를 개발자들에게 최고의 선택이 되게 합니다.

Proxy Network Pricing

50% 할인
pay as you go plan icon
사용한 만큼 지불
$8 $4.00 / GB
약정 없음
무료 체험 시작
이 쿠폰 코드를 사용하세요: RESIGB50

월별 약정 없이 우리의 프록시를 사용하세요.
50% 할인
2nd plan icon
141 GB 포함
$7 $3.50 / GB
$499 월별 청구
무료 체험 시작
이 쿠폰 코드를 사용하세요: RESIGB50

중간 사용량의 소규모 비즈니스에 적합
50% 할인
3rd plan icon
332 GB 포함
$6 $3.00 / GB
$999 월별 청구
무료 체험 시작
이 쿠폰 코드를 사용하세요: RESIGB50

광범위한 운영 요구가 있는 대규모 팀을 위해 설계됨
50% 할인
4th plan icon
798 GB 포함
$5 $2.50 / GB
$1999 월별 청구
무료 체험 시작
이 쿠폰 코드를 사용하세요: RESIGB50

대규모 운영을 하는 기업을 위해 최적화됨
1TB 이상 필요하신가요?
문의하기
  • 무제한 확장성
  • 무제한 좌석
  • 프리미엄 SLA
  • 99.99% 네트워크 가동 시간
  • 무료 프록시 관리자
  • 완전한 데이터 커버리지
  • GB당 맞춤형 가격
  • 맞춤형 솔루션
pay as you go plan icon
사용한 만큼 지불
$8 / GB
약정 없음
무료 체험 시작
월별 약정 없이 우리의 프록시를 사용하세요.
2nd plan icon
71 GB 포함
$7 / GB
$499 월별 청구
무료 체험 시작
중간 사용량의 소규모 비즈니스에 적합
3rd plan icon
166 GB 포함
$6 / GB
$999 월별 청구
무료 체험 시작
광범위한 운영 요구가 있는 대규모 팀을 위해 설계됨
4th plan icon
399 GB 포함
$5 / GB
$1999 월별 청구
무료 체험 시작
대규모 운영을 하는 기업을 위해 최적화됨
1TB 이상 필요하신가요?
문의하기
  • 무제한 확장성
  • 무제한 좌석
  • 프리미엄 SLA
  • 99.99% 네트워크 가동 시간
  • 무료 프록시 관리자
  • 완전한 데이터 커버리지
  • GB당 맞춤형 가격
  • 맞춤형 솔루션
pay as you go plan icon
사용한 만큼 지불
$8 / GB
약정 없음
무료 체험 시작
월별 약정 없이 우리의 프록시를 사용하세요.
2nd plan icon
71 GB 포함
$7 / GB
$499 월별 청구
무료 체험 시작
중간 사용량의 소규모 비즈니스에 적합
3rd plan icon
166 GB 포함
$6 / GB
$999 월별 청구
무료 체험 시작
광범위한 운영 요구가 있는 대규모 팀을 위해 설계됨
4th plan icon
399 GB 포함
$5 / GB
$1999 월별 청구
무료 체험 시작
대규모 운영을 하는 기업을 위해 최적화됨
1TB 이상 필요하신가요?
문의하기
  • 무제한 확장성
  • 무제한 좌석
  • 프리미엄 SLA
  • 99.99% 네트워크 가동 시간
  • 무료 프록시 관리자
  • 완전한 데이터 커버리지
  • GB당 맞춤형 가격
  • 맞춤형 솔루션
pay as you go plan icon
사용한 만큼 지불
$0.6 / GB
약정 없음
무료 체험 시작
월별 약정 없이 우리의 프록시를 사용하세요.
2nd plan icon
1 TB 포함
$0.51 / GB
$499 월별 청구
무료 체험 시작
중간 사용량의 소규모 비즈니스에 적합
3rd plan icon
2 TB 포함
$0.45 / GB
$999 월별 청구
무료 체험 시작
광범위한 운영 요구가 있는 대규모 팀을 위해 설계됨
4th plan icon
5 TB 포함
$0.42 / GB
$1999 월별 청구
무료 체험 시작
대규모 운영을 하는 기업을 위해 최적화됨
1TB 이상 필요하신가요?
문의하기
  • 무제한 확장성
  • 무제한 좌석
  • 프리미엄 SLA
  • 99.99% 네트워크 가동 시간
  • 무료 프록시 관리자
  • 완전한 데이터 커버리지
  • GB당 맞춤형 가격
  • 맞춤형 솔루션
다음 결제 방법을 받습니다:

업계 최고의 고객 경험

당신이 요청하면, 우리가 개발합니다

매일 새로운 기능이 출시됩니다

24시간 연중무휴 글로벌 지원

필요할 때 바로 질문에 답변하기 위해

완전한 투명성

실시간 네트워크 성능 대시보드

전담 계정 관리자

성능 최적화를 위해

맞춤형 솔루션

데이터 수집 목표를 달성하기 위해

프록시 및 데이터 수집 분야의 선도 기업

650 매일 수집되는 공개 데이터 TB

매일 새로운 기능이 출시됩니다

세계 최고의 대학 7/10개 제공

<p4.6/5 Trustpilot 평점

<p4.6/5 신뢰도 평점

Scrapy 프록시 준비되셨나요?