Render Crawler

渲染页面抓取器，可获取 JS 渲染后的完整网页数据

基于 Selenium 驱动的浏览器自动化框架，该技术能够高效、完整地获取由 JavaScript (JS) 动态渲染生成的网页数据，网络爬虫。

解决直接发起 HTTP 请求无法加载前端渲染内容的问题。

🍕 在线体验

海外服务器，延迟比较高

https://rc.carpcap.com/

🌭 功能说明

比如：通过http直接请求baidu 返回结果大概是这样的，本身因为没有任何请求头以及js执行，本质只是一次get请求

<html>
<head><title>301 Moved Permanently</title></head>
<body>
<center><h1>301 Moved Permanently</h1></center>
<hr/>Powered by Tengine<hr><center>tengine</center>
</body>
</html>

但如果通过 Render Crawler

🐳 快速搭建

docker-compose.yml

version: '3.3'
services:
  render-crawler:
    image: carpcap/render-crawler
    container_name: render-crawler
    environment:
      # Node 容器可以同时处理 6 个会话
      - SE_NODE_MAX_SESSIONS=6
      # 客户端请求新会话的最大等待时间
      # - SE_NODE_SESSION_TIMEOUT=300
    shm_size: 2g
    ports:
      - "10034:10034"
      # - "4444:4444" # 控制端口
      # - "5900:5900" # nvc端口
      # - "7900:7900" # 浏览器端口 默认密码secret

访问地址 http://127.0.0.1:10034

swagger http://127.0.0.1:10034/swagger/index.html

🚀 代理

代码中内置了 两套代理池，用以区分代理策略：

proxy_pool.go

CnProxyPool —— 国内代理池
IntlProxyPool —— 国外代理池

你需要自行实现其中的 replenish 方法（项目内已提供示例）。

🔧 自行编译

项目提供了 build.ps1 go打包脚本 Dockerfile，你可以在修改代码后重新构建镜像：

.\build.ps1

docker build -t render-crawler .

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
config		config
docs		docs
handler		handler
mods		mods
router		router
selenium		selenium
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
app.conf		app.conf
build.ps1		build.ps1
config.toml		config.toml
docker-compose.yml		docker-compose.yml
go.mod		go.mod
go.sum		go.sum
main.go		main.go

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Render Crawler

🍕 在线体验

🌭 功能说明

🐳 快速搭建

🚀 代理

🔧 自行编译

About

Uh oh!

Releases

Packages

Languages

License

CarpCap/render-crawler

Folders and files

Latest commit

History

Repository files navigation

Render Crawler

🍕 在线体验

🌭 功能说明

🐳 快速搭建

🚀 代理

🔧 自行编译

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages