apify-ultimate-scraper

Compare original and translation side by side

🇺🇸

Original

English

🇨🇳

Translation

Chinese

Universal Web Scraper

通用网页抓取工具

AI-driven data extraction from 55+ Actors across all major platforms. This skill automatically selects the best Actor for your task.

基于AI驱动，可从所有主流平台的55+个Actor中提取数据。该技能会自动为你的任务选择最佳Actor。

Prerequisites

前置条件

(No need to check it upfront)

```
.env
```
file with
```
APIFY_TOKEN
```
Node.js 20.6+ (for native
```
--env-file
```
support)
```
mcpc
```
CLI tool:
```
npm install -g @apify/mcpc
```

（无需预先检查）

包含
```
APIFY_TOKEN
```
的
```
.env
```
文件
Node.js 20.6+（支持原生
```
--env-file
```
）
```
mcpc
```
CLI工具：
```
npm install -g @apify/mcpc
```

Workflow

工作流程

Copy this checklist and track progress:

Task Progress:
- [ ] Step 1: Understand user goal and select Actor
- [ ] Step 2: Fetch Actor schema via mcpc
- [ ] Step 3: Ask user preferences (format, filename)
- [ ] Step 4: Run the scraper script
- [ ] Step 5: Summarize results and offer follow-ups

复制此清单并跟踪进度：

任务进度:
- [ ] 步骤1: 理解用户目标并选择Actor
- [ ] 步骤2: 通过mcpc获取Actor schema
- [ ] 步骤3: 询问用户偏好（格式、文件名）
- [ ] 步骤4: 运行抓取脚本
- [ ] 步骤5: 总结结果并提供后续建议

Step 1: Understand User Goal and Select Actor

步骤1：理解用户目标并选择Actor

First, understand what the user wants to achieve. Then select the best Actor from the options below.

首先，明确用户的需求。然后从以下选项中选择最佳Actor。

Instagram Actors (12)

Instagram Actors（12个）

Actor ID	Best For
`apify/instagram-profile-scraper`	Profile data, follower counts, bio info
`apify/instagram-post-scraper`	Individual post details, engagement metrics
`apify/instagram-comment-scraper`	Comment extraction, sentiment analysis
`apify/instagram-hashtag-scraper`	Hashtag content, trending topics
`apify/instagram-hashtag-stats`	Hashtag performance metrics
`apify/instagram-reel-scraper`	Reels content and metrics
`apify/instagram-search-scraper`	Search users, places, hashtags
`apify/instagram-tagged-scraper`	Posts tagged with specific accounts
`apify/instagram-followers-count-scraper`	Follower count tracking
`apify/instagram-scraper`	Comprehensive Instagram data
`apify/instagram-api-scraper`	API-based Instagram access
`apify/export-instagram-comments-posts`	Bulk comment/post export

Actor ID	适用场景
`apify/instagram-profile-scraper`	主页数据、粉丝数、个人简介信息
`apify/instagram-post-scraper`	单条帖子详情、互动指标
`apify/instagram-comment-scraper`	评论提取、情感分析
`apify/instagram-hashtag-scraper`	话题内容、热门主题
`apify/instagram-hashtag-stats`	话题表现指标
`apify/instagram-reel-scraper`	Reels内容及指标
`apify/instagram-search-scraper`	搜索用户、地点、话题
`apify/instagram-tagged-scraper`	标记特定账号的帖子
`apify/instagram-followers-count-scraper`	粉丝数跟踪
`apify/instagram-scraper`	全面的Instagram数据
`apify/instagram-api-scraper`	基于API的Instagram访问
`apify/export-instagram-comments-posts`	批量导出评论/帖子

Facebook Actors (14)

Facebook Actors（14个）

Actor ID	Best For
`apify/facebook-pages-scraper`	Page data, metrics, contact info
`apify/facebook-page-contact-information`	Emails, phones, addresses from pages
`apify/facebook-posts-scraper`	Post content and engagement
`apify/facebook-comments-scraper`	Comment extraction
`apify/facebook-likes-scraper`	Reaction analysis
`apify/facebook-reviews-scraper`	Page reviews
`apify/facebook-groups-scraper`	Group content and members
`apify/facebook-events-scraper`	Event data
`apify/facebook-ads-scraper`	Ad creative and targeting
`apify/facebook-search-scraper`	Search results
`apify/facebook-reels-scraper`	Reels content
`apify/facebook-photos-scraper`	Photo extraction
`apify/facebook-marketplace-scraper`	Marketplace listings
`apify/facebook-followers-following-scraper`	Follower/following lists

Actor ID	适用场景
`apify/facebook-pages-scraper`	主页数据、指标、联系信息
`apify/facebook-page-contact-information`	主页的邮箱、电话、地址
`apify/facebook-posts-scraper`	帖子内容及互动
`apify/facebook-comments-scraper`	评论提取
`apify/facebook-likes-scraper`	互动分析
`apify/facebook-reviews-scraper`	主页评论
`apify/facebook-groups-scraper`	群组内容及成员
`apify/facebook-events-scraper`	活动数据
`apify/facebook-ads-scraper`	广告创意及定向
`apify/facebook-search-scraper`	搜索结果
`apify/facebook-reels-scraper`	Reels内容
`apify/facebook-photos-scraper`	图片提取
`apify/facebook-marketplace-scraper`	集市列表
`apify/facebook-followers-following-scraper`	粉丝/关注列表

TikTok Actors (14)

TikTok Actors（14个）

Actor ID	Best For
`clockworks/tiktok-scraper`	Comprehensive TikTok data
`clockworks/free-tiktok-scraper`	Free TikTok extraction
`clockworks/tiktok-profile-scraper`	Profile data
`clockworks/tiktok-video-scraper`	Video details and metrics
`clockworks/tiktok-comments-scraper`	Comment extraction
`clockworks/tiktok-followers-scraper`	Follower lists
`clockworks/tiktok-user-search-scraper`	Find users by keywords
`clockworks/tiktok-hashtag-scraper`	Hashtag content
`clockworks/tiktok-sound-scraper`	Trending sounds
`clockworks/tiktok-ads-scraper`	Ad content
`clockworks/tiktok-discover-scraper`	Discover page content
`clockworks/tiktok-explore-scraper`	Explore content
`clockworks/tiktok-trends-scraper`	Trending content
`clockworks/tiktok-live-scraper`	Live stream data

Actor ID	适用场景
`clockworks/tiktok-scraper`	全面的TikTok数据
`clockworks/free-tiktok-scraper`	免费TikTok数据提取
`clockworks/tiktok-profile-scraper`	主页数据
`clockworks/tiktok-video-scraper`	视频详情及指标
`clockworks/tiktok-comments-scraper`	评论提取
`clockworks/tiktok-followers-scraper`	粉丝列表
`clockworks/tiktok-user-search-scraper`	通过关键词查找用户
`clockworks/tiktok-hashtag-scraper`	话题内容
`clockworks/tiktok-sound-scraper`	热门音效
`clockworks/tiktok-ads-scraper`	广告内容
`clockworks/tiktok-discover-scraper`	发现页内容
`clockworks/tiktok-explore-scraper`	探索页内容
`clockworks/tiktok-trends-scraper`	热门内容
`clockworks/tiktok-live-scraper`	直播数据

YouTube Actors (5)

YouTube Actors（5个）

Actor ID	Best For
`streamers/youtube-scraper`	Video data and metrics
`streamers/youtube-channel-scraper`	Channel information
`streamers/youtube-comments-scraper`	Comment extraction
`streamers/youtube-shorts-scraper`	Shorts content
`streamers/youtube-video-scraper-by-hashtag`	Videos by hashtag

Actor ID	适用场景
`streamers/youtube-scraper`	视频数据及指标
`streamers/youtube-channel-scraper`	频道信息
`streamers/youtube-comments-scraper`	评论提取
`streamers/youtube-shorts-scraper`	Shorts内容
`streamers/youtube-video-scraper-by-hashtag`	按话题分类的视频

Google Maps Actors (4)

Google Maps Actors（4个）

Actor ID	Best For
`compass/crawler-google-places`	Business listings, ratings, contact info
`compass/google-maps-extractor`	Detailed business data
`compass/Google-Maps-Reviews-Scraper`	Review extraction
`poidata/google-maps-email-extractor`	Email discovery from listings

Actor ID	适用场景
`compass/crawler-google-places`	商家列表、评分、联系信息
`compass/google-maps-extractor`	详细商家数据
`compass/Google-Maps-Reviews-Scraper`	评论提取
`poidata/google-maps-email-extractor`	从列表中发掘邮箱

Other Actors (6)

其他Actors（6个）

Actor ID	Best For
`apify/google-search-scraper`	Google search results
`apify/google-trends-scraper`	Google Trends data
`voyager/booking-scraper`	Booking.com hotel data
`voyager/booking-reviews-scraper`	Booking.com reviews
`maxcopell/tripadvisor-reviews`	TripAdvisor reviews
`vdrmota/contact-info-scraper`	Contact enrichment from URLs

Actor ID	适用场景
`apify/google-search-scraper`	Google搜索结果
`apify/google-trends-scraper`	Google Trends数据
`voyager/booking-scraper`	Booking.com酒店数据
`voyager/booking-reviews-scraper`	Booking.com评论
`maxcopell/tripadvisor-reviews`	TripAdvisor评论
`vdrmota/contact-info-scraper`	从URL中补充联系信息

Actor Selection by Use Case

按使用场景选择Actor

Use Case	Primary Actors
Lead Generation	`compass/crawler-google-places` , `poidata/google-maps-email-extractor` , `vdrmota/contact-info-scraper`
Influencer Discovery	`apify/instagram-profile-scraper` , `clockworks/tiktok-profile-scraper` , `streamers/youtube-channel-scraper`
Brand Monitoring	`apify/instagram-tagged-scraper` , `apify/instagram-hashtag-scraper` , `compass/Google-Maps-Reviews-Scraper`
Competitor Analysis	`apify/facebook-pages-scraper` , `apify/facebook-ads-scraper` , `apify/instagram-profile-scraper`
Content Analytics	`apify/instagram-post-scraper` , `clockworks/tiktok-scraper` , `streamers/youtube-scraper`
Trend Research	`apify/google-trends-scraper` , `clockworks/tiktok-trends-scraper` , `apify/instagram-hashtag-stats`
Review Analysis	`compass/Google-Maps-Reviews-Scraper` , `voyager/booking-reviews-scraper` , `maxcopell/tripadvisor-reviews`
Audience Analysis	`apify/instagram-followers-count-scraper` , `clockworks/tiktok-followers-scraper` , `apify/facebook-followers-following-scraper`

使用场景	首选Actor
线索生成	`compass/crawler-google-places` , `poidata/google-maps-email-extractor` , `vdrmota/contact-info-scraper`
网红发掘	`apify/instagram-profile-scraper` , `clockworks/tiktok-profile-scraper` , `streamers/youtube-channel-scraper`
品牌监测	`apify/instagram-tagged-scraper` , `apify/instagram-hashtag-scraper` , `compass/Google-Maps-Reviews-Scraper`
竞品分析	`apify/facebook-pages-scraper` , `apify/facebook-ads-scraper` , `apify/instagram-profile-scraper`
内容分析	`apify/instagram-post-scraper` , `clockworks/tiktok-scraper` , `streamers/youtube-scraper`
趋势研究	`apify/google-trends-scraper` , `clockworks/tiktok-trends-scraper` , `apify/instagram-hashtag-stats`
评论分析	`compass/Google-Maps-Reviews-Scraper` , `voyager/booking-reviews-scraper` , `maxcopell/tripadvisor-reviews`
受众分析	`apify/instagram-followers-count-scraper` , `clockworks/tiktok-followers-scraper` , `apify/facebook-followers-following-scraper`

Multi-Actor Workflows

多Actor工作流

For complex tasks, chain multiple Actors:

Workflow	Step 1	Step 2
Lead enrichment	`compass/crawler-google-places` →	`vdrmota/contact-info-scraper`
Influencer vetting	`apify/instagram-profile-scraper` →	`apify/instagram-comment-scraper`
Competitor deep-dive	`apify/facebook-pages-scraper` →	`apify/facebook-posts-scraper`
Local business analysis	`compass/crawler-google-places` →	`compass/Google-Maps-Reviews-Scraper`

对于复杂任务，可串联多个Actor：

工作流	步骤1	步骤2
线索补充	`compass/crawler-google-places` →	`vdrmota/contact-info-scraper`
网红审核	`apify/instagram-profile-scraper` →	`apify/instagram-comment-scraper`
竞品深度分析	`apify/facebook-pages-scraper` →	`apify/facebook-posts-scraper`
本地商家分析	`compass/crawler-google-places` →	`compass/Google-Maps-Reviews-Scraper`

Can't Find a Suitable Actor?

找不到合适的Actor？

If none of the Actors above match the user's request, search the Apify Store directly:

bash

export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com --header "Authorization: Bearer $APIFY_TOKEN" tools-call search-actors keywords:="SEARCH_KEYWORDS" limit:=10 offset:=0 category:="" | jq -r '.content[0].text'

Replace

SEARCH_KEYWORDS

with 1-3 simple terms (e.g., "LinkedIn profiles", "Amazon products", "Twitter").

如果以上Actor都不符合用户需求，直接搜索Apify商店：

bash

export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com --header "Authorization: Bearer $APIFY_TOKEN" tools-call search-actors keywords:="SEARCH_KEYWORDS" limit:=10 offset:=0 category:="" | jq -r '.content[0].text'

将

SEARCH_KEYWORDS

替换为1-3个简单术语（例如："LinkedIn profiles", "Amazon products", "Twitter"）。

Step 2: Fetch Actor Schema

步骤2：获取Actor Schema

Fetch the Actor's input schema and details dynamically using mcpc:

bash

export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com --header "Authorization: Bearer $APIFY_TOKEN" tools-call fetch-actor-details actor:="ACTOR_ID" | jq -r ".content"

Replace

ACTOR_ID

with the selected Actor (e.g.,

compass/crawler-google-places

This returns:

Actor description and README
Required and optional input parameters
Output fields (if available)

使用mcpc动态获取Actor的输入schema和详情：

bash

export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com --header "Authorization: Bearer $APIFY_TOKEN" tools-call fetch-actor-details actor:="ACTOR_ID" | jq -r ".content"

将

ACTOR_ID

替换为所选的Actor（例如：

compass/crawler-google-places

）。

返回内容包括：

Actor描述和README
必填和可选输入参数
输出字段（如果有）

Step 3: Ask User Preferences

步骤3：询问用户偏好

Before running, ask:

Output format:
- Quick answer - Display top few results in chat (no file saved)
- CSV - Full export with all fields
- JSON - Full export in JSON format
Number of results: Based on character of use case

运行前，询问：

输出格式:
- 快速回答 - 在聊天中显示前几条结果（不保存文件）
- CSV - 导出所有字段的完整数据
- JSON - 以JSON格式导出完整数据
结果数量: 根据使用场景确定

Step 4: Run the Script

步骤4：运行脚本

Quick answer (display in chat, no file):

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT'

CSV:

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT' \
  --output YYYY-MM-DD_OUTPUT_FILE.csv \
  --format csv

JSON:

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT' \
  --output YYYY-MM-DD_OUTPUT_FILE.json \
  --format json

快速回答（在聊天中显示，不保存文件）：

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT'

CSV格式：

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT' \
  --output YYYY-MM-DD_OUTPUT_FILE.csv \
  --format csv

JSON格式：

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT' \
  --output YYYY-MM-DD_OUTPUT_FILE.json \
  --format json

Step 5: Summarize Results and Offer Follow-ups

步骤5：总结结果并提供后续建议

After completion, report:

Number of results found
File location and name
Key fields available
Suggested follow-up workflows based on results:

If User Got	Suggest Next
Business listings	Enrich with `vdrmota/contact-info-scraper` or get reviews
Influencer profiles	Analyze engagement with comment scrapers
Competitor pages	Deep-dive with post/ad scrapers
Trend data	Validate with platform-specific hashtag scrapers

完成后，汇报：

找到的结果数量
文件位置和名称
可用的关键字段
基于结果的建议后续工作流：

如果用户获取了	建议下一步
商家列表	使用 `vdrmota/contact-info-scraper` 补充信息或获取评论
网红主页	使用评论抓取工具分析互动情况
竞品主页	使用帖子/广告抓取工具深入分析
趋势数据	使用平台特定的话题抓取工具验证

Error Handling

错误处理

APIFY_TOKEN not found

- Ask user to create

.env

with

APIFY_TOKEN=your_token

mcpc not found

- Ask user to install

npm install -g @apify/mcpc

Actor not found

- Check Actor ID spelling

Run FAILED

- Ask user to check Apify console link in error output

Timeout

- Reduce input size or increase

--timeout

APIFY_TOKEN not found

- 请用户创建包含

APIFY_TOKEN=your_token

的

.env

文件

mcpc not found

- 请用户安装

npm install -g @apify/mcpc

Actor not found

- 检查Actor ID的拼写

Run FAILED

- 请用户查看错误输出中的Apify控制台链接

Timeout

- 减小输入规模或增加

--timeout

参数