这是一款网络上下文 API,可用于查找来源、提取内容,并将其转换为干净的 Markdown 或结构化数据,供你的智能体使用。 开源,并提供托管服务。
# 1. 安装 SDK
$ pip install firecrawl-py
# 2. 一行代码抓取任意网站
from firecrawl import Firecrawl
app = Firecrawl(api_key="fc-YOUR_API_KEY")
# 抓取
result = app.scrape("firecrawl.dev")
# 智能体自主收集数据
data = app.agent(prompt="查找 Stripe 的创始人")
print(data) # → 已结构化
从最棘手的 JS 渲染页面到大规模并发抓取,Firecrawl 帮你搞定所有繁琐细节。
覆盖 96% 的网页,包括重度 JS 渲染页面 —— 无需代理烦恼,直接获取干净数据。
数百万页面的 P95 延迟仅为 3.4 秒,专为实时智能体和动态应用打造。
干净的 Markdown、结构化 JSON、截图等 —— 更少的 Token 消耗,更好的 AI 应用体验。
自动轮换代理、编排、速率限制、JS 拦截内容等 —— 零配置开箱即用。
一条命令即可将 Firecrawl 连接到任何 AI 智能体或 MCP 客户端。
解析并提取网络上托管的 PDF、DOCX 等文件内容。
在提取内容前,点击、滚动、输入、等待和按键 —— 真实浏览器交互。
透明且协作开发 —— 加入我们的社区,一起打造更好的网络数据工具。
默认遵守 robots.txt,内置合规机制,可放心用于生产环境。
从单页抓取到全站爬取,Firecrawl 为每种需求都提供了专用端点。
搜索网页并获取搜索结果的完整内容。一次请求即可获得多个页面的 Markdown 内容,省去二次抓取。
from firecrawl import Firecrawl
app = Firecrawl(api_key="fc-YOUR_API_KEY")
search_result = app.search("firecrawl", limit=5)
import { Firecrawl } from 'firecrawl';
const app = new Firecrawl({apiKey: "fc-YOUR_API_KEY"});
app.search("firecrawl", { limit: 5 })
curl -X POST 'https://api.firecrawl.dev/v2/search' \
-H 'Authorization: Bearer fc-YOUR_API_KEY' \
-H 'Content-Type: application/json' \
-d '{
"query": "firecrawl",
"limit": 5
}'
firecrawl search "firecrawl" --limit 5
[
{
"url": "https://firecrawl.dev",
"title": "Firecrawl",
"markdown": "Turn websites into..."
},
{
"url": "https://docs.firecrawl.dev",
"title": "Firecrawl Docs",
"markdown": "# Getting Started..."
}
]
几分钟内即可将 Firecrawl 连接到任何 AI 智能体或 MCP 客户端。
一条命令即可让你的智能体轻松访问实时网页数据。
npx -y firecrawl-cli@latest init \
--all --browser
安装后重启你的智能体。支持 Claude Code、Antigravity、OpenCode 等。
几秒钟内将任何兼容 MCP 的客户端连接到网页。
{
"mcpServers": {
"firecrawl-mcp": {
"command": "npx",
"args": ["-y", "firecrawl-mcp"],
"env": {
"FIRECRAWL_API_KEY": "fc-..."
}
}
}
}
通用协议,兼容所有主流 MCP 客户端。
你是 AI 智能体吗?获取此 Skill,为你的用户注册并开始使用 Firecrawl。
curl -s https://firecrawl.dev/\
agent-onboarding/SKILL.md
让你的智能体自动完成注册、获取密钥、构建应用全流程。
从网页获取数据的最简单方式。描述你的需求,AI 智能体会搜索、导航并检索数据,无需提供 URL。
Agent 是 /extract 端点的升级版:更快、更可靠,且无需提前知道 URL。
curl -X POST 'https://api.firecrawl.dev/v2/agent' \
-H 'Authorization: Bearer fc-YOUR_API_KEY' \
-H 'Content-Type: application/json' \
-d '{
"prompt": "Find the pricing plans for Notion"
}'
{
"success": true,
"data": {
"result": "Notion offers the following pricing plans:\n1. Free - $0/month...",
"sources": ["https://www.notion.so/pricing"]
}
}
根据需求选择两种模型:
curl -X POST 'https://api.firecrawl.dev/v2/crawl' \
-H 'Authorization: Bearer fc-YOUR_API_KEY' \
-H 'Content-Type: application/json' \
-d '{
"url": "https://docs.firecrawl.dev",
"limit": 100,
"scrapeOptions": {
"formats": ["markdown"]
}
}'
{
"success": true,
"id": "123-456-789",
"url": "https://api.firecrawl.dev/v2/crawl/123-456-789"
}
爬取整个网站并获取所有页面的内容。SDK 会自动处理轮询,提供更好的开发体验。
即时发现网站上的所有 URL。配合搜索可查找特定 URL。
curl -X POST 'https://api.firecrawl.dev/v2/map' \
-H 'Authorization: Bearer fc-YOUR_API_KEY' \
-H 'Content-Type: application/json' \
-d '{"url": "https://firecrawl.dev"}'
一次性抓取多个 URL。适合大规模数据采集场景。
from firecrawl import Firecrawl
app = Firecrawl(api_key="fc-...")
job = app.batch_scrape([
"https://firecrawl.dev",
"https://docs.firecrawl.dev",
"https://firecrawl.dev/pricing"
], formats=["markdown"])
我们的 SDK 提供了一种便捷的方式来使用 Firecrawl 的所有功能,并自动处理异步操作的轮询。
最受欢迎的 SDK,适合数据科学、AI 应用和快速原型开发。
pip install firecrawl-py
from firecrawl import Firecrawl
app = Firecrawl(api_key="fc-YOUR_API_KEY")
# 抓取
doc = app.scrape("https://firecrawl.dev", formats=["markdown"])
print(doc.markdown)
# 智能体
result = app.agent(prompt="Find the founders of Stripe")
# 爬取(自动等待完成)
docs = app.crawl("https://docs.firecrawl.dev", limit=50)
# 搜索
results = app.search("best AI data tools 2024", limit=10)
Firecrawl 基于 AGPL-3.0 许可证开源。你可以自托管,也可以使用托管服务。
加入我们的社区,获取最新动态和支持。
⚖️ 合规提示:最终用户有责任在抓取时遵守网站政策。建议用户遵守适用的隐私政策和使用条款。默认情况下,Firecrawl 会遵守 robots.txt 指令。使用 Firecrawl 即表示你同意遵守这些条件。