长治潞城区GEO优化

长治潞城区GEO优化如何放开AI爬虫抓取权限?

长治潞城区GEO优化服务商 长治潞城区

放开 AI 爬虫抓取全流程操作(GEO 需要 4 步:robots→CDN/WAF→服务器防火墙→新增 llms.txt)

国内大模型:豆包 Bot、文心爬虫、通义千问爬虫、DeepSeekBot;海外:GPTBot、Claude、Google-Extended、Perplexity,全部放行才能被 AI 收录引用

一、修改网站根目录 robots.txt(核心,优先级高)

文件路径:域名/robots.txt(例:xxx.com/robots.txt),*AI 规则写在文件顶部,在 User-agent:前面(规则从上往下生效)

完整放行代码(直接复制使用)

txt

# ==========放行国内+海外主流AI爬虫【GEO专用】==========

# OpenAI全爬虫(GPT、ChatGPT联网搜索)

User-agent: GPTBot

Allow: /

User-agent: ChatGPT-User

Allow: /

User-agent: OAI-SearchBot

Allow: /


# Claude(Anthropic)

User-agent: ClaudeBot

Allow: /

User-agent: Claude-Web

Allow: /


# Gemini谷歌AI爬虫(区别普通Googlebot)

User-agent: Google-Extended

Allow: /


# Perplexity

User-agent: PerplexityBot

Allow: /

User-agent: Perplexity-User

Allow: /


# 苹果Siri智能摘要

User-agent: Applebot-Extended

Allow: /


# 亚马逊、Cohere

User-agent: Amazonbot

Allow: /

User-agent: cohere-ai

Allow: /


# 国内国产大模型爬虫(豆包、文心、通义、DeepSeek)

User-agent: DoubaoBot

Allow: /

User-agent: BaiduSpider-AI

Allow: /

User-agent: QwenBot

Allow: /

User-agent: DeepSeekBot

Allow: /


# 常规搜索引擎(保留放行)

User-agent: Googlebot

Allow: /

User-agent: Bingbot

Allow: /

User-agent: Baiduspider

Allow: /


# 禁止爬虫访问后台、管理目录(安全保留,不影响前端收录)

User-agent: *

Disallow: /admin/

Disallow: /backend/

Disallow: /api/

Disallow: /login/


# 提交网站地图,引导AI抓取

Sitemap: https://你的域名/sitemap.xml

注意

不要写User-agent:* Allow:/,容易被恶意采集爬虫泛滥;单独逐个放行 AI 安全

改完 10 分钟生效,可用站长工具 robots 检测校验。

二、CDN 放行(Cloudflare / 阿里云 CDN / 腾讯云 CDN,90% 网站被 CDN 拦截 AI)

1)Cloudflare 配置(常用)

进入【安全→WAF→自定义规则→创建规则】

规则名称:放行 AI 爬虫

匹配条件:

plaintext

http.user_agent contains "GPTBot" or

http.user_agent contains "ClaudeBot" or

http.user_agent contains "Google-Extended" or

http.user_agent contains "PerplexityBot" or

http.user_agent contains "DoubaoBot" or

http.user_agent contains "BaiduSpider-AI"

执行动作:跳过剩余所有 WAF / 机器人防护规则(Skip),规则置顶;

关闭:【安全→机器人→机器人防御】里的Block AI Scrapers(拦截 AI 采集开关)。

2)阿里云 / 腾讯云 CDN/WAF

防护规则→白名单→UA 白名单,批量添加上面所有 AI UA 关键词;

关闭 CC 防护、智能爬虫拦截里的「拦截 AI 爬虫」选项。

三、第三步:服务器防火墙放行(Nginx/Apache/ 宝塔面板)

1、宝塔面板(企业建站主流)

宝塔→网站→配置文件→Nginx 配置,删除拦截爬虫 UA 的 if 判断代码;

防火墙→安全防护→爬虫防护,关闭【拦截 AI 机器人】,添加 UA 白名单:GPTBot、ClaudeBot、DoubaoBot、Google-Extended;

禁止设置频率限制(限制单 IP 访问频次会导致 AI 分批抓取失败)。

2、Nginx 手动配置放行(可选)

nginx

if ($http_user_agent ~* "(GPTBot|ClaudeBot|DoubaoBot|Google-Extended|PerplexityBot)") {

    allow all;

}

排查技巧:服务器查看网站访问日志,出现403/503= 被拦截;200 = 正常抓取。

四、第四步:新增 llms.txt(2025 起 AI 新标准,大幅提升收录引用率)

在网站根目录新建llms.txt,专门给大模型读取站点目录、内容简介(GEO 优化需要)

llms.txt 示例内容

plaintext

# XX企业官网 AI数据源指引

## 企业简介:主营XX产品、行业解决方案,成立XX年

## 栏目目录

- /product/ 全系列产品参数

- /article/ 行业科普、选型问答

- /case/ 落地项目案例

- /about/ 企业资质信息

作用:豆包、GPT、通义等 AI 优先读取 llms.txt 快速抓取全站,显著提升内容被 AI 答案引用概率。

五、常见踩坑避坑

网站加了防采集插件(如 WP 防爬虫、织梦安全插件):插件黑名单删掉全部 AI 爬虫 UA,否则 robots 放行也无效;

全站开启 JS 验证、人机验证:AI 爬虫无法过验证,直接抓取失败,产品 / 资讯页关闭验证码;

频繁改 UA 规则、关停服务器:AI 爬虫需要 1~3 周重新收录。

六、验证是否生效

访问:域名 /robots.txt,查看代码是否正常展示;

用 UA 模拟工具:填入 GPTBot,访问页面,返回 200 即放行成功。


标签:

城市分站: 北京北京东城区北京西城区北京朝阳区北京海淀区北京丰台区北京石景山区北京通州区北京顺义区北京昌平区北京大兴区北京房山区北京门头沟区北京怀柔区北京平谷区北京密云区北京延庆区 天津天津和平区天津河东区天津河西区天津南开区天津河北区天津红桥区天津东丽区天津西青区天津津南区天津北辰区天津滨海新区天津武清区天津宝坻区天津宁河区天津静海区天津蓟州区 河北石家庄唐山秦皇岛邯郸邢台保定张家口承德沧州廊坊衡水 山西太原大同阳泉长治晋城朔州晋中运城忻州临汾吕梁 内蒙古呼和浩特包头乌海赤峰通辽鄂尔多斯呼伦贝尔巴彦淖尔乌兰察布兴安盟锡林郭勒盟阿拉善盟 辽宁沈阳大连鞍山抚顺本溪丹东锦州营口阜新辽阳盘锦铁岭朝阳葫芦岛 吉林长春吉林市四平辽源通化白山松原白城延边 黑龙江哈尔滨齐齐哈尔鸡西鹤岗双鸭山大庆伊春佳木斯七台河牡丹江黑河绥化大兴安岭 上海上海黄浦区上海静安区上海徐汇区上海长宁区上海普陀区上海虹口区上海杨浦区上海浦东新区上海闵行区上海宝山区上海嘉定区上海松江区上海青浦区上海奉贤区上海金山区上海崇明区 江苏南京无锡徐州常州苏州南通连云港淮安盐城扬州镇江泰州宿迁 浙江杭州宁波温州嘉兴湖州绍兴金华衢州舟山台州丽水 安徽合肥芜湖蚌埠淮南马鞍山淮北铜陵安庆黄山滁州阜阳宿州巢湖六安亳州池州宣城 福建福州厦门莆田三明泉州漳州南平龙岩宁德 江西南昌景德镇萍乡九江新余鹰潭赣州吉安宜春抚州上饶 山东济南青岛淄博枣庄东营烟台潍坊济宁泰安威海日照莱芜临沂德州聊城滨州荷泽 河南郑州开封洛阳平顶山安阳鹤壁新乡焦作濮阳许昌漯河三门峡南阳商丘信阳周口驻马店 湖北武汉黄石十堰宜昌襄樊鄂州荆门孝感荆州黄冈咸宁随州恩施神农架 湖南长沙株洲湘潭衡阳邵阳岳阳常德张家界益阳郴州永州怀化娄底湘西 广东广州韶关深圳珠海汕头佛山江门湛江茂名肇庆惠州梅州汕尾河源阳江清远东莞中山潮州揭阳云浮 广西南宁柳州桂林梧州北海防城港钦州贵港玉林百色贺州河池来宾崇左 海南海口三亚三沙琼海五指山文昌万宁屯昌琼中陵水东方定安澄迈白沙儋州 重庆重庆渝中区重庆大渡口区重庆江北区重庆沙坪坝区重庆九龙坡区重庆南岸区重庆北碚区重庆渝北区重庆巴南区重庆涪陵区重庆长寿区重庆江津区重庆合川区重庆永川区重庆南川区重庆綦江区重庆大足区重庆璧山区重庆铜梁区重庆潼南区重庆荣昌区重庆万州区重庆开州区重庆梁平区重庆武隆区重庆垫江县重庆城口县重庆丰都县重庆忠县重庆云阳县重庆奉节县重庆巫山县重庆巫溪县重庆石柱县重庆秀山县重庆酉阳县重庆彭水县 四川成都自贡攀枝花泸州德阳绵阳广元遂宁内江乐山南充眉山宜宾广安达州雅安巴中资阳阿坝甘孜凉山 贵州贵阳六盘水遵义安顺铜仁黔西南毕节黔东南黔南 云南昆明曲靖玉溪保山昭通丽江思茅临沧楚雄红河文山西双版纳大理德宏怒江迪庆 西藏拉萨昌都山南日喀则那曲阿里林芝 陕西西安铜川宝鸡咸阳渭南延安汉中榆林安康商洛 甘肃兰州嘉峪关金昌白银天水武威张掖平凉酒泉庆阳定西陇南临夏甘南 青海西宁海东海北黄南海南藏族自治州果洛玉树海西 宁夏银川石嘴山吴忠固原中卫 新疆乌鲁木齐克拉玛依吐鲁番哈密昌吉博尔塔拉巴音郭楞阿克苏克孜勒苏喀什和田伊犁哈萨克塔城阿勒泰五家渠 更多城市

返回顶部