naver-blog-research

Compare original and translation side by side

🇺🇸

Original

English
🇨🇳

Translation

Chinese

네이버 블로그 리서치

Naver博客调研

What this skill does

该技能的功能

네이버 블로그를 검색하고, 개별 포스트의 원문을 읽고, 이미지를 로컬에 다운로드한다.
  • API 키 없이
    python3
    표준 라이브러리만으로 동작한다.
  • 검색 결과를 구조화된 JSON으로 출력한다.
  • 모바일 버전(
    m.blog.naver.com
    )을 이용해 iframe 없이 본문을 직접 추출한다.
  • 블로그 이미지 CDN(
    blogfiles.naver.net
    ,
    postfiles.pstatic.net
    )에서 이미지를 다운로드한다.
搜索Naver博客,读取单篇帖子原文,将图片下载到本地。
  • 无需API密钥,仅使用
    python3
    标准库即可运行。
  • 将搜索结果输出为结构化JSON格式。
  • 使用移动端版本(
    m.blog.naver.com
    ),无需iframe即可直接提取正文内容。
  • 从博客图片CDN(
    blogfiles.naver.net
    postfiles.pstatic.net
    )下载图片。

When to use

适用场景

  • "네이버 블로그에서 결혼식 체크리스트 검색해줘"
  • "네이버 블로그 리서치 해줘"
  • "한국 블로그에서 관련 정보 조사해줘"
  • "네이버 블로그 글 읽어줘"
  • "이 네이버 블로그 포스트에서 이미지 다운로드해줘"
  • 한국어 콘텐츠 리서치에서 구글 외 네이버 블로그 소스가 필요한 상황
  • "帮我在Naver博客搜索婚礼清单"
  • "帮我做Naver博客调研"
  • "帮我在韩国博客中查找相关信息"
  • "帮我读取这篇Naver博客文章"
  • "帮我下载这篇Naver博客帖子里的图片"
  • 调研韩语内容时,除了谷歌之外还需要Naver博客来源的场景

When not to use

不适用场景

  • 네이버 뉴스, 카페, 지식iN 등 블로그 외 네이버 서비스 검색
  • 대량 크롤링/스크래핑 (한 세션에 수십 건 이상의 요청)
  • 상업적 데이터 수집
  • 搜索Naver新闻、咖啡馆、知识iN等非博客类的Naver服务
  • 大规模爬取/抓取(单个会话发起数十次以上请求)
  • 商业用途的数据采集

Prerequisites

前置要求

  • 인터넷 연결
  • python3
    3.8+
  • 이 스킬 디렉토리의
    scripts/
    안에 포함된 helper 스크립트
  • 网络连接
  • python3
    3.8+
  • 本技能目录
    scripts/
    文件夹下包含的辅助脚本

Workflow

工作流程

1. 네이버 블로그 검색

1. Naver博客搜索

bash
python3 scripts/naver_search.py "검색어" --count 10 --sort sim
인자필수설명기본값
queryO검색어-
--countX결과 수 (최대 30)10
--sortXsim(관련도), date(최신)sim
--timeoutX요청 타임아웃(초)15
출력 예시:
json
{
  "query": "결혼식 체크리스트",
  "total_results": 7,
  "results": [
    {
      "title": "결혼식 체크리스트 총정리",
      "url": "https://blog.naver.com/user123/224212849946",
      "mobile_url": "https://m.blog.naver.com/user123/224212849946",
      "snippet": "결혼식 1주일 전에 반드시 확인해야 할...",
      "author": "user123"
    }
  ]
}
bash
python3 scripts/naver_search.py "검색어" --count 10 --sort sim
参数必填说明默认值
query搜索关键词-
--count结果数量(最多30条)10
--sortsim(相关度), date(最新)sim
--timeout请求超时时间(秒)15
输出示例:
json
{
  "query": "결혼식 체크리스트",
  "total_results": 7,
  "results": [
    {
      "title": "결혼식 체크리스트 총정리",
      "url": "https://blog.naver.com/user123/224212849946",
      "mobile_url": "https://m.blog.naver.com/user123/224212849946",
      "snippet": "결혼식 1주일 전에 반드시 확인해야 할...",
      "author": "user123"
    }
  ]
}

2. 블로그 원문 읽기

2. 读取博客原文

검색 결과에서 관심 있는 포스트의 URL을 선택하여 원문을 읽는다.
bash
python3 scripts/naver_read.py "https://blog.naver.com/user123/224212849946"
인자필수설명기본값
urlO블로그 포스트 URL (PC 또는 모바일)-
--no-imagesX이미지 URL 제외false
--max-lengthX본문 최대 글자 수 (0=무제한)0
--timeoutX요청 타임아웃(초)20
PC URL을 넣어도 자동으로 모바일 URL로 변환하여 요청한다.
从搜索结果中选择感兴趣的帖子URL,读取其原文内容。
bash
python3 scripts/naver_read.py "https://blog.naver.com/user123/224212849946"
参数必填说明默认值
url博客帖子URL(PC端或移动端均可)-
--no-images排除图片URLfalse
--max-length正文最大字数(0=无限制)0
--timeout请求超时时间(秒)20
即使输入PC端URL,也会自动转换为移动端URL发起请求。

3. 이미지 다운로드 (필요 시)

3. 下载图片(按需使用)

bash
python3 scripts/naver_download_images.py --urls "url1,url2,url3" --output ./images/
또는
naver_read.py
결과를 파이프로 전달:
bash
python3 scripts/naver_read.py "https://..." | python3 scripts/naver_download_images.py --output ./images/
인자필수설명기본값
--urlsX쉼표 구분 이미지 URL-
--outputX저장 디렉토리./naver-images/
--maxX최대 다운로드 수10
--timeoutX요청 타임아웃(초)15
bash
python3 scripts/naver_download_images.py --urls "url1,url2,url3" --output ./images/
或者通过管道传递
naver_read.py
的结果:
bash
python3 scripts/naver_read.py "https://..." | python3 scripts/naver_download_images.py --output ./images/
参数必填说明默认值
--urls逗号分隔的图片URL-
--output存储目录./naver-images/
--max最大下载数量10
--timeout请求超时时间(秒)15

추천 워크플로우

推荐工作流程

  1. naver_search.py
    로 검색 → 상위 3~5개 결과 확인
  2. 관련도 높은 포스트를
    naver_read.py
    로 원문 읽기
  3. 필요 시
    naver_download_images.py
    로 이미지 저장
  4. WebSearch(구글) 결과와 교차 검증하여 정보 신뢰도 높이기
  1. naver_search.py
    搜索 → 查看前3~5条结果
  2. naver_read.py
    读取相关度高的帖子原文
  3. 按需使用
    naver_download_images.py
    保存图片
  4. 和WebSearch(谷歌)结果交叉验证,提升信息可信度

Response policy

响应规则

  • 검색 결과와 본문은 사용자에게 요약하여 전달한다.
  • 블로그 출처(URL, 작성자)를 반드시 함께 안내한다.
  • 한 세션에 과도한 요청(수십 건 이상)을 자제한다.
  • 이미지 다운로드 시 사용자에게 저장 경로를 안내한다.
  • 将搜索结果和正文摘要后反馈给用户。
  • 必须同时告知博客来源(URL、作者)。
  • 避免单个会话发起过量请求(数十次以上)。
  • 下载图片时告知用户存储路径。

Done when

完成条件

  • 검색 결과가 JSON으로 정상 출력된다.
  • 블로그 원문 텍스트가 추출된다.
  • 필요한 이미지가 로컬에 저장된다.
  • 출처가 명시된다.
  • 搜索结果正常输出为JSON格式。
  • 博客原文文本提取完成。
  • 所需图片保存到本地。
  • 来源已明确标注。

Notes

注意事项

  • 네이버 검색엔진을 직접 요청하므로 대량/자동화 사용 시 IP 차단 가능성이 있다.
  • 이 스킬은 소량, 비상업적 콘텐츠 리서치 용도로 설계되었다.
  • 네이버 HTML 구조는 변경될 수 있어, 파싱 실패 시 에러 메시지를 확인하고 스크립트 업데이트가 필요할 수 있다.
  • PC 버전(
    blog.naver.com
    )은 iframe 구조여서 모바일 버전(
    m.blog.naver.com
    )을 사용한다.
  • 直接向Naver搜索引擎发起请求,因此大规模/自动化使用时存在IP被封禁的风险。
  • 本技能仅为小规模、非商业内容调研用途设计。
  • Naver的HTML结构可能会变更,解析失败时请查看错误信息,可能需要更新脚本。
  • PC端版本(
    blog.naver.com
    )为iframe结构,因此使用移动端版本(
    m.blog.naver.com
    )。