naver-blog-research
Compare original and translation side by side
🇺🇸
Original
English🇨🇳
Translation
Chinese네이버 블로그 리서치
Naver博客调研
What this skill does
该技能的功能
네이버 블로그를 검색하고, 개별 포스트의 원문을 읽고, 이미지를 로컬에 다운로드한다.
- API 키 없이 표준 라이브러리만으로 동작한다.
python3 - 검색 결과를 구조화된 JSON으로 출력한다.
- 모바일 버전()을 이용해 iframe 없이 본문을 직접 추출한다.
m.blog.naver.com - 블로그 이미지 CDN(,
blogfiles.naver.net)에서 이미지를 다운로드한다.postfiles.pstatic.net
搜索Naver博客,读取单篇帖子原文,将图片下载到本地。
- 无需API密钥,仅使用标准库即可运行。
python3 - 将搜索结果输出为结构化JSON格式。
- 使用移动端版本(),无需iframe即可直接提取正文内容。
m.blog.naver.com - 从博客图片CDN(、
blogfiles.naver.net)下载图片。postfiles.pstatic.net
When to use
适用场景
- "네이버 블로그에서 결혼식 체크리스트 검색해줘"
- "네이버 블로그 리서치 해줘"
- "한국 블로그에서 관련 정보 조사해줘"
- "네이버 블로그 글 읽어줘"
- "이 네이버 블로그 포스트에서 이미지 다운로드해줘"
- 한국어 콘텐츠 리서치에서 구글 외 네이버 블로그 소스가 필요한 상황
- "帮我在Naver博客搜索婚礼清单"
- "帮我做Naver博客调研"
- "帮我在韩国博客中查找相关信息"
- "帮我读取这篇Naver博客文章"
- "帮我下载这篇Naver博客帖子里的图片"
- 调研韩语内容时,除了谷歌之外还需要Naver博客来源的场景
When not to use
不适用场景
- 네이버 뉴스, 카페, 지식iN 등 블로그 외 네이버 서비스 검색
- 대량 크롤링/스크래핑 (한 세션에 수십 건 이상의 요청)
- 상업적 데이터 수집
- 搜索Naver新闻、咖啡馆、知识iN等非博客类的Naver服务
- 大规模爬取/抓取(单个会话发起数十次以上请求)
- 商业用途的数据采集
Prerequisites
前置要求
- 인터넷 연결
- 3.8+
python3 - 이 스킬 디렉토리의 안에 포함된 helper 스크립트
scripts/
- 网络连接
- 3.8+
python3 - 本技能目录文件夹下包含的辅助脚本
scripts/
Workflow
工作流程
1. 네이버 블로그 검색
1. Naver博客搜索
bash
python3 scripts/naver_search.py "검색어" --count 10 --sort sim| 인자 | 필수 | 설명 | 기본값 |
|---|---|---|---|
| query | O | 검색어 | - |
| --count | X | 결과 수 (최대 30) | 10 |
| --sort | X | sim(관련도), date(최신) | sim |
| --timeout | X | 요청 타임아웃(초) | 15 |
출력 예시:
json
{
"query": "결혼식 체크리스트",
"total_results": 7,
"results": [
{
"title": "결혼식 체크리스트 총정리",
"url": "https://blog.naver.com/user123/224212849946",
"mobile_url": "https://m.blog.naver.com/user123/224212849946",
"snippet": "결혼식 1주일 전에 반드시 확인해야 할...",
"author": "user123"
}
]
}bash
python3 scripts/naver_search.py "검색어" --count 10 --sort sim| 参数 | 必填 | 说明 | 默认值 |
|---|---|---|---|
| query | 是 | 搜索关键词 | - |
| --count | 否 | 结果数量(最多30条) | 10 |
| --sort | 否 | sim(相关度), date(最新) | sim |
| --timeout | 否 | 请求超时时间(秒) | 15 |
输出示例:
json
{
"query": "결혼식 체크리스트",
"total_results": 7,
"results": [
{
"title": "결혼식 체크리스트 총정리",
"url": "https://blog.naver.com/user123/224212849946",
"mobile_url": "https://m.blog.naver.com/user123/224212849946",
"snippet": "결혼식 1주일 전에 반드시 확인해야 할...",
"author": "user123"
}
]
}2. 블로그 원문 읽기
2. 读取博客原文
검색 결과에서 관심 있는 포스트의 URL을 선택하여 원문을 읽는다.
bash
python3 scripts/naver_read.py "https://blog.naver.com/user123/224212849946"| 인자 | 필수 | 설명 | 기본값 |
|---|---|---|---|
| url | O | 블로그 포스트 URL (PC 또는 모바일) | - |
| --no-images | X | 이미지 URL 제외 | false |
| --max-length | X | 본문 최대 글자 수 (0=무제한) | 0 |
| --timeout | X | 요청 타임아웃(초) | 20 |
PC URL을 넣어도 자동으로 모바일 URL로 변환하여 요청한다.
从搜索结果中选择感兴趣的帖子URL,读取其原文内容。
bash
python3 scripts/naver_read.py "https://blog.naver.com/user123/224212849946"| 参数 | 必填 | 说明 | 默认值 |
|---|---|---|---|
| url | 是 | 博客帖子URL(PC端或移动端均可) | - |
| --no-images | 否 | 排除图片URL | false |
| --max-length | 否 | 正文最大字数(0=无限制) | 0 |
| --timeout | 否 | 请求超时时间(秒) | 20 |
即使输入PC端URL,也会自动转换为移动端URL发起请求。
3. 이미지 다운로드 (필요 시)
3. 下载图片(按需使用)
bash
python3 scripts/naver_download_images.py --urls "url1,url2,url3" --output ./images/또는 결과를 파이프로 전달:
naver_read.pybash
python3 scripts/naver_read.py "https://..." | python3 scripts/naver_download_images.py --output ./images/| 인자 | 필수 | 설명 | 기본값 |
|---|---|---|---|
| --urls | X | 쉼표 구분 이미지 URL | - |
| --output | X | 저장 디렉토리 | ./naver-images/ |
| --max | X | 최대 다운로드 수 | 10 |
| --timeout | X | 요청 타임아웃(초) | 15 |
bash
python3 scripts/naver_download_images.py --urls "url1,url2,url3" --output ./images/或者通过管道传递的结果:
naver_read.pybash
python3 scripts/naver_read.py "https://..." | python3 scripts/naver_download_images.py --output ./images/| 参数 | 必填 | 说明 | 默认值 |
|---|---|---|---|
| --urls | 否 | 逗号分隔的图片URL | - |
| --output | 否 | 存储目录 | ./naver-images/ |
| --max | 否 | 最大下载数量 | 10 |
| --timeout | 否 | 请求超时时间(秒) | 15 |
추천 워크플로우
推荐工作流程
- 로 검색 → 상위 3~5개 결과 확인
naver_search.py - 관련도 높은 포스트를 로 원문 읽기
naver_read.py - 필요 시 로 이미지 저장
naver_download_images.py - WebSearch(구글) 결과와 교차 검증하여 정보 신뢰도 높이기
- 用搜索 → 查看前3~5条结果
naver_search.py - 用读取相关度高的帖子原文
naver_read.py - 按需使用保存图片
naver_download_images.py - 和WebSearch(谷歌)结果交叉验证,提升信息可信度
Response policy
响应规则
- 검색 결과와 본문은 사용자에게 요약하여 전달한다.
- 블로그 출처(URL, 작성자)를 반드시 함께 안내한다.
- 한 세션에 과도한 요청(수십 건 이상)을 자제한다.
- 이미지 다운로드 시 사용자에게 저장 경로를 안내한다.
- 将搜索结果和正文摘要后反馈给用户。
- 必须同时告知博客来源(URL、作者)。
- 避免单个会话发起过量请求(数十次以上)。
- 下载图片时告知用户存储路径。
Done when
完成条件
- 검색 결과가 JSON으로 정상 출력된다.
- 블로그 원문 텍스트가 추출된다.
- 필요한 이미지가 로컬에 저장된다.
- 출처가 명시된다.
- 搜索结果正常输出为JSON格式。
- 博客原文文本提取完成。
- 所需图片保存到本地。
- 来源已明确标注。
Notes
注意事项
- 네이버 검색엔진을 직접 요청하므로 대량/자동화 사용 시 IP 차단 가능성이 있다.
- 이 스킬은 소량, 비상업적 콘텐츠 리서치 용도로 설계되었다.
- 네이버 HTML 구조는 변경될 수 있어, 파싱 실패 시 에러 메시지를 확인하고 스크립트 업데이트가 필요할 수 있다.
- PC 버전()은 iframe 구조여서 모바일 버전(
blog.naver.com)을 사용한다.m.blog.naver.com
- 直接向Naver搜索引擎发起请求,因此大规模/自动化使用时存在IP被封禁的风险。
- 本技能仅为小规模、非商业内容调研用途设计。
- Naver的HTML结构可能会变更,解析失败时请查看错误信息,可能需要更新脚本。
- PC端版本()为iframe结构,因此使用移动端版本(
blog.naver.com)。m.blog.naver.com