kaggle-learner
Compare original and translation side by side
🇺🇸
Original
English🇨🇳
Translation
ChineseKaggle Learner
Kaggle学习助手
Extract and apply knowledge from Kaggle competition winning solutions. This skill provides access to a continuously updated knowledge base of techniques, code patterns, and best practices from top Kaggle competitors.
提取并应用Kaggle竞赛获奖方案中的知识。该技能支持访问持续更新的知识库,涵盖来自Kaggle顶尖参赛者的技术、代码模式和最佳实践。
Overview
概述
Kaggle competitions are at the forefront of practical machine learning. Winning solutions often innovate with novel techniques, clever feature engineering, and optimized pipelines. This skill captures that knowledge and makes it accessible for your projects.
Kaggle竞赛处于实用机器学习的前沿。获奖方案通常包含创新技术、巧妙的特征工程和优化的工作流。该技能收集了这些知识,方便你在项目中使用。
When to Use
使用场景
Use this skill when:
- Studying for a Kaggle competition
- Looking for proven techniques in a specific domain (NLP, CV, etc.)
- Need code templates for common ML tasks
- Want to learn from competition winners
符合以下场景时可使用该技能:
- 为参加Kaggle竞赛学习备考
- 寻找特定领域(NLP、CV等)经过验证的技术方案
- 需要通用ML任务的代码模板
- 想要向竞赛获奖者学习
Knowledge Categories
知识分类
| Category | Focus | Directory |
|---|---|---|
| NLP | Text classification, NER, translation, LLM applications | |
| CV | Image classification, detection, segmentation, generation | |
| Time Series | Forecasting, anomaly detection, sequence modeling | |
| Tabular | Feature engineering, traditional ML, structured data | |
| Multimodal | Cross-modal tasks, vision-language models | |
文件组织结构:每个竞赛一个独立的 markdown 文件,按 domain 分类到对应目录。
示例:
time-series/birdclef-plus-2025.mdnlp/aimo-2-2025.md
| 分类 | 聚焦领域 | 目录路径 |
|---|---|---|
| NLP | 文本分类、命名实体识别、翻译、LLM应用 | |
| CV | 图像分类、检测、分割、生成 | |
| 时间序列 | 预测、异常检测、序列建模 | |
| 表格数据 | 特征工程、传统ML、结构化数据 | |
| 多模态 | 跨模态任务、视觉-语言模型 | |
文件组织结构:每个竞赛一个独立的 markdown 文件,按 domain 分类到对应目录。
示例:
time-series/birdclef-plus-2025.mdnlp/aimo-2-2025.md
Quick Reference
快速参考
To learn from a competition:
- Provide the Kaggle competition URL
- The kaggle-miner agent will extract the winning solution
- Knowledge is automatically added to the relevant category
- 前排方案详细技术分析 (Front-runner Detailed Technical Analysis) is automatically included
To browse existing knowledge:
- 浏览相关 domain 目录:
references/knowledge/[domain]/ - 每个竞赛一个独立文件,包含:
- Competition Brief (竞赛简介)
- 前排方案详细技术分析 (前排方案详细技术分析) ⭐
- Code Templates (代码模板)
- Best Practices (最佳实践)
学习某场竞赛的操作步骤:
- 提供Kaggle竞赛URL
- kaggle-miner Agent会提取获奖方案内容
- 知识会自动添加到对应分类下
- 自动包含前排方案详细技术分析内容
浏览现有知识的方式:
- 浏览相关 domain 目录:
references/knowledge/[domain]/ - 每个竞赛一个独立文件,包含:
- Competition Brief (竞赛简介)
- 前排方案详细技术分析 ⭐
- Code Templates (代码模板)
- Best Practices (最佳实践)
Self-Evolving
自我进化
This skill automatically updates its knowledge base when the kaggle-miner agent processes new competitions. The more you use it, the smarter it becomes.
当kaggle-miner Agent处理新竞赛时,该技能会自动更新其知识库。你使用的次数越多,它就越智能。
Knowledge Extraction Standard
知识提取标准
每次从 Kaggle 竞赛提取知识时,必须包含以下标准部分:
每次从 Kaggle 竞赛提取知识时,必须包含以下标准部分:
必需内容清单
必需内容清单
| 部分 | 说明 | 必需性 |
|---|---|---|
| Competition Brief | 竞赛背景、任务描述、数据规模、评估指标 | ✅ 必需 |
| Original Summaries | 前排方案的简要概述 | ✅ 必需 |
| 前排方案详细技术分析 | Top 20 方案的核心技巧和实现细节 | ✅ 必需 ⭐ |
| Code Templates | 可复用的代码模板 | ✅ 必需 |
| Best Practices | 最佳实践和常见陷阱 | ✅ 必需 |
| Metadata | 数据源标签和日期 | ✅ 必需 |
| 部分 | 说明 | 必需性 |
|---|---|---|
| Competition Brief | 竞赛背景、任务描述、数据规模、评估指标 | ✅ 必需 |
| Original Summaries | 前排方案的简要概述 | ✅ 必需 |
| 前排方案详细技术分析 | Top 20 方案的核心技巧和实现细节 | ✅ 必需 ⭐ |
| Code Templates | 可复用的代码模板 | ✅ 必需 |
| Best Practices | 最佳实践和常见陷阱 | ✅ 必需 |
| Metadata | 数据源标签和日期 | ✅ 必需 |
前排方案详细技术分析格式
前排方案详细技术分析格式
每个前排方案应包含:
- 排名和团队/作者
- 核心技巧列表 (3-6 个关键技术点)
- 实现细节 (具体的参数、配置、数据)
示例格式:
markdown
**排名 Place - 核心技术名称 (作者)**
核心技巧:
- **技巧1**: 简短说明
- **技巧2**: 简短说明
实现细节:
- 具体参数、模型、配置
- 数据和实验结果建议覆盖 Top 20 方案,获取更多前排选手的创新技巧
每个前排方案应包含:
- 排名和团队/作者
- 核心技巧列表 (3-6 个关键技术点)
- 实现细节 (具体的参数、配置、数据)
示例格式:
markdown
**排名 Place - 核心技术名称 (作者)**
核心技巧:
- **技巧1**: 简短说明
- **技巧2**: 简短说明
实现细节:
- 具体参数、模型、配置
- 数据和实验结果建议覆盖 Top 20 方案,获取更多前排选手的创新技巧
Additional Resources
额外资源
Knowledge Directories
知识目录
- - NLP competition techniques
references/knowledge/nlp/ - - Computer vision techniques
references/knowledge/cv/ - - Time series methods
references/knowledge/time-series/ - - Tabular data approaches
references/knowledge/tabular/ - - Multimodal solutions
references/knowledge/multimodal/
- - NLP竞赛技术
references/knowledge/nlp/ - - 计算机视觉技术
references/knowledge/cv/ - - 时间序列方法
references/knowledge/time-series/ - - 表格数据处理方案
references/knowledge/tabular/ - - 多模态解决方案
references/knowledge/multimodal/
Competition Examples
竞赛示例
- BirdCLEF+ 2025 () - 包含完整的 Top 14 前排方案详细技术分析
time-series/birdclef-plus-2025.md - BirdCLEF 2024 () - 包含 Top 3 方案详细技术分析
time-series/birdclef-2024.md - AIMO-2 () - 包含 Top 12+ 前排方案技术总结
nlp/aimo-2-2025.md
- BirdCLEF+ 2025 () - 包含完整的 Top 14 前排方案详细技术分析
time-series/birdclef-plus-2025.md - BirdCLEF 2024 () - 包含 Top 3 方案详细技术分析
time-series/birdclef-2024.md - AIMO-2 () - 包含 Top 12+ 前排方案技术总结
nlp/aimo-2-2025.md