Search Results: red-teaming

Found 16 Skills

deliberation-debate-red-teaming

Use when testing plans or decisions for blind spots, need adversarial review before launch, validating strategy against worst-case scenarios, building consensus through structured debate, identifying attack vectors or vulnerabilities, user mentions "play devil's advocate", "what could go wrong", "challenge our assumptions", "stress test this", "red team", or when groupthink or confirmation bias may be hiding risks.

🇺🇸|EnglishTranslated

Security & Compliancepluginagentmarketplace/cu...

red-team-frameworks

Tools and frameworks for AI red teaming including PyRIT, garak, Counterfit, and custom attack automation

🇺🇸|EnglishTranslated

1 scripts/Checked

AI & Machine Learninglebsral/dspy-programming-...

ai-testing-safety

Find every way users can break your AI before they do. Use when you need to red-team your AI, test for jailbreaks, find prompt injection vulnerabilities, run adversarial testing, do a safety audit before launch, prove your AI is safe for compliance, stress-test guardrails, or verify your AI holds up against adversarial users. Covers automated attack generation, iterative red-teaming with DSPy, and MIPROv2-optimized adversarial testing.

🇺🇸|EnglishTranslated

AI & Machine Learningyonatangross/orchestkit

advanced-guardrails

LLM guardrails with NeMo, Guardrails AI, and OpenAI. Input/output rails, hallucination prevention, fact-checking, toxicity detection, red-teaming patterns. Use when building LLM guardrails, safety checks, or red-team workflows.

🇺🇸|EnglishTranslated

1 scripts/Checked

AI & Machine Learningpluginagentmarketplace/cu...

continuous-monitoring

Real-time monitoring and detection of adversarial attacks and model drift in production

🇺🇸|EnglishTranslated

1 scripts/Checked

AI & Machine Learningpluginagentmarketplace/cu...

input-output-guardrails

Implementing safety filters, content moderation, and guardrails for AI system inputs and outputs

🇺🇸|EnglishTranslated

1 scripts/Checked

Security & Compliancepluginagentmarketplace/cu...

safety-filter-bypass

Techniques to test and bypass AI safety filters, content moderation systems, and guardrails for security assessment

🇺🇸|EnglishTranslated

1 scripts/Checked

Code Qualityyuniorglez/gemini-elite-c...

code-review-pro

Senior Code Architect & Quality Assurance Engineer for 2026. Specialized in context-aware AI code reviews, automated PR auditing, and technical debt mitigation. Expert in neutralizing "AI-Smells," identifying performance bottlenecks, and enforcing architectural integrity through multi-job red-teaming and surgical remediation suggestions.

🇺🇸|EnglishTranslated

AI & Machine Learningmicrosoft/eval-guide

eval-faq

Answers AI agent evaluation methodology questions with practical, opinionated guidance grounded primarily in Microsoft's agent evaluation ecosystem (MS Learn, Eval Scenario Library, Triage & Improvement Playbook, Eval Guidance Kit) supplemented by select industry sources.

🇺🇸|EnglishTranslated

AI & Machine Learningjeffallan/claude-skills

the-fool

Use when challenging ideas, plans, decisions, or proposals using structured critical reasoning. Invoke to play devil's advocate, run a pre-mortem, red team, or audit evidence and assumptions.

🇺🇸|EnglishTranslated

AI & Machine Learningmarcioaltoe/skills

the-fool

Use when challenging ideas, plans, decisions, or proposals. Invoke to play devil's advocate, run a pre-mortem, red team, stress test assumptions, audit evidence quality, or find blind spots before committing. Do NOT use for building plans, making decisions, or generating solutions — this skill only challenges and critiques.

🇺🇸|EnglishTranslated

Security & Compliancearadotso/mcp-skills

vulnerable-mcp-servers-lab

A collection of deliberately vulnerable MCP servers for learning pentesting and AI red teaming techniques

🇺🇸|EnglishTranslated