Arcee AI

Team

company

Verified

https://arcee.ai

arcee_ai

arcee-ai

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

bartowski new activity 4 days ago

arcee-ai/Trinity-Large-Preview-GGUF:error 403

Crystalcareai updated a model 6 days ago

arcee-ai/Trinity-Large-Preview

MaziyarPanahi updated a collection 8 days ago

Trinity-Large

View all activity

MaziyarPanahi

posted an update 2 days ago

Post

1053

Announcing: OpenMed Multilingual PII Detection Models

Today I am releasing 105 open-source models for Personally Identifiable Information (PII) detection in French, German, and Italian.

All Apache 2.0 licensed. Free for commercial use. No restrictions.

Performance:

- French: 97.97% F1 (top model)
- German: 97.61% F1 (top model)
- Italian: 97.28% F1 (top model)

All top-10 models per language exceed 96% F1

Coverage:

55+ PII entity types per language
Native ID formats: NSS (French), Sozialversicherungsnummer (German), Codice Fiscale (Italian)
Language-specific address, phone, and name patterns

Training Data:

French: 49,580 samples
German: 42,250 samples
Italian: 40,944 samples

Why Multilingual?

European healthcare operates in European languages. Clinical notes, patient records, and medical documents are generated in French, German, Italian, and other languages.

Effective de-identification requires:

- Native language understanding — not translation
- Local ID format recognition — each country has unique patterns
- Cultural context awareness — names, addresses, and formats vary
- These models deliver production-ready accuracy without requiring data to leave your infrastructure or language.

HIPAA & GDPR Compliance
Built for US and European privacy regulations:

- On-premise deployment: Process data locally with zero external dependencies
- Data sovereignty: No API calls, no cloud services, no cross-border transfers
- Air-gapped capable: Deploy in fully isolated environments if required
- Regulatory-grade accuracy: Supporting Expert Determination standards
- HIPAA and GDPR compliance across languages, without compliance gaps.

Use Cases
- Hospital EHR systems: Automated patient record de-identification
- Clinical research: Multilingual dataset preparation for studies
- Insurance companies: Claims processing across

https://huggingface.co/collections/OpenMed/multilingual-pii-and-de-identification

1 reply

bartowski

in arcee-ai/Trinity-Large-Preview-GGUF 4 days ago

error 403

#1 opened 4 days ago by

krustik

MaziyarPanahi

posted an update 5 days ago

Post

1158

From Golden Gate Bridge to Broken JSON: Why Anthropic's SAE Steering Fails for Structured Output

I ran 6 experiments trying to use Anthropic's SAE steering for JSON generation.

- Base model: 86.8% valid JSON
- Steering only: 24.4%
- Fine-tuned: 96.6%
- FSM constrained: 100%

Steering is for semantics, not syntax.

https://huggingface.co/blog/MaziyarPanahi/sae-steering-json

Crystalcareai

updated a model 6 days ago

arcee-ai/Trinity-Large-Preview

Text Generation • 399B • Updated 6 days ago • 1.73k • 140

MaziyarPanahi

posted an update 6 days ago

Post

3883

🚨 Day 8/8: OpenMed Medical Reasoning Dataset Release - THE GRAND FINALE

Today I complete my 8-day release series with Medical-Reasoning-SFT-Mega.
The largest open medical reasoning dataset, combining 7 state-of-the-art AI models with fair distribution deduplication.

THE 7 SOURCE MODELS (Original Sample Counts):

1. Trinity-Mini: 810,284 samples
2. Qwen3-Next-80B: 604,249 samples
3. GPT-OSS-120B: 506,150 samples
4. Nemotron-Nano-30B: 444,544 samples
5. GLM-4.5-Air: 225,179 samples
6. MiniMax-M2.1: 204,773 samples
7. Baichuan-M3-235B: 124,520 samples

TOTAL BEFORE DEDUPLICATION: 2,919,699 samples

TOKEN COUNTS:
- Content tokens: 2.22 Billion
- Reasoning tokens: 1.56 Billion
- Total tokens: 3.78 Billion
- Samples with chain-of-thought: 100%

Quick Start:

from datasets import load_dataset
ds = load_dataset("OpenMed/Medical-Reasoning-SFT-Mega")

6 replies

MaziyarPanahi

updated a collection 8 days ago

Trinity-Large

Collection

5 items • Updated 8 days ago • 39

MaziyarPanahi

in arcee-ai/Trinity-Large-Preview 14 days ago

Bypass thinking?

#1 opened 16 days ago by

ZQ-Dev

bartowski

updated a collection 15 days ago

Trinity-Large

Collection

5 items • Updated 8 days ago • 39

bartowski

published a model 15 days ago

arcee-ai/Trinity-Large-Preview-GGUF

Updated 15 days ago • 1.53k • 10

bartowski

updated a model 15 days ago

arcee-ai/Trinity-Large-Preview-GGUF

Updated 15 days ago • 1.53k • 10

bartowski

updated 2 models 16 days ago

arcee-ai/Trinity-Large-Preview-FP8

Text Generation • 399B • Updated 16 days ago • 1.01k • 30

arcee-ai/Trinity-Large-Preview

Text Generation • 399B • Updated 6 days ago • 1.73k • 140

lckr

updated a model 16 days ago

arcee-ai/Trinity-Large-Preview

Text Generation • 399B • Updated 6 days ago • 1.73k • 140

lckr

updated a collection 16 days ago

Trinity-Large

Collection

5 items • Updated 8 days ago • 39

lckr

published a model 16 days ago

arcee-ai/Trinity-Large-Preview-FP8

Text Generation • 399B • Updated 16 days ago • 1.01k • 30

bartowski

published a model 16 days ago

arcee-ai/Trinity-Large-Preview

Text Generation • 399B • Updated 6 days ago • 1.73k • 140

lckr

published a model 16 days ago

arcee-ai/Trinity-Large-Base

Text Generation • 399B • Updated 16 days ago • 503 • 50

AI & ML interests

Recent Activity

Team members 27

arcee-ai's activity

error 403

Bypass thinking?