Gizli — Dahili Kullanım İçin

ClinicExpert
ML API
Sistemi

WhatsApp konuşmalarını analiz ederek tıbbi kategorilere otomatik sınıflandıran, hibrit Makine Öğrenimi ve Büyük Dil Modeli (LLM) tabanlı yüksek performanslı kurumsal yapay zeka API platformu.

Proje Tipi
ML/AI Classification API
Model
TF-IDF + MiniLM + LightGBM
Fallback
OpenAI / Anthropic LLM
API Framework
FastAPI (Python)
Durum
● Production
Aşağı Kaydır
01 — Stratejik Değer

Genel Bakış & İş Değeri

Sağlık sektöründe gelen hasta/müşteri mesajlarını anında anlayıp doğru departmana yönlendirmek, operasyonel hız ve hasta memnuniyeti açısından kritik öneme sahiptir. ClinicExpert ML API, bu süreci tam otomatize eder.

🎯
~%90
Doğruluk (Accuracy)
📊
~0.88
Makro F1 Skoru
<1s
ML Gecikme Süresi
🤖
<3s
LLM ile Gecikme
🏷️
7
Tıbbi Kategori
🧠

Otomatik Tıbbi Sınıflandırma

Gelen sohbet metinlerini 7 farklı tıbbi kategoriye (Saç Ekimi, Diş Estetiği, Burun Estetiği vb.) otomatik olarak sınıflandırır. Manuel yönlendirme ihtiyacını ortadan kaldırır.

🔄

Hibrit ML + LLM Yaklaşımı

Yüksek güvenilirlikli tahminler için optimize edilmiş ML modeli çalışır. Düşük güvenilirlikli durumlarda OpenAI/Anthropic LLM'leri hakem olarak devreye girer.

Yüksek Performans

~%90 doğruluk ve ~0.88 F1 skoru ile güvenilir tahminler. ML modeliyle 1 saniyenin altında, LLM fallback ile 3 saniyenin altında yanıt süresi.

🔌

Kolay REST API Entegrasyonu

Sağlık bilgi sistemleri, çağrı merkezi yazılımları veya CRM platformları ile kolayca entegre edilebilir standart RESTful API arayüzü.

📈

Ölçeklenebilir Mimari

Docker konteyner tabanlı dağıtım ile iş yükü arttığında kolayca yatay ölçekleme. CPU ve bellek kaynak yönetimi tanımlı.

🌐

Çoklu Dil Desteği

langdetect ile otomatik dil tespiti. Farklı dillerdeki hasta mesajlarını doğru şekilde işleme yeteneği.

02 — Sınıflandırma

Tıbbi Sınıflandırma Kategorileri

Sistem, gelen WhatsApp mesajlarını aşağıdaki 7 tıbbi kategoriden birine otomatik olarak atar.

# Kategori Açıklama Örnek Anahtar Kelimeler
1 Saç Ekimi Saç ekimi, saç dökülmesi, FUE/DHI prosedürleri hair transplant, saç ekimi, FUE, graft
2 Diş Estetiği Diş kaplama, implant, gülüş tasarımı dental, veneer, implant, teeth
3 Burun Estetiği Rinoplasti, burun estetiği operasyonları rhinoplasty, nose job, burun
4 Göz Estetiği Göz kapağı estetiği, lazer göz operasyonları eye surgery, blepharoplasty, göz
5 Yüz Estetiği Yüz germe, botox, dolgu işlemleri facelift, botox, filler, yüz
6 Vücut Estetiği Liposuction, karın germe, vücut şekillendirme liposuction, tummy tuck, body
7 Diğer Yukarıdaki kategorilere uymayan genel sorgular general inquiry, fiyat, randevu
03 — ML Pipeline

Makine Öğrenimi Pipeline'ı

Metin girişinden sınıflandırma sonucuna kadar olan uçtan uca veri işleme akışı. Hibrit yaklaşım ile güvenilirlik maksimize edilir.

💬
Metin Girişi
WhatsApp Mesajı
🔤
Ön İşleme
Temizleme & Dil Tespiti
📐
TF-IDF
Anahtar Kelime Ağırlıkları
🧬
MiniLM
Semantik Embeddings
🌳
LightGBM
Sınıflandırma Modeli
📊
Güven Skoru
Eşik Değer Kontrolü
🏷️
Kategori
Sonuç Çıktısı
🔄

Hibrit Fallback Mekanizması: Güven skoru belirlenen eşiğin altında kaldığında, sistem otomatik olarak OpenAI veya Anthropic LLM API'lerine başvurur ve hakem kararı ile nihai sınıflandırmayı yapar. Bu sayede düşük güvenilirlikli tahminlerde bile yüksek doğruluk sağlanır.

04 — Teknik Mimari

Sistem Mimarisi & Bileşenler

ETL'den model eğitimine, inference'dan API sunumuna kadar modüler ve katmanlı bir mimari. Her katman bağımsız olarak geliştirilebilir ve ölçeklenebilir.

1

Veri ETL Katmanı src/data/ Data Pipeline

Ham WhatsApp konuşma verilerinin çıkarılması (Extract), dönüştürülmesi (Transform) ve yüklenmesi (Load) işlemlerini gerçekleştirir.

  • Ham sohbet verilerinin okunması ve parse edilmesi
  • Metin temizleme, normalizasyon ve ön işleme adımları
  • langdetect ile otomatik dil tespiti ve filtreleme
  • İşlenmiş verilerin model eğitimine uygun formata dönüştürülmesi
  • Veri seti dengeleme (imbalanced-learn) ile sınıf dağılımı optimizasyonu
2

Model Eğitim Katmanı src/models/ ML Engine

Çift öznitelik çıkarımı ve güçlü sınıflandırma modeli ile yüksek doğruluklu tahmin sistemi.

  • TF-IDF Vektörizasyonu: Metinlerden istatistiksel anahtar kelime ağırlıkları çıkarma
  • MiniLM Sentence Embeddings: Transformer tabanlı semantik metin vektörleri oluşturma
  • Öznitelik Birleştirme: TF-IDF ve MiniLM özniteliklerinin concat edilmesi
  • LightGBM Sınıflandırıcı: Gradient boosting tabanlı yüksek performanslı model eğitimi
  • Çapraz doğrulama, hiperparametre optimizasyonu ve model değerlendirme
  • joblib ile eğitilmiş modellerin serileştirilmesi ve saklanması
3

Tahmin (Inference) Katmanı src/inference/ Prediction Engine

Eğitilmiş modeli kullanarak gerçek zamanlı tahminler yapan ve hibrit yönlendirme mantığını uygulayan katman.

  • Eğitilmiş LightGBM modelinin bellekte yüklenmesi ve hazır tutulması
  • Gelen metnin TF-IDF + MiniLM özniteliklerine dönüştürülmesi
  • Güven Skoru Hesaplama: Model tahmin olasılıklarının değerlendirilmesi
  • Eşik Değer Yönlendirme: Yüksek güven → direkt ML sonucu, düşük güven → LLM hakem
  • LLM Fallback: OpenAI veya Anthropic API'ye metin gönderip hakem kararı alma
  • Tahmin sonuçlarının yapılandırılmış formatta döndürülmesi
4

LLM Etiketleme Katmanı src/labeling/ Auto Labeling

Eğitim verisi genişletme ve otomatik etiketleme için LLM'lerin kullanıldığı veri zenginleştirme katmanı.

  • Etiketlenmemiş verilerin OpenAI/Anthropic API'leri ile otomatik etiketlenmesi
  • Yarı otomatik etiketleme süreçleri ile eğitim veri setinin genişletilmesi
  • LLM çıktılarının kalite kontrolü ve doğrulama mekanizmaları
  • Sürekli öğrenme döngüsü için yeni etiketli veri üretimi
5

API Servis Katmanı src/api/ REST API

Dış dünya ile iletişim kuran, tüm tahmin işlevselliğini RESTful API endpoints olarak sunan servis katmanı.

  • FastAPI Framework: Python tabanlı yüksek performanslı asenkron API
  • Uvicorn ASGI Sunucu: Asenkron istek işleme ile yüksek throughput
  • Pydantic Modelleri: İstek ve yanıt şemalarının otomatik doğrulaması
  • PostgreSQL Entegrasyonu: Tahmin logları ve analitik veriler için kalıcı depolama
  • Otomatik API dokümantasyonu (Swagger/OpenAPI)
  • Health check ve monitoring endpoints
05 — Teknoloji Yığını

Kullanılan Teknolojiler

Geleneksel makine öğrenimi, büyük dil modelleri ve modern web framework'lerinin gücünü birleştiren kapsamlı teknoloji yığını.

🧠 Makine Öğrenimi & NLP
MiniLM Embeddings
Semantik Metin Vektörleri
TF-IDF (scikit-learn)
Anahtar Kelime Ağırlıklandırma
LightGBM
Gradient Boosting Sınıflandırıcı
sentence-transformers
Transformer Embedding Pipeline
imbalanced-learn
Veri Seti Dengeleme (SMOTE)
langdetect
Otomatik Dil Tespiti
🤖 LLM Entegrasyonu
OpenAI API
GPT Modelleri (Hakem LLM)
Anthropic API
Claude Modelleri (Alternatif LLM)
PyTorch
Derin Öğrenme Backend
🐍 API & Backend
FastAPI
Yüksek Performanslı API Çerçevesi
Uvicorn
ASGI Sunucu
Pydantic
Veri Doğrulama & Serileştirme
PostgreSQL
Veritabanı (psycopg2)
🛠️ Veri İşleme & Araçlar
Pandas & NumPy
Veri Manipülasyonu & Hesaplama
joblib
Model Serileştirme & Yükleme
PyYAML & python-dotenv
Konfigürasyon Yönetimi
tqdm
İlerleme Çubukları & Monitoring
06 — Dağıtım Mimarisi

Konteyner Yapısı & Dağıtım

Docker tabanlı izole ve ölçeklenebilir dağıtım stratejisi. Kaynak limitleri ve harici ağ entegrasyonu ile production-ready altyapı.

🐳

Docker Konteyner

python:3.11-slim tabanlı optimize edilmiş imaj. Tüm ML modelleri, bağımlılıklar ve API servisi izole konteynerde çalışır.

python:3.11-slim
🎼

Docker Compose

Servisin kolay başlatılması ve yönetilmesi için orkestrasyon. CPU ve bellek limitleri/rezervasyonları tanımlı.

2 CPU / 4GB RAM
🌐

Harici Ağ Entegrasyonu

Mevcut flaskapi_custom_net Docker ağına entegre. Daha büyük ekosistem ile servisler arası iletişim.

flaskapi_custom_net
🛡️

Apache Reverse Proxy

Servis doğrudan dışarıya açık değil, Apache ters proxy arkasından erişilir. Güvenlik katmanı ve yük dengeleme sağlar.

Apache Reverse Proxy
🚀

Dağıtım Betikleri

scripts/deploy_production.sh ile otomatik dağıtım. Makefile benzeri yapılar ile hızlı operasyonel yönetim.

CI/CD Ready
⚙️

.env Yapılandırma

API anahtarları (OpenAI, Anthropic), veritabanı bağlantıları ve model konfigürasyonları güvenli ortam değişkenlerinden yönetilir.

Secure Config
07 — Proje Yapısı

Dizin & Dosya Organizasyonu

ML model yaşam döngüsünü (veri hazırlığı, eğitim, tahmin, etiketleme) ve API servis katmanını net şekilde ayıran modüler yapı.

clinicexpert-ml-api / project-structure
📁 clinicexpert-ml-api/ │ ├── 📁 src/ ── Ana uygulama kaynak kodları │ ├── 📁 data/ ── ETL Pipeline (Extract, Transform, Load) │ │ ├── etl_pipeline.py ── Veri çıkarma ve dönüştürme │ │ ├── preprocessing.py ── Metin temizleme ve normalizasyon │ │ └── data_loader.py ── Veri seti yükleme ve dengeleme │ │ │ ├── 📁 models/ ── Model eğitimi ve değerlendirme │ │ ├── trainer.py ── LightGBM model eğitim pipeline'ı │ │ ├── feature_extractor.py ── TF-IDF + MiniLM öznitelik çıkarımı │ │ └── evaluator.py ── Model performans metrikleri │ │ │ ├── 📁 inference/ ── Tahmin mantığı ve yönlendirme │ │ ├── predictor.py ── Ana tahmin motoru │ │ ├── router.py ── ML/LLM hibrit yönlendirme │ │ └── llm_fallback.py ── OpenAI/Anthropic hakem entegrasyonu │ │ │ ├── 📁 labeling/ ── LLM destekli otomatik etiketleme │ │ ├── auto_labeler.py ── Otomatik etiketleme süreçleri │ │ └── quality_check.py ── Etiket kalite kontrolü │ │ │ └── 📁 api/ ── FastAPI servis tanımlamaları │ ├── main.py ── FastAPI uygulama başlatma noktası │ ├── routes.py ── API endpoint tanımları │ └── schemas.py ── Pydantic istek/yanıt modelleri │ ├── 📁 data/ ── Eğitilmiş modeller ve işlenmiş veriler │ ├── 📁 models/ ── Serileştirilmiş model dosyaları │ │ ├── lightgbm_classifier.pkl ── Eğitilmiş LightGBM modeli │ │ ├── tfidf_vectorizer.pkl ── TF-IDF vektörizör │ │ └── minilm_config.json ── MiniLM yapılandırması │ └── 📁 processed/ ── İşlenmiş eğitim/test veri setleri │ ├── 📁 config/ ── Konfigürasyon dosyaları │ ├── model_config.yaml ── Model hiperparametreleri │ ├── api_config.yaml ── API servis ayarları │ └── categories.yaml ── Sınıflandırma kategori tanımları │ ├── 📁 scripts/ ── Yardımcı betikler │ ├── deploy_production.sh ── Production dağıtım betiği │ ├── train_model.sh ── Model eğitim betiği │ └── label_data.sh ── Veri etiketleme betiği │ ├── 📁 logs/ ── Uygulama logları │ ├── Dockerfile ── python:3.11-slim tabanlı konteyner ├── docker-compose.yml ── Servis orkestrasyon (CPU/RAM limitleri) ├── requirements.txt ── Python bağımlılıkları └── .env