ClinicExpert ML API — Teknik Proje Dokümantasyonu

01 — Stratejik Değer

Genel Bakış & İş Değeri

Sağlık sektöründe gelen hasta/müşteri mesajlarını anında anlayıp doğru departmana yönlendirmek, operasyonel hız ve hasta memnuniyeti açısından kritik öneme sahiptir. ClinicExpert ML API, bu süreci tam otomatize eder.

🎯

~%90

Doğruluk (Accuracy)

📊

~0.88

Makro F1 Skoru

⚡

<1s

ML Gecikme Süresi

🤖

<3s

LLM ile Gecikme

🏷️

Tıbbi Kategori

🧠

Otomatik Tıbbi Sınıflandırma

Gelen sohbet metinlerini 7 farklı tıbbi kategoriye (Saç Ekimi, Diş Estetiği, Burun Estetiği vb.) otomatik olarak sınıflandırır. Manuel yönlendirme ihtiyacını ortadan kaldırır.

🔄

Hibrit ML + LLM Yaklaşımı

Yüksek güvenilirlikli tahminler için optimize edilmiş ML modeli çalışır. Düşük güvenilirlikli durumlarda OpenAI/Anthropic LLM'leri hakem olarak devreye girer.

⚡

Yüksek Performans

~%90 doğruluk ve ~0.88 F1 skoru ile güvenilir tahminler. ML modeliyle 1 saniyenin altında, LLM fallback ile 3 saniyenin altında yanıt süresi.

🔌

Kolay REST API Entegrasyonu

Sağlık bilgi sistemleri, çağrı merkezi yazılımları veya CRM platformları ile kolayca entegre edilebilir standart RESTful API arayüzü.

📈

Ölçeklenebilir Mimari

Docker konteyner tabanlı dağıtım ile iş yükü arttığında kolayca yatay ölçekleme. CPU ve bellek kaynak yönetimi tanımlı.

🌐

Çoklu Dil Desteği

langdetect ile otomatik dil tespiti. Farklı dillerdeki hasta mesajlarını doğru şekilde işleme yeteneği.

02 — Sınıflandırma

Tıbbi Sınıflandırma Kategorileri

Sistem, gelen WhatsApp mesajlarını aşağıdaki 7 tıbbi kategoriden birine otomatik olarak atar.

#	Kategori	Açıklama	Örnek Anahtar Kelimeler
1	Saç Ekimi	Saç ekimi, saç dökülmesi, FUE/DHI prosedürleri	hair transplant, saç ekimi, FUE, graft
2	Diş Estetiği	Diş kaplama, implant, gülüş tasarımı	dental, veneer, implant, teeth
3	Burun Estetiği	Rinoplasti, burun estetiği operasyonları	rhinoplasty, nose job, burun
4	Göz Estetiği	Göz kapağı estetiği, lazer göz operasyonları	eye surgery, blepharoplasty, göz
5	Yüz Estetiği	Yüz germe, botox, dolgu işlemleri	facelift, botox, filler, yüz
6	Vücut Estetiği	Liposuction, karın germe, vücut şekillendirme	liposuction, tummy tuck, body
7	Diğer	Yukarıdaki kategorilere uymayan genel sorgular	general inquiry, fiyat, randevu

03 — ML Pipeline

Makine Öğrenimi Pipeline'ı

Metin girişinden sınıflandırma sonucuna kadar olan uçtan uca veri işleme akışı. Hibrit yaklaşım ile güvenilirlik maksimize edilir.

💬

Metin Girişi

WhatsApp Mesajı

→

🔤

Ön İşleme

Temizleme & Dil Tespiti

→

📐

TF-IDF

Anahtar Kelime Ağırlıkları

→

🧬

MiniLM

Semantik Embeddings

→

🌳

LightGBM

Sınıflandırma Modeli

→

📊

Güven Skoru

Eşik Değer Kontrolü

→

🏷️

Kategori

Sonuç Çıktısı

🔄

Hibrit Fallback Mekanizması: Güven skoru belirlenen eşiğin altında kaldığında, sistem otomatik olarak OpenAI veya Anthropic LLM API'lerine başvurur ve hakem kararı ile nihai sınıflandırmayı yapar. Bu sayede düşük güvenilirlikli tahminlerde bile yüksek doğruluk sağlanır.

04 — Teknik Mimari

Sistem Mimarisi & Bileşenler

ETL'den model eğitimine, inference'dan API sunumuna kadar modüler ve katmanlı bir mimari. Her katman bağımsız olarak geliştirilebilir ve ölçeklenebilir.

Veri ETL Katmanı `src/data/` Data Pipeline

Ham WhatsApp konuşma verilerinin çıkarılması (Extract), dönüştürülmesi (Transform) ve yüklenmesi (Load) işlemlerini gerçekleştirir.

Ham sohbet verilerinin okunması ve parse edilmesi
Metin temizleme, normalizasyon ve ön işleme adımları
langdetect ile otomatik dil tespiti ve filtreleme
İşlenmiş verilerin model eğitimine uygun formata dönüştürülmesi
Veri seti dengeleme (imbalanced-learn) ile sınıf dağılımı optimizasyonu

Model Eğitim Katmanı `src/models/` ML Engine

Çift öznitelik çıkarımı ve güçlü sınıflandırma modeli ile yüksek doğruluklu tahmin sistemi.

TF-IDF Vektörizasyonu: Metinlerden istatistiksel anahtar kelime ağırlıkları çıkarma
MiniLM Sentence Embeddings: Transformer tabanlı semantik metin vektörleri oluşturma
Öznitelik Birleştirme: TF-IDF ve MiniLM özniteliklerinin concat edilmesi
LightGBM Sınıflandırıcı: Gradient boosting tabanlı yüksek performanslı model eğitimi
Çapraz doğrulama, hiperparametre optimizasyonu ve model değerlendirme
joblib ile eğitilmiş modellerin serileştirilmesi ve saklanması

Tahmin (Inference) Katmanı `src/inference/` Prediction Engine

Eğitilmiş modeli kullanarak gerçek zamanlı tahminler yapan ve hibrit yönlendirme mantığını uygulayan katman.

Eğitilmiş LightGBM modelinin bellekte yüklenmesi ve hazır tutulması
Gelen metnin TF-IDF + MiniLM özniteliklerine dönüştürülmesi
Güven Skoru Hesaplama: Model tahmin olasılıklarının değerlendirilmesi
Eşik Değer Yönlendirme: Yüksek güven → direkt ML sonucu, düşük güven → LLM hakem
LLM Fallback: OpenAI veya Anthropic API'ye metin gönderip hakem kararı alma
Tahmin sonuçlarının yapılandırılmış formatta döndürülmesi

LLM Etiketleme Katmanı `src/labeling/` Auto Labeling

Eğitim verisi genişletme ve otomatik etiketleme için LLM'lerin kullanıldığı veri zenginleştirme katmanı.

Etiketlenmemiş verilerin OpenAI/Anthropic API'leri ile otomatik etiketlenmesi
Yarı otomatik etiketleme süreçleri ile eğitim veri setinin genişletilmesi
LLM çıktılarının kalite kontrolü ve doğrulama mekanizmaları
Sürekli öğrenme döngüsü için yeni etiketli veri üretimi

API Servis Katmanı `src/api/` REST API

Dış dünya ile iletişim kuran, tüm tahmin işlevselliğini RESTful API endpoints olarak sunan servis katmanı.

FastAPI Framework: Python tabanlı yüksek performanslı asenkron API
Uvicorn ASGI Sunucu: Asenkron istek işleme ile yüksek throughput
Pydantic Modelleri: İstek ve yanıt şemalarının otomatik doğrulaması
PostgreSQL Entegrasyonu: Tahmin logları ve analitik veriler için kalıcı depolama
Otomatik API dokümantasyonu (Swagger/OpenAPI)
Health check ve monitoring endpoints

05 — Teknoloji Yığını

Kullanılan Teknolojiler

Geleneksel makine öğrenimi, büyük dil modelleri ve modern web framework'lerinin gücünü birleştiren kapsamlı teknoloji yığını.

🧠 Makine Öğrenimi & NLP

MiniLM Embeddings

Semantik Metin Vektörleri

TF-IDF (scikit-learn)

Anahtar Kelime Ağırlıklandırma

LightGBM

Gradient Boosting Sınıflandırıcı

sentence-transformers

Transformer Embedding Pipeline

imbalanced-learn

Veri Seti Dengeleme (SMOTE)

langdetect

Otomatik Dil Tespiti

🤖 LLM Entegrasyonu

OpenAI API

GPT Modelleri (Hakem LLM)

Anthropic API

Claude Modelleri (Alternatif LLM)

PyTorch

Derin Öğrenme Backend

🐍 API & Backend

FastAPI

Yüksek Performanslı API Çerçevesi

Uvicorn

ASGI Sunucu

Pydantic

Veri Doğrulama & Serileştirme

PostgreSQL

Veritabanı (psycopg2)

🛠️ Veri İşleme & Araçlar

Pandas & NumPy

Veri Manipülasyonu & Hesaplama

joblib

Model Serileştirme & Yükleme

PyYAML & python-dotenv

Konfigürasyon Yönetimi

tqdm

İlerleme Çubukları & Monitoring

06 — Dağıtım Mimarisi

Konteyner Yapısı & Dağıtım

Docker tabanlı izole ve ölçeklenebilir dağıtım stratejisi. Kaynak limitleri ve harici ağ entegrasyonu ile production-ready altyapı.

🐳

Docker Konteyner

python:3.11-slim tabanlı optimize edilmiş imaj. Tüm ML modelleri, bağımlılıklar ve API servisi izole konteynerde çalışır.

python:3.11-slim

🎼

Docker Compose

Servisin kolay başlatılması ve yönetilmesi için orkestrasyon. CPU ve bellek limitleri/rezervasyonları tanımlı.

2 CPU / 4GB RAM

🌐

Harici Ağ Entegrasyonu

Mevcut flaskapi_custom_net Docker ağına entegre. Daha büyük ekosistem ile servisler arası iletişim.

flaskapi_custom_net

🛡️

Apache Reverse Proxy

Servis doğrudan dışarıya açık değil, Apache ters proxy arkasından erişilir. Güvenlik katmanı ve yük dengeleme sağlar.

Apache Reverse Proxy

🚀

Dağıtım Betikleri

scripts/deploy_production.sh ile otomatik dağıtım. Makefile benzeri yapılar ile hızlı operasyonel yönetim.

CI/CD Ready

⚙️

.env Yapılandırma

API anahtarları (OpenAI, Anthropic), veritabanı bağlantıları ve model konfigürasyonları güvenli ortam değişkenlerinden yönetilir.

Secure Config

07 — Proje Yapısı

Dizin & Dosya Organizasyonu

ML model yaşam döngüsünü (veri hazırlığı, eğitim, tahmin, etiketleme) ve API servis katmanını net şekilde ayıran modüler yapı.

clinicexpert-ml-api / project-structure

📁 clinicexpert-ml-api/ │ ├── 📁 src/ ── Ana uygulama kaynak kodları │ ├── 📁 data/ ── ETL Pipeline (Extract, Transform, Load) │ │ ├── etl_pipeline.py ── Veri çıkarma ve dönüştürme │ │ ├── preprocessing.py ── Metin temizleme ve normalizasyon │ │ └── data_loader.py ── Veri seti yükleme ve dengeleme │ │ │ ├── 📁 models/ ── Model eğitimi ve değerlendirme │ │ ├── trainer.py ── LightGBM model eğitim pipeline'ı │ │ ├── feature_extractor.py ── TF-IDF + MiniLM öznitelik çıkarımı │ │ └── evaluator.py ── Model performans metrikleri │ │ │ ├── 📁 inference/ ── Tahmin mantığı ve yönlendirme │ │ ├── predictor.py ── Ana tahmin motoru │ │ ├── router.py ── ML/LLM hibrit yönlendirme │ │ └── llm_fallback.py ── OpenAI/Anthropic hakem entegrasyonu │ │ │ ├── 📁 labeling/ ── LLM destekli otomatik etiketleme │ │ ├── auto_labeler.py ── Otomatik etiketleme süreçleri │ │ └── quality_check.py ── Etiket kalite kontrolü │ │ │ └── 📁 api/ ── FastAPI servis tanımlamaları │ ├── main.py ── FastAPI uygulama başlatma noktası │ ├── routes.py ── API endpoint tanımları │ └── schemas.py ── Pydantic istek/yanıt modelleri │ ├── 📁 data/ ── Eğitilmiş modeller ve işlenmiş veriler │ ├── 📁 models/ ── Serileştirilmiş model dosyaları │ │ ├── lightgbm_classifier.pkl ── Eğitilmiş LightGBM modeli │ │ ├── tfidf_vectorizer.pkl ── TF-IDF vektörizör │ │ └── minilm_config.json ── MiniLM yapılandırması │ └── 📁 processed/ ── İşlenmiş eğitim/test veri setleri │ ├── 📁 config/ ── Konfigürasyon dosyaları │ ├── model_config.yaml ── Model hiperparametreleri │ ├── api_config.yaml ── API servis ayarları │ └── categories.yaml ── Sınıflandırma kategori tanımları │ ├── 📁 scripts/ ── Yardımcı betikler │ ├── deploy_production.sh ── Production dağıtım betiği │ ├── train_model.sh ── Model eğitim betiği │ └── label_data.sh ── Veri etiketleme betiği │ ├── 📁 logs/ ── Uygulama logları │ ├── Dockerfile ── python:3.11-slim tabanlı konteyner ├── docker-compose.yml ── Servis orkestrasyon (CPU/RAM limitleri) ├── requirements.txt ── Python bağımlılıkları └── .env

Genel Bakış & İş Değeri

Otomatik Tıbbi Sınıflandırma

Hibrit ML + LLM Yaklaşımı

Yüksek Performans

Kolay REST API Entegrasyonu

Ölçeklenebilir Mimari

Çoklu Dil Desteği

Tıbbi Sınıflandırma Kategorileri

Makine Öğrenimi Pipeline'ı

Sistem Mimarisi & Bileşenler

Veri ETL Katmanı src/data/ Data Pipeline

Model Eğitim Katmanı src/models/ ML Engine

Tahmin (Inference) Katmanı src/inference/ Prediction Engine

LLM Etiketleme Katmanı src/labeling/ Auto Labeling

API Servis Katmanı src/api/ REST API

Kullanılan Teknolojiler

Konteyner Yapısı & Dağıtım

Docker Konteyner

Docker Compose

Harici Ağ Entegrasyonu

Apache Reverse Proxy

Dağıtım Betikleri

.env Yapılandırma

Dizin & Dosya Organizasyonu

Veri ETL Katmanı `src/data/` Data Pipeline

Model Eğitim Katmanı `src/models/` ML Engine

Tahmin (Inference) Katmanı `src/inference/` Prediction Engine

LLM Etiketleme Katmanı `src/labeling/` Auto Labeling

API Servis Katmanı `src/api/` REST API