Yazılım Geliştirici
Hugging Face Rehberi
Hugging Face Hub, Spaces, Inference Endpoints, Transformers kütüphanesi, Türkçe modelleri keşfetme ve lisans seçenekleri için kapsamlı rehber 2026.
Hugging Face, açık kaynak yapay zeka topluluğunun GitHub’ı sayılan platformdur — 1.5+ milyon model, 250.000+ veri seti, binlerce demo (Spaces) ve Transformers gibi referans kütüphaneler bir arada. Bu rehber Hugging Face’in ne sunduğunu, model indirip kullanma adımlarını, Türkçe modelleri keşfetmeyi ve geliştirici ekosisteminde nasıl yer bulacağınızı anlatır.
Ne Sunuyor?
- Models: Llama, Qwen, Mistral, DeepSeek gibi açık ağırlıklı modellerin resmi dağıtım yeri. Tüm sürümler, kuantize varyantlar.
- Datasets: 250K+ açık veri seti (Türkçe Wikipedia, mC4, Trendyol-LLM dataset).
- Spaces: Topluluk demo’ları — Gradio/Streamlit ile bir tıkla model deneme.
- Inference Endpoints: Yönetilen GPU sunucusu — istediğiniz açık modeli API olarak kullanın.
- Hub: Hesabınız + model/dataset deposu (git-tabanlı, GitHub gibi).
- Transformers, Diffusers, PEFT: Python kütüphaneleri — endüstri standardı.
Model Hub'da Arama
huggingface.co/models adresinde filtreler: görev (text generation, embedding, image-to-text), dil (Turkish), boyut, lisans. Türkçe için iyi başlangıç filtreleri:
- Multilingual modeller: meta-llama/Llama-3.3-70B, Qwen/Qwen3-32B, mistralai/Mistral-Large.
- Türkçe-fine-tuned: dbmdz/bert-base-turkish-cased (klasik), ytu-ce-cosmos/Turkish-Llama-8B, Trendyol/Trendyol-LLM-7B.
- Embedding: BAAI/bge-m3, intfloat/multilingual-e5, Alibaba-NLP/gte-multilingual.
- Konuşma → metin: openai/whisper-large-v3, tiiuae/falcon-asr.
İndirip Kullanmak
# Python — Transformers ile yerel kullanım
pip install transformers torch
from transformers import AutoTokenizer, AutoModelForCausalLM
model_id = "Qwen/Qwen3-7B-Instruct"
tok = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id,
torch_dtype="auto",
device_map="auto"
)
prompt = "Türkçe selam ver"
inputs = tok(prompt, return_tensors="pt").to(model.device)
out = model.generate(**inputs, max_new_tokens=200)
print(tok.decode(out[0], skip_special_tokens=True))İlk indirme uzun sürer (model ~10-50 GB). Cache~/.cache/huggingface/hub altında. Aynı modeli tekrar indirmez.
Inference Endpoint (API olarak çalıştırma)
Kendi GPU’nuz yoksa, açık modeli API olarak kullanmanın hızlı yolu Hugging Face Inference Endpoints:
- Pay-per-second GPU kiralama (T4’ten H100’e kadar)
- OpenAI uyumlu endpoint
- Auto-scale (idle iken kapanıyor)
- AB region opsiyonu (KVKK için)
Alternatif: Together AI, Replicate, Fireworks, Groq — benzer hizmetler farklı fiyat ve hız ile.
Spaces ile Hızlı Demo
Bir modeli web’de denemek için Hugging Face Spaces ideal: Gradio veya Streamlit ile 50 satır Python yazıp publik URL alırsınız. Ücretsiz CPU; küçük ücretli GPU katmanları.
Türkçe için pratik kullanım: bir Türkçe çeviri modelinin demo’sunu paylaşma, eğitim materyali olarak gösterme, müşteri demosu için.
Lisans Dikkati
Her model bir lisansla gelir. Sık görülenler:
- Apache 2.0: Tam serbest, ticari OK (Mistral, Qwen).
- MIT: Apache benzeri (DeepSeek).
- Llama Community License: Ticari OK, ama 700M aktif kullanıcı eşiği var.
- OpenRAIL: Stable Diffusion türevleri — bazı kullanım kısıtları.
- Non-commercial / Research only: Bazı eski model sürümleri.
Ürüne yerleştirmeden önce model kartında lisansı okuyun. Lisans uyumsuzluğu hukuki risk.
Sık Sorulan Sorular
Hugging Face ücretsiz mi?
Türkçe için hangi model en popüler?
Modeli indirmeden önce nasıl test edebilirim?
Hesap açmak gerekli mi?
Veri yükleyebilir miyim?
Hugging Face'in API'si Anthropic/OpenAI ile nasıl kıyaslanır?
İlgili rehberler
- Meta Llama Rehberi — Llama 4 sürümleri, donanım gereksinimleri, Ollama ile yerel kurulum, Türkçe perf…
- Alibaba Qwen3 Rehberi — Alibaba Qwen3 model ailesi, Coder/Math/VL/Audio özelleşmiş sürümleri, Türkçe per…
- LLM Fine-Tuning Rehberi — LoRA, QLoRA, full fine-tuning farkları, Türkçe veri hazırlama, Llama/Qwen/Mistra…