TPToolpazar

Yazılım Geliştirici

Hugging Face Rehberi

Hugging Face Hub, Spaces, Inference Endpoints, Transformers kütüphanesi, Türkçe modelleri keşfetme ve lisans seçenekleri için kapsamlı rehber 2026.

Hugging Face, açık kaynak yapay zeka topluluğunun GitHub’ı sayılan platformdur — 1.5+ milyon model, 250.000+ veri seti, binlerce demo (Spaces) ve Transformers gibi referans kütüphaneler bir arada. Bu rehber Hugging Face’in ne sunduğunu, model indirip kullanma adımlarını, Türkçe modelleri keşfetmeyi ve geliştirici ekosisteminde nasıl yer bulacağınızı anlatır.

Ne Sunuyor?

  • Models: Llama, Qwen, Mistral, DeepSeek gibi açık ağırlıklı modellerin resmi dağıtım yeri. Tüm sürümler, kuantize varyantlar.
  • Datasets: 250K+ açık veri seti (Türkçe Wikipedia, mC4, Trendyol-LLM dataset).
  • Spaces: Topluluk demo’ları — Gradio/Streamlit ile bir tıkla model deneme.
  • Inference Endpoints: Yönetilen GPU sunucusu — istediğiniz açık modeli API olarak kullanın.
  • Hub: Hesabınız + model/dataset deposu (git-tabanlı, GitHub gibi).
  • Transformers, Diffusers, PEFT: Python kütüphaneleri — endüstri standardı.

Model Hub'da Arama

huggingface.co/models adresinde filtreler: görev (text generation, embedding, image-to-text), dil (Turkish), boyut, lisans. Türkçe için iyi başlangıç filtreleri:

  • Multilingual modeller: meta-llama/Llama-3.3-70B, Qwen/Qwen3-32B, mistralai/Mistral-Large.
  • Türkçe-fine-tuned: dbmdz/bert-base-turkish-cased (klasik), ytu-ce-cosmos/Turkish-Llama-8B, Trendyol/Trendyol-LLM-7B.
  • Embedding: BAAI/bge-m3, intfloat/multilingual-e5, Alibaba-NLP/gte-multilingual.
  • Konuşma → metin: openai/whisper-large-v3, tiiuae/falcon-asr.

İndirip Kullanmak

# Python — Transformers ile yerel kullanım
pip install transformers torch

from transformers import AutoTokenizer, AutoModelForCausalLM

model_id = "Qwen/Qwen3-7B-Instruct"
tok = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype="auto",
  device_map="auto"
)

prompt = "Türkçe selam ver"
inputs = tok(prompt, return_tensors="pt").to(model.device)
out = model.generate(**inputs, max_new_tokens=200)
print(tok.decode(out[0], skip_special_tokens=True))

İlk indirme uzun sürer (model ~10-50 GB). Cache~/.cache/huggingface/hub altında. Aynı modeli tekrar indirmez.

Inference Endpoint (API olarak çalıştırma)

Kendi GPU’nuz yoksa, açık modeli API olarak kullanmanın hızlı yolu Hugging Face Inference Endpoints:

  • Pay-per-second GPU kiralama (T4’ten H100’e kadar)
  • OpenAI uyumlu endpoint
  • Auto-scale (idle iken kapanıyor)
  • AB region opsiyonu (KVKK için)

Alternatif: Together AI, Replicate, Fireworks, Groq — benzer hizmetler farklı fiyat ve hız ile.

Spaces ile Hızlı Demo

Bir modeli web’de denemek için Hugging Face Spaces ideal: Gradio veya Streamlit ile 50 satır Python yazıp publik URL alırsınız. Ücretsiz CPU; küçük ücretli GPU katmanları.

Türkçe için pratik kullanım: bir Türkçe çeviri modelinin demo’sunu paylaşma, eğitim materyali olarak gösterme, müşteri demosu için.

Lisans Dikkati

Her model bir lisansla gelir. Sık görülenler:

  • Apache 2.0: Tam serbest, ticari OK (Mistral, Qwen).
  • MIT: Apache benzeri (DeepSeek).
  • Llama Community License: Ticari OK, ama 700M aktif kullanıcı eşiği var.
  • OpenRAIL: Stable Diffusion türevleri — bazı kullanım kısıtları.
  • Non-commercial / Research only: Bazı eski model sürümleri.

Ürüne yerleştirmeden önce model kartında lisansı okuyun. Lisans uyumsuzluğu hukuki risk.

Sık Sorulan Sorular

Hugging Face ücretsiz mi?
Çoğu özelliği evet. Model/dataset indirme, Spaces ücretsiz CPU, account, kütüphaneler ücretsiz. Inference Endpoints, GPU Spaces ücretli (talebe göre).
Türkçe için hangi model en popüler?
Qwen3 (çoklu-dilli, Türkçe iyi), Llama 3.3, Trendyol-LLM-7B (Türkçe fine-tune). Klasik NLP için BERTurk (dbmdz/bert-base-turkish-cased).
Modeli indirmeden önce nasıl test edebilirim?
Spaces'taki demo'lar (varsa); Hugging Face Inference API ücretsiz quota; veya kendi makinenizde Ollama (çoğu HF modeli Ollama'da da var).
Hesap açmak gerekli mi?
Çoğu açık model için hayır. Ancak gated modeller (Llama, Mistral) lisans onayı gerektirir; hesapla giriş ister.
Veri yükleyebilir miyim?
Evet. Datasets sekmesi altında kendi veri setinizi yayınlayın. Public veya private. Türkçe veri seti yayınlamak topluluğa katkı.
Hugging Face'in API'si Anthropic/OpenAI ile nasıl kıyaslanır?
Açık modeller için ideal; kapalı modeller için Anthropic/OpenAI doğrudan daha hızlı. Hibrit yaklaşım yaygın: kapalı modeller resmi sağlayıcı, açık modeller HF Inference.

İlgili rehberler

  • Meta Llama Rehberi Llama 4 sürümleri, donanım gereksinimleri, Ollama ile yerel kurulum, Türkçe perf
  • Alibaba Qwen3 Rehberi Alibaba Qwen3 model ailesi, Coder/Math/VL/Audio özelleşmiş sürümleri, Türkçe per
  • LLM Fine-Tuning Rehberi LoRA, QLoRA, full fine-tuning farkları, Türkçe veri hazırlama, Llama/Qwen/Mistra