Öğrenilecek şeyler çok olunca sadece onların listesini bile düzenli bir yerde tutmak gerekiyor. Yüzlerce farklı kaynaktan, röportajdan ve listeden derlediğim bir kısmını da daha önceden kullandığım ‘şeyler’. İşte veri bilimciliğinde öğrenilmesi gereken şeylerin ‘canlı’ ve yapılandırılmış listesi:
-
Kullanılışlı API’ler:
- Bu API’ler özellikle sosyal medya madenciliğinde yararlıdır:
- Facebook API
- Quandl API (Finansal veri API’si)
- IBM Watson API
-
Sık kullanılan güncel algoritmalar / modeller / teknolojiler:
- Bir çok yerde karşınıza çıkacak öğrenilmesi gereken konular:
- Artificial Neural Network
- eXtreme Gradient Boosing
- Elastic Net
- Vowpal Wabbit
- Factorization Machines
- LibFFM
- Regualized Greedy Forest (RGF)
-
Değerli portaller:
- Bu portallere ara sıra bakıp, okumalı:
-
AnalyticsVidhya: Hintliler bu işi de kimseye bırakmamış.
-
KDNuggets: Öğrenme kaynakları
- Özellikle tasvsiye: Kaggle: Açık yarışmalar,StoryCV oluşturma
- Springboard : Veri bilimciler için iş ilan sitesi
- DataKind : Gerçek veri bilim problemleri ile uğraşın
-
Veri Kaynakları ve Kaynak Listeleri
- Elimde veri yok diyorsanız
- Değerli 19 ücretsiz kaynak listesi
-
Kurslar:
- Durmadan öğrenenler için:
- Önemli 15 açık matematik kurs listesi
- Özel MIT Veri Bilimciler için Matematik Kursu
-
Veri Görselleştirme Araçları:
-
Görsellik önemlidir:
-
Blog girdisi, Veri görselleştirme araçları listesi
-
-
R /Python Paketleri
- El altında bulunması gereken R/Python paketleri
- RVest: Web’den metinsel veri derlemek için
- Python için RAKE algoritması kütüphanesi. RAKE unsupervized yolla metin sınıflandırma imkanı sağlıyor. Python paketi burada
-
El altı sunumlar:
** Bir kaç slaytla dertlere deva olanlar**:
- HTML Extraction Webden metin derleme
-
Makale Listeleri/ Makaleler:
(CopyPaste ya da ‘phrapase’ etmeden önce bir kez daha düşünün:)