Özel vakit ayırıp PİP ortamındaki çok dilli metin özetleme algoritmalarını unutmayayım diye buraya yazıyorum. Bu paketleri sıklıkla kendi projelerimde kullanıyorum. Sizin de önerdiğiniz paketler varsa yorum kısmına yazabilirsinz.
Paketler & Algoritmalar
SpaCy
Endüstri ayarında doğal dil işleme kütüphanesidir. Öyle kia aldında onunla yazılmış başka alt projeler vardır
LingFeat
Spacy ile yazılmıştır. Metin içerisinden gramatik öğeler de dahil bilgi çıkarımı içindir: https://spacy.io/universe/project/lingfeat
NeatText
Metin verilerini ve metin ön işlemeyi temizlemek için basit bir NLP paketi. NLP ve ML İçin Metin Temizlemeyi Basitleştirme https://pypi.org/project/neattext/
LexRank
Ağ analizi tabanlı bir algoritma: https://github.com/crabcamp/lexrank
Makalesi: Güneş Erkan and Dragomir R. Radev: LexRank: Graph-based Lexical Centrality as Salience in Text Summarization.
Text2Text
Facebook transformers kullanan ama epey yavaş çalışan güçlü bir algoritma, metin özetleme dışında BM25, TF.IDF hesaplayıcısı da içerir. Ayrıca çeviri ve soru yaratımı da yapar. https://pypi.org/project/text2text/
Basit bir algoritma
İşimi görsün yeter diyenler için: https://towardsdatascience.com/simple-text-summarization-in-python-bdf58bfee77f
TextCaret
İçinde sentiment aracı, görselleştirme ve metin yaratım aracı da bulundurur: https://pypi.org/project/textcaret/
Sumy
LexRank ve TextRank gibi algoritmalarla özet çıkaran güzel bir pakettir: https://pypi.org/project/sumy/
TextNet
Semantik ağlar çıkarmaya yarayan bir pakettir: https://spacy.io/universe/project/textnets/
Negspacy
Olumsuzlama öğelerini çıkamraya yarayan paket https://github.com/jenojp/negspacy
Mordecai
Metinden ülke ve yer bilgileri çıkarma: https://github.com/openeventdata/mordecai
Kurs ve Dokümantasyon
Spacy Advanced NLP
Beğendiğim adım adım bir kurs: https://course.spacy.io/en/