Özel vakit ayırıp PİP ortamındaki çok dilli metin özetleme algoritmalarını unutmayayım diye buraya yazıyorum. Bu paketleri sıklıkla kendi projelerimde kullanıyorum. Sizin de önerdiğiniz paketler varsa yorum kısmına yazabilirsinz.

Paketler & Algoritmalar

SpaCy

Endüstri ayarında doğal dil işleme kütüphanesidir. Öyle kia aldında onunla yazılmış başka alt projeler vardır

LingFeat

Spacy ile yazılmıştır. Metin içerisinden gramatik öğeler de dahil bilgi çıkarımı içindir: https://spacy.io/universe/project/lingfeat

NeatText

Metin verilerini ve metin ön işlemeyi temizlemek için basit bir NLP paketi. NLP ve ML İçin Metin Temizlemeyi Basitleştirme https://pypi.org/project/neattext/

LexRank

Ağ analizi tabanlı bir algoritma: https://github.com/crabcamp/lexrank

Makalesi: Güneş Erkan and Dragomir R. Radev: LexRank: Graph-based Lexical Centrality as Salience in Text Summarization.

Text2Text

Facebook transformers kullanan ama epey yavaş çalışan güçlü bir algoritma, metin özetleme dışında BM25, TF.IDF hesaplayıcısı da içerir. Ayrıca çeviri ve soru yaratımı da yapar. https://pypi.org/project/text2text/

Basit bir algoritma

İşimi görsün yeter diyenler için: https://towardsdatascience.com/simple-text-summarization-in-python-bdf58bfee77f

TextCaret

İçinde sentiment aracı, görselleştirme ve metin yaratım aracı da bulundurur: https://pypi.org/project/textcaret/

Sumy

LexRank ve TextRank gibi algoritmalarla özet çıkaran güzel bir pakettir: https://pypi.org/project/sumy/

TextNet

Semantik ağlar çıkarmaya yarayan bir pakettir: https://spacy.io/universe/project/textnets/

Negspacy

Olumsuzlama öğelerini çıkamraya yarayan paket https://github.com/jenojp/negspacy

Mordecai

Metinden ülke ve yer bilgileri çıkarma: https://github.com/openeventdata/mordecai

Kurs ve Dokümantasyon

Spacy Advanced NLP

Beğendiğim adım adım bir kurs: https://course.spacy.io/en/