A collection of oral narratives and songs of generations...
Kurdish poetry and prose narratives were historically transmitted orally and less in a written form. Being an essential medium of oral narration and literature, Kurdish lyrics have had a unique attribute in becoming a vital resource for different types of studies, including Digital Humanities, Computational Folkloristics and Computational Linguistics. As an initial study of its kind for the Kurdish language, this paper presents our efforts in transcribing and collecting Kurdish folk lyrics as a corpus that covers various Kurdish musical genres, in particular Beyt, Goranî, Bend, and Heyran. We believe that this corpus contributes to Kurdish language processing in several ways, such as compensation for the lack of a long history of written text by incorporating oral literature, presenting an unexplored realm in Kurdish language processing, and assisting the initiation of Kurdish computational folkloristics. Our corpus contains 49,582 tokens in the Sorani dialect of Kurdish.
This corpus is the result of the manual transcription of audiovisual material. You can read more about this project in our paper. It is being constantly completed. Everybody can contribute to enrich the corpus by:
If you are using any part of the data, cite our paper using this bib file or the following:
Ahmadi, Sina, Hossein Hassani, Kamaladdin Abedi. "A Corpus of the Sorani Kurdish Folkloric Lyrics". In Proceedings of the 1st Joint Spoken Language Technologies for Under-resourced languages (SLTU) and Collaboration and Computing for Under-Resourced Languages (CCURL) Workshop at the 12th International Conference on Language Resources and Evaluation (LREC), 2020.The corpus is available in XML (TEI) and JSON at https://github.com/KurdishBLARK/KurdishLyricsCorpus.
Title | Performer | Category | Dialects | Lyrics |
---|---|---|---|---|
unassigned | بەرهەم شەمامی و دەروێش نەغەدە | Bend | Sorani | text (audio 🔊) |
نەورۆز | قادر مامەندی | Bend | Sorani | text (audio 🔊) |
هیچی من و هیچی تۆ | خالقی | Goranî | Sorani | text (audio 🔊) |
وا مهکه | ماملێ | Goranî | Sorani | text (audio 🔊) |
چیمەن | ناسر رهزازی | Goranî | Sorani | text (audio 🔊) |
unassigned | حەبوو قەرەگوێزی | Bend | Sorani | text (audio 🔊) |
باوانەکەی بابم | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
ههڵاڵه | خالقی | Goranî | Sorani | text (audio 🔊) |
مریەم سابڵاخی | مەزهەر خالقی | Goranî | Sorani | text (audio 🔊) |
لای لای | سهحهر لوتفی | Goranî | Sorani | text (audio 🔊) |
سهبری | شههین تاڵهبانی و عهباس کهمهندی | Goranî | Sorani | text (audio 🔊) |
بهرههڵبێنه | خهلیل سادقی | Goranî | Sorani | text (audio 🔊) |
ئایشیلێ جوانێ | ناسر رهزازی | Goranî | Sorani | text (audio 🔊) |
له سیلهی قهبران | فواد ئهحمهد | Goranî | Sorani | text (audio 🔊) |
بەرزینێ | مستەفا شێواو و عەلی گڵێنانی | Bend | Sorani | text (audio 🔊) |
نازهنین | ماملێ | Goranî | Sorani | text (audio 🔊) |
نووری گهرمیانی | لێوت خوێنی گهشهمه | Bend | Sorani | text (audio 🔊) |
حهریره | ناسر رهزازی | Goranî | Sorani | text (audio 🔊) |
له سابڵاخێ وه دهر کهوتم | ناسری ره زازی | Goranî | Sorani | text (audio 🔊) |
ههواره | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
کراس زهردێ | رەزا بابامیری | Goranî | Sorani | text (audio 🔊) |
راوچیان | وهستا حهسهنی کاکایی | Goranî | Sorani | text (audio 🔊) |
گوڵ وهی گوڵ وهی بهیان | Unknown | Goranî | Sorani | text (audio 🔊) |
شهمامه و خاڵ خاڵ | برایانی زیزی | Goranî | Sorani | text (audio 🔊) |
شهده شل | عهلی مهردان | Goranî | Sorani | text (audio 🔊) |
چین چین و لۆلۆ | سهی حهمهی سهفایی | Goranî | Sorani | text (audio 🔊) |
unassigned | سەید عەلی سەردەشتی | Bend | Sorani | text (audio 🔊) |
هاوار ئهی هاوار | ناسری رهزازی | Goranî | Sorani | text (audio 🔊) |
ماڵه بابم نهسرین | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
خاڵۆ خاڵۆ | ناسری رهزازی | Goranî | Sorani | text (audio 🔊) |
ئایشیلێ نازهنینێ | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
گێلگێلە شیلانەکەی | مەزهەری خالەقی | Goranî | Sorani | text (audio 🔊) |
لانکۆڵێ | مەرزیە فەریقی | Goranî | Sorani | text (audio 🔊) |
تۆز دەکا | ئیبراهیم فەتاحی | Bend | Sorani | text (audio 🔊) |
جەواد گڵێنانی | ئەمان لێ ئەمان لێ | Bend | Sorani | text (audio 🔊) |
گەڕیان | کازم باشماخی | Geryan | Sorani | text (audio 🔊) |
کیژەکەی کافرۆش | مکاییل | Goranî | Sorani | text (audio 🔊) |
وەرە وەرە سوورە گوڵ | خوسرەو ماملێ | Goranî | Sorani | text (audio 🔊) |
ژن به ژنه | قادر مامەندی | Bend | Sorani | text (audio 🔊) |
ئۆخەی گوڵزار عێراقی | قادر مامەندی | Bend | Sorani | text (audio 🔊) |
ئامۆزا گیان | شەهێن تاڵەبانی | Goranî | Sorani | text (audio 🔊) |
ڕاوچیان | محەممەدی ماملێ | Goranî | Sorani | text (audio 🔊) |
لایلۆنە | محەممەدی ماملێ | Goranî | Sorani | text (audio 🔊) |
لایلۆنە | یۆنس بۆراقی | Goranî | Sorani | text (audio 🔊) |
دەچم بە مامەی دەڵێم | ئاراز ڕەباتی و گۆران ئینزیبات | Goranî | Sorani | text (audio 🔊) |
دەچم بە مامەی دەڵێم | مەحموود محەممەد | Goranî | Sorani | text (audio 🔊) |
دەچم بە مامەی دەڵێم | unassigned | Goranî | Sorani | text (audio 🔊) |
خشەی دێت و وشەی دێ | حەسەن میراوایی | Goranî | Sorani | text (audio 🔊) |
ڕازی نابم بە ماچێ | عەلی خەندان | Goranî | Sorani | text (audio 🔊) |
unassigned | سەید عەلی سەردەشتی | Bend | Sorani | text (audio 🔊) |
کەمەرە شل لەو جەنگە | فەرزاد ئەسەدی | Goranî | Sorani | text (audio 🔊) |
حەبێ خان | ناسر ڕەزازی | Goranî | Sorani | text (audio 🔊) |
وهره قوربان | حەسەن زیرەک | Goranî | Sorani | text (audio 🔊) |
کەومل | مەزهەر خالەقی | Goranî | Sorani | text (audio 🔊) |
ناز ناز نازدارە | مەلا حوسێن عەبدوڵڵازادە | Bend | Sorani | text (audio 🔊) |
unassigned | عەلی خەندان | Goranî | Sorani | text (audio 🔊) |
ئازیزم تۆ گوڵەکەمی | کامکاران | Goranî | Sorani | text (audio 🔊) |
بهیتی شێخ مهند و شێخ رهشی | unassigned | Beyt | Sorani | text (audio 🔊) |
بۆچ منت ناوێ | حەسەن زیرەک | Goranî | Sorani | text (audio 🔊) |
بهیتی سائیلی | unassigned | Beyt | Sorani | text (audio 🔊) |
بێ دوکتور دهوا و دهرمان | حەسەن زیرەک | Goranî | Sorani | text (audio 🔊) |
کوڵنجه رێ رێ | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
گرتمت بهستمت | ناسر ڕەزازی | Goranî | Sorani | text (audio 🔊) |
بهیتی ماکو و چهرداری | unassigned | Beyt | Sorani | text (audio 🔊) |
بهیتی باپیراغای مهنگوڕ | unassigned | Beyt | Sorani | text (audio 🔊) |
زەمبیل فرۆش | خلە دەرزی | Beyt | Sorani | text (audio 🔊) |
بەیتی سەید برایمی | unassigned | Beyt | Sorani | text (audio 🔊) |
بهیتی قهبری | unassigned | Beyt | Sorani | text (audio 🔊) |
لاس و خهزاڵ | unassigned | Beyt | Sorani | text (audio 🔊) |
بەیتی موحەمەدی حەنیفه | unassigned | Beyt | Sorani | text (audio 🔊) |
unassigned | سمایل سەردەشتی | Bend | Sorani | text (audio 🔊) |
مەستوورەی مهستان | خەسرەوی ماملێ | Goranî | Sorani | text (audio 🔊) |
نەتۆری | عەباسی کەمەندی | Goranî | Sorani | text (audio 🔊) |
سەیزادە دووعام لێ دەکا | ئیبراهیم قادری | Bend | Sorani | text (audio 🔊) |
سەبریه | عەزیز شاڕۆخ | Goranî | Sorani | text (audio 🔊) |
چنوورە و چنووری | میدیا حسێن و ئیبراهیم فەتاحی | Goranî | Sorani | text (audio 🔊) |
بۆنی هەڵاڵان دێ | مەزهەری خالەقی | Goranî | Sorani | text (audio 🔊) |
کەژاوە | کامکارەکان | Goranî | Sorani | text (audio 🔊) |
شیرین تەشی دەڕێسی | مەزهەری خالەقی | Goranî | Sorani | text (audio 🔊) |
ئەی وەی بە لەنجە | برایم قادری مەلا حوسێن | Goranî | Sorani | text (audio 🔊) |
دەنگیان دێ | حەمە کێلە شینی | Goranî | Sorani | text (audio 🔊) |
خهنهبهندان | میکایل | Goranî | Sorani | text (audio 🔊) |
خهجیلێ | میکایل | Goranî | Sorani | text (audio 🔊) |
پهچهکهت لاده | میکایل | Goranî | Sorani | text (audio 🔊) |
سلێمان بهگی بانه | ناسر رهزازی | Goranî | Sorani | text (audio 🔊) |
کهتانه | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
فاتیمه | عەلی مەردان | Goranî | Sorani | text (audio 🔊) |
کوێستانان خاڵخاڵ | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
نهجیبه | میکایل | Goranî | Sorani | text (audio 🔊) |
هانێ گوڵ | حهمه جهزا | Goranî | Sorani | text (audio 🔊) |
کاکی جووتیار | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
شڵهو خانان | قادر ئیلیاسی | Goranî | Sorani | text (audio 🔊) |
شای و زهماوهند | میدیا حسێن | Goranî | Sorani | text (audio 🔊) |
مەلوول گیان | ناسر رهزازی | Goranî | Sorani | text (audio 🔊) |
له گوڵ و له گوڵان | ناسر رهزازی | Goranî | Sorani | text (audio 🔊) |
ههرزاڵێ | ناسر رهزازی | Goranî | Sorani | text (audio 🔊) |
گهلاوێژ | حوسێن تهعریف | Goranî | Sorani | text (audio 🔊) |
unassigned | حەسەن میراوایی | Bend | Sorani | text (audio 🔊) |
له سابڵاغێ وه دهر کهوتم | ناسر رهزازی | Goranî | Sorani | text (audio 🔊) |
لهنجه گیان به لهنجه | سهید محهمهدی سهفایی | Goranî | Sorani | text (audio 🔊) |
عارهق عارهق عارهقه | حهسهن میراوایی | Goranî | Sorani | text (audio 🔊) |
زەینەبێ | فواد ئەحمەد | Goranî | Sorani | text (audio 🔊) |
مهگره مهگره مهگره | عهبدوڵڵا ماچکهیی | Goranî | Sorani | text (audio 🔊) |
رەش ئەسمەر | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
وهره قوربان | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
unassigned | unassigned | Bertewnane | Sorani | text (audio 🔊) |
مهک مهکه | عهبدوڵڵا ماچکهیی | Goranî | Sorani | text (audio 🔊) |
زارا گیان | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
بارانه | سهی حهمهی سهفایی | Goranî | Sorani | text (audio 🔊) |
دڵهکهی وهرگرتم | حەسەن زیرەک | Goranî | Sorani | text (audio 🔊) |
باران بارانه | قادر دیلان | Goranî | Sorani | text (audio 🔊) |
ههر وایه ههر وایه | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
لهیلم هۆ | فهقێ مینه | Bend | Sorani | text (audio 🔊) |
بهینۆ | ئهردهڵان بهکر | Goranî | Sorani | text (audio 🔊) |
ئازیز بەهارە | شەماڵ سائیب | Goranî | Sorani | text (audio 🔊) |
ئامان دوکتور | زیرهک | Goranî | Sorani | text (audio 🔊) |
یاران وەسیەتم | کەریم کابان | Goranî | Sorani | text (audio 🔊) |
نهتۆری | عهباس کهمهندی | Goranî | Sorani | text (audio 🔊) |
گوڵاڵە سوورە | جەمال موفتی | Goranî | Sorani | text (audio 🔊) |
بڵێن بە یار | خالقی | Goranî | Sorani | text (audio 🔊) |
گوڵەکەم | ماملێ | Goranî | Sorani | text (audio 🔊) |
لای لای سوره گوڵ | حهسهن زیرهک | Goranî | Sorani | text (audio 🔊) |
unassigned | عەلی گڵێنانی و عومبەر شنۆیی | Bend | Sorani | text (audio 🔊) |
فاتمۆکێ | حەسەن زیرەک | Goranî | Sorani | text (audio 🔊) |
لە دوور | خالید ڕەشید | Goranî | Sorani | text (audio 🔊) |
تۆ چاوت نەیشێ | عه باسی کهمهندی | Goranî | Sorani | text (audio 🔊) |
This corpus is publicly available for non-commercial use under the CC BY-NC-SA 4.0 license. © Copyright 2020 Kurdish-BLARK
This interface was created by Sina Ahmadi based on Jekyll-DB (Jekyll + ListJS + Bootstrap).