Sunday, February 25, 2018

Two lists of Arabic stop words developed while working on this paper:

Abu El-Khair, I. (2006). Effects of Stop Words Elimination on Arabic Information Retrieval. International Journal of Computing and Information Sciences , 4(3), 121-135.

https://arxiv.org/abs/1702.01925 

https://scholar.google.ca/citations?view_op=view_citation&hl=en&user=Q9VhrFgAAAAJ&citation_for_view=Q9VhrFgAAAAJ:u5HHmVD_uO8C

===========================

A. General Stop List:

انها

اثناء

اجل

احدا

احدى

احيانا

اخرى

اخيرا

اذ

اذا

اذن

ازاء

استمرار

اصبح

اصبحت

اكثر

الا

الان

الآن

الأمام

الأمر

الأن

الإطلاق

البعض

التى

التي

الجاري

الحالي

الخ

الذان

الذى

الذي

الذين

الرغم

السابق

السواء

الغير

القادم

اللاتي

اللاحق

اللتان

اللتين

اللذان

اللذين

 

اللواتي

المقبل

الممكن

المنصرم

النحو

الى

اليه

اليها

اليهم

اما

امام

امس

ان

انا

انت

انتم

انك

انكم

انكن

انما

اننا

انني

انه

انهم

انهما

انهن

او

اولئك

اي

اياه

ايضا

اين

ايها

آخر

أبدا

أثناء

أجل

أحد

أحياناً

أخرى

أخيرا

أخيراً

أزاء

أشياء

 

أصبح

أقل

أكثر

ألا

ألست

ألستم

ألستما

ألستن

ألسن

أليس

أليست

أليسوا

أم

أما

أمام

أمامك

أمامكم

أمامكما

أمامكن

أمامنا

أمامه

أمامها

أمامهم

أمامهما

أمامهن

أمامي

أن

أنا

أنت

أنتم

أنتما

أنتن

أنك

أنكم

أنكما

أنكن

أنما

أننا

أنني

أنه

أنها

أنهم

أنهما

أنهن

 

أنى

أني

أو

أواخر

أولئك

أولا

أولاء

أولائك

أولائكم

أولائكما

أولائكن

أى

أي

أياً

أيان

أية

أيضا

أيضاً

أين

أينما

أيها

أيهم

أيهما

أيهن

إحدى

إذ

إذا

إذاً

إزاء

إطلاقاً

إلا

إلى

إلي

إليك

إليكم

إليكما

إليكن

إلينا

إليه

إليها

إليهم

إليهما

إليهن

إما

 

إن

إنا

إنك

إنكم

إنكما

إنما

إننا

إنني

إنه

إنها

إنهم

إنهما

إنهن

إني

إياك

إياكم

إياكما

إياكن

إياه

إياها

إياهم

إياهما

إياهن

إياى

بئس

بالأمام

بالأمر

بالإضافة

بالتالي

بالتأكيد

بالتي

بالذي

بالذين

بالرغم

بالضبط

بالغير

بالقول

باللاتي

باللتان

باللتين

باللذان

باللذين

باللواتي

بالنسبة

 

بامكان

بان

بانه

باولئك

بآخر

بأحد

بأشياء

بأقل

بألا

بأن

بأنا

بأنك

بأنكم

بأنكما

بأنكن

بأننا

بأنني

بأنه

بأنها

بأنهم

بأنهما

بأني

بأواخر

بأولئك

بأولاء

بأولائك

بأولائكم

بأولائكما

بأولائكن

بأى

بأي

بأياً

بأية

بأيها

بأيهم

بأيهما

بأيهن

بإحدى

بإذا

بإلا

بإياك

بإياكم

بإياكما

بإياكن

بإياه

بإياها

بإياهم

بإياهما

بإياهن

بإياى

ببضع

ببضعة

ببعض

ببعضها

ببعضهم

بتلك

بحيث

بدلا

بدون

بدوننا

بدونه

بدونها

بدونهم

بدونهما

بدونهن

بذا

بذاك

بذلك

بذو

بذي

برغم

بسبب

بسوى

بشأن

بشكل

بشيء

بشيئاً

بشيئان

بشيئين

بصورة

بضع

بضعة

بعد

بعدئذ

بعدة

بعدم

بعدها

بعض

 

بعضا

بعضها

بعضهم

بغض

بغير

بغيرك

بغيركم

بغيركما

بغيركن

بغيرنا

بغيره

بغيرها

بغيرهم

بغيرهما

بغيرهن

بغيري

بك

بكافة

بكل

بكم

بكما

بكن

بكيف

بل

بلا

بلى

بما

بماذا

بمتى

بمزيد

بمزيداً

بمفرده

بمن

بن

بنا

بنحو

بنسبة

به

بهؤلاء

بها

بهاتان

بهاتين

بهذا

بهذان

بهذه

بهذي

بهذين

بهل

بهم

بهما

بهن

بين

بينك

بينكم

بينكما

بينكن

بينما

بيننا

بينه

بينها

بينهم

بينهما

بينهن

بيني

تحته

تقريبا

تقريباً

تقول

تكن

تكون

تكونوا

تلك

تلكم

تلكما

تماما

ثم

ثمة

جدا

جداً

جيدا

حاشا

حالما

حاليا

حالياً

حتما

حتى

حسب

حوالي

حول

حولك

حولكم

حولكن

حولنا

حوله

حولها

حولهم

حولهما

حولهن

حولي

حيث

حيثما

حين

حينئذ

حيناً

حينذاك

حينما

حينه

حينها

خارجاً

خاصا

خاصة

خصوصاً

خصيصا

خلا

خلال

خلاله

خلف

خلفك

خلفكم

خلفكما

خلفكن

خلفنا

خلفه

خلفها

خلفهم

خلفهما

خلفهن

خلفي

دائما

دائماً

داخلاً

دون

دونك

دونكم

دونكما

دوننا

دونه

دونها

دونهم

دونهما

دونهن

ذا

ذات

ذاتك

ذاتكما

ذاته

ذاتها

ذاتهم

ذاتهما

ذاتهن

ذاك

ذلك

ذلكم

ذلكما

ذو

ذي

ربما

رغم

رغماً

رقم

سواء

سواءاً

سوف

سوى

شانه

شأنه

شتى

شيء

شيئا

شيئاً

شيئان

شيئين

ضدك

ضدكم

ضدكما

ضدكن

ضدنا

ضده

ضدها

ضدهم

ضدهما

ضدهن

ضدي

ضدين

ضرورة

ضروري

ضرورياً

ضمن

طالما

طويل

طويلاً

طويلة

طويله

ظل

عام

عامة

عبر

عدا

عدة

عدم

عدمه

عديدة

عسى

على

علي

عليّ

عليك

عليكم

عليكما

عليكن

علينا

عليه

عليها

عليهم

عليهما

عليهن

عما

عن

عنّا

عند

عندئذ

عندك

عندكم

عندكما

عندما

عنده

عندها

عندهم

عندهما

عندهن

عنك

عنكم

عنكما

عنم

عنه

عنها

عنهم

عنهما

عنهن

عني

غير

غيرك

غيركم

غيركما

غيركن

غيرنا

غيره

غيرها

غيرهم

غيرهما

غيرهن

غيري

فاذ

فاذا

فاكثر

فالآن

فالأن

فالتي

فالذي

فالذين

فالغير

فالقول

فاللاتي

فاللتان

فاللتين

فاللذان

فاللذين

فاللواتي

فان

فانك

فاننا

فانه

فانها

فانهم

فاولئك

فأحد

فأقل

فأكثر

فألا

فأما

فأن

فأنا

فأنت

فأنتم

فأنتما

فأنتن

فأنه

فأنهم

فأنى

فأولئك

فأولاء

فأولائك

فأولائكم

فأولائكما

فأولائكن

فأى

فأيان

فأين

فأينما

فإذ

فإذا

فإلا

فإلى

فإلي

فإليك

فإليكم

فإليكما

فإليكن

فإلينا

فإليه

فإليها

فإليهم

فإليهما

فإليهن

فإما

فإن

فإنا

فإنك

فإنكم

فإنكما

فإننا

فإنه

فإنها

فإنهم

فإنهما

فإني

فإياك

فإياكم

فإياكما

فإياكن

فإياه

فإياها

فإياهم

فإياهما

فإياهن

فإياى

فبئس

فبالتي

فبالذي

فبالذين

فبالغير

فبالقول

فباللاتي

فباللتان

فباللتين

فباللذان

فباللذين

فباللواتي

فبالنسبة

فباولئك

فبألا

فبأولئك

فبتلك

فبحيث

فبذا

فبذاك

فبذلك

فبذي

فبعد

فبعدة

فبك

فبكل

فبكم

فبكما

فبكن

فبما

فبماذا

فبنا

فبنسبة

فبهؤلاء

فبها

فبهاتان

فبهاتين

فبهذا

فبهذان

فبهذه

فبهذين

فبهم

فبهما

فبهن

فبين

فبينك

فبينكم

فبينكما

فبينكن

فبينما

فبيننا

فبينه

فبينها

فبينهم

فبينهما

فبينهن

فبيني

فتحت

فتلك

فثم

فجأة

فجأةًً

فحاشا

فحيث

فحيثما

فحين

فحينئذ

فحيناً

فحينذاك

فحينما

فحينه

فحينها

فخلا

فخلال

فدائماً

فذا

فذاك

فذلك

فذو

فذي

فسواء

فسواءاً

فسوف

فسوى

فطالما

فعدا

فعدة

فعدم

فعلا

فعلى

فعليّ

فعليك

فعليكم

فعليكما

فعليكن

فعلينا

فعليه

فعليها

فعليهم

فعليهما

فعليهن

فعن

فعنّا

فعند

فعندئذ

فعندك

فعندكم

فعندكما

فعندما

فعنده

فعندها

فعندهم

فعندهما

فعندهن

فعنك

فعنكم

فعنكما

فعنه

فعنها

فعنهم

فعنهما

فعنهن

فعني

فغير

فغيرك

فغيركم

فغيركما

فغيركن

فغيرنا

فغيره

فغيرها

فغيرهم

فغيرهما

فغيرهن

فغيري

ففوق

ففوقك

ففوقكم

ففوقكما

ففوقكن

ففوقنا

ففوقه

ففوقها

ففوقهم

ففوقهما

ففوقهن

ففي

ففيك

ففيكم

ففيكن

ففيما

ففينا

ففيه

ففيها

ففيهم

ففيهما

ففيهن

فقبل

فقد

فقديماً

فقط

فقلت

فقول

فكالتي

فكالذي

فكالذين

فكالقول

فكاللاتي

فكاللتان

فكاللتين

فكاللذان

فكاللذين

فكاللواتي

فكأن

فكأنك

فكأنه

فكأنهم

فكأنهما

فكأنهن

فكثير

فكثيراً

فكذلك

فكل

فكلا

فكلانا

فكلاهما

فكلتا

فكلكم

فكلنا

فكله

فكلها

فكلهم

فكلهن

فكلينا

فكليهما

فكم

فكما

فكي

فكيف

فكيلا

فلا

فلأحد

فلأنه

فلأولئك

فلإحدى

فلإنه

فلبئس

فلتلك

فلدى

فلدي

فلديك

فلديكم

فلديكما

فلدينا

فلديه

فلديها

فلديهم

فلديهما

فلديهن

فلذا

فلذاك

فلذلك

فلذي

فلست

فلستم

فلستما

فلستن

فلسن

فلسوف

فلعدم

فلعل

فلقد

فلك

فلكل

فلكلا

فلكلتا

فلكم

فلكما

فلكن

فلكنك

فلكنه

فلكنهم

فلكنهما

فلكنهن

فلكي

فلكيلا

فلم

فلما

فلماذا

فلمذا

فلن

فلنا

فله

فلهؤلاء

فلها

فلهاتان

فلهاتين

فلهتان

فلهتين

فلهذا

فلهذان

فلهذه

فلهذين

فلهم

فلهما

فلهن

فلو

فلولا

فلولاك

فلولاكم

فلولاكما

فلولاكن

فلولانا

فلولاه

فلولاها

فلولاهم

فلولاهما

فلولاهن

فلولاى

فليس

فليست

فليسوا

فما

فماذا

فماعدا

فمتى

فمثل

فمثلاً

فمثلما

فمدام

فمدة

فمع

فمعاً

فمعك

فمعكم

فمعكما

فمعكن

فمعنا

فمعه

فمعها

فمعهم

فمعهما

فمعهن

فمعي

فمما

فمن

فمنا

فمنذ

فمنك

فمنكم

فمنكما

فمنكن

فمننا

فمنه

فمنها

فمنهم

فمنهما

فمنهن

فمني

فمهما

فنحن

فهؤلاء

فهاتان

فهاتين

فهأنت

فهأنتم

فهأنذا

فهتان

فهتين

فهذا

فهذان

فهذه

فهذي

فهذين

فهل

فهم

فهما

فهن

فهنا

فهناك

فهو

فهي

فوق

فوقك

فوقكم

فوقكما

فوقكن

فوقنا

فوقه

فوقها

فوقهم

فوقهما

فوقهن

فى

في

فيك

فيكم

فيما

فينا

فيه

فيها

فيهم

فيهما

فيهن

فيومئذ

قبل

قبله

قبلها

قد

قديماً

قريبا

كافة

كافياً

كالأن

كالتي

كالذي

كالذين

كالقول

كاللاتي

كاللتان

كاللتين

كاللذان

كاللذين

كاللواتي

كان

كانا

كانت

كانتا

كانوا

كأحد

كأن

كأنك

كأنكم

كأننا

كأنه

كأنها

كأنهم

كأنهما

كأنهن

كأني

كأولاء

كأولائك

كأولائكم

كأولائكما

كأولائكن

كأى

كإحدى

كإياك

كإياكم

كإياكما

كإياكن

كإياه

كإياها

كإياهم

كإياهما

كإياهن

كإياى

كبيرا

كتلك

كثير

كثيرا

كثيراً

كذا

كذاك

كذلك

كذو

كسوى

كغير

ككل

كل

كلا

كلانا

كلاهما

كلتا

كلكم

كلما

كلنا

كله

كلها

كلهم

كلهن

كلينا

كليهما

كم

كما

كماذا

كمن

كن

كنا

كنت

كنتم

كنتما

كهؤلاء

كهاتين

كهذا

كهذه

كهذي

كهذين

كونه

كونها

كونوا

كي

كيف

كيلا

لئلا

لا

لابد

لان

لانه

لانها

لانهم

لاولئك

لاي

لآخر

لأحد

لأمام

لأمامك

لأمامكم

لأمامكما

لأمامكن

لأمامنا

لأمامه

لأمامها

لأمامهم

لأمامهما

لأمامهن

لأمامي

لأن

لأنا

لأنك

لأنكم

لأنكما

لأنكن

لأننا

لأنني

لأنه

لأنها

لأنهم

لأنهما

لأني

لأواخر

لأولئك

لأولاء

لأولائك

لأولائكم

لأولائكما

لأولائكن

لأى

لأي

لأياً

لأية

لأيها

لأيهم

لأيهما

لأيهن

لإحدى

لإياك

لإياكم

لإياكما

لإياكن

لإياه

لإياها

لإياهم

لإياهما

لإياهن

لإياى

لبئس

لبعض

لتلك

لدى

لدي

لديك

لديكم

لديكما

لدينا

لديه

لديها

لديهم

لديهما

لديهن

لذا

لذاك

لذلك

لذو

لذي

لست

لستم

لستما

لستن

لسن

لسوف

لسوى

لعدم

لعل

لغه

لغير

لقد

لك

لكل

لكلا

لكلتا

لكم

لكما

لكن

لكنك

لكننا

لكنه

لكنها

لكنهم

لكنهما

لكنهن

لكني

لكي

لكيلا

للأمام

للأمر

للتي

للذي

للذين

للغاية

لللاتي

لللتان

لللتين

لللذان

لللذين

لللواتي

للمزيد

لم

لما

لماذا

لمدة

لمذا

لمزيد

لمزيداً

لمن

لن

لنا

له

لهؤلاء

لها

لهاتان

لهاتين

لهتان

لهتين

لهذا

لهذان

لهذه

لهذي

لهذين

لهم

لهما

لهن

لو

لولا

لولاك

لولاكم

لولاكما

لولاكن

لولانا

لولاه

لولاها

لولاهم

لولاهما

لولاهن

لولاى

لي

ليس

ليست

ليسوا

ليكون

مؤكداً

ما

مادام

ماذا

مازال

مازالت

ماعدا

ماهو

متى

مثل

مثلا

مثلاً

مثلما

مثله

مثلها

مثلهم

مدة

مدى

مرة

مزيد

مزيداً

مطلقاً

مع

معا

معاً

معظم

معك

معكم

معكما

معكن

معنا

معه

معها

معهم

معهما

معهن

معي

مم

مما

ممكن

ممكناً

ممن

من

منا

منذ

منك

منكم

منكما

منكن

مننا

منه

منها

منهم

منهما

منهن

مني

مهما

نحن

نظرا

نعم

هؤلاء

هاتان

هاتين

هاذين

هامة

هأنت

هأنتم

هأنذا

هذا

هذان

هذه

هذي

هذين

هكذا

هل

هم

هما

هن

هنا

هناك

هنالك

هو

هي

وراء

وراءه

ورائك

ورائكم

ورائكما

ورائكن

ورائهم

ورائهما

ورائهن

يا

يبدو

يكن

يكون

يكونوا

يلي

يمكن

يمكنه

يومئذ

==========================

B. Corpus-Based Stop list:

ابر

ابو

اجتماع

اجل

احد

اخرى

اذا

ارا

اربعة

اط

اطار

اطلاق

اعادة

اعلن

اغو

اف

افب

اكثر

اكد

الا

الاتفاق

الاثنين

الاحد

الاخيرة

الاراضي

الاربعاء

الاسبوع

الان

الانباء

الاول

الاولى

التعاون

التى

التي

الثانية

الثلاثاء

الجمعة

الجيش

الحالي

الحدود

الحزب

الحكم

الخميس

الدولة

الدولية

الذى

الذي

الذين

السابق

الساعة

السبت

السلطات

السلطة

الشرطة

العاصمة

العسكرية

العمل

الف

القدم

اللجنة

الماضي

المباراة

المتحدث

المجلس

المجموعة

المرحلة

المصدر

المقبل

المقرر

الملك

النار

النهائي

الوزراء

الوضع

الوقت

الى

اليوم

اما

امام

امس

ان

انه

انها

او

اوك

اول

اي

ايار

ايام

ايضا

أن

باسم

بان

برس

بسبب

بشكل

بطولة

بعد

بعض

بن

به

بها

بيان

بين

تشرين

تم

ثلاثة

ثم

جمت

جميع

جنوب

جهة

حال

حاليا

حتى

حزيران

حول

حيث

حين

خلال

دورة

دولار

دولة

دون

ديس

ديسك

ذكرت

ذلك

رئيس

زيارة

سبت

سنوات

شخصا

شرق

صباح

صحيفة

صفر

ضمن

عام

عاما

عبد

عبر

عدة

عدد

عدم

عشر

عشرة

على

علي

عليه

عليها

عمان

عن

عند

عندما

غدا

غير

فان

فبر

فرانس

فسب

فى

في

فيه

فيها

قال

قبر

قبرص

قبل

قد

قدم

قرار

قمة

قوات

كان

كانت

كانون

كأس

كبير

كرة

كل

كما

لا

لدى

لقاء

لكرة

لكن

للامم

لم

لن

له

لها

لوكالة

مؤتمر

ما

مار

ماي

مايو

مباراة

مجموعة

مدينة

مساء

مصادر

مصدر

مع

مليون

من

منذ

منها

موا

موسع

نحو

نفسه

نقطة

نهاية

نوف

هان

هذا

هذه

هناك

هو

هي

وح

وزارة

وزير

وكالة

يتبع

يجب

يذكر

يكون

يمكن

ينا

يول

يون

يونيو