Welcome
user_choices_background_image
Welcome
login container bottom
Search Libraries Catalogue
Duplicate Items
Add to My List

Print
Sorts and Limits


Title: Collecting and mining fake news data about Covid-19 pandemic from by incorporating machine learning / by Mustafa Nazar Younus Al-Obaidi ; supervised by Dr. Reem Ali Mohammed Al Fayez, Dr. Bilal Ahmed Abd Rahman Abu Salih. جمع وتنقيب البيانات عن الأخبار الكاذبة حول جائحة كورونا من موقع تويتر من خلال توظيف التعلم الآلي
جمع وتنقيب البيانات عن الأخبار الكاذبة حول جائحة كورونا من موقع تويتر من خلال توظيف التعلم الآلي جمع وتنقيب البيانات عن الأخبار الكاذبة حول جائحة كورونا من موقع تويتر من خلال توظيف التعلم الآلي
Twitter جمع وتنقيب البيانات عن الأخبار الكاذبة حول جائحة كورونا من موقع تويتر من خلال توظيف التعلم الآلي

Author: Al-Obaidi , Mustafa Nazar Younus, author.
Al Fayez, Reem Ali Mohammed, supervisor.
Abu Salih, Bilal Ahmed Abd Rahman, co-supervisor.
The University of Jordan (Amman, Jordan). King Abdullah II School of Information Technology. Department of Computer Information Systems .

General Notes: Thesis (M. Sc. in Computer Information Systems)--The University of Jordan (Amman, Jordan), King Abdullah II School of Information Technology, Department of Computer Information Systems , 2022.
Includes bibliographical references and index.
Since the Corona Virus Disease (COVID-19) health emergency was declared, many are the fake news that have circulated around this topic, including rumours, conspiracy theories and myths. Fake news is one of the threats in today's societies, since this type of information circulates fast and is often inaccurate and misleading. Moreover, fake-news are far more shared than evidence-based news among social media users and thus, this can potentially lead to decisions that do not consider the individual’s best interest. One of the most effective ways for sharing information is via Online Social Networks (OSNs) like Twitter. At the same time, these networks have become an easily accessible environment for transmitting fake or misleading information, especially about the current COVID-19 pandemic. The fact-checking and detecting of misinformation about any news related to COVID-19 has become more important than ever due to what can be defined as an "infodemic". Therefore, this thesis proposes detecting fake or misleading COVID-19 news in English on the Twitter platform through the analysis of textual features, user features, emotions, and sentiment features in different classification models to classify the news. Several experiments were conducted to improve the model's accuracy by fine-tuning its hyperparameters and feature selection strategy by recursive feature elimination. The experimental results obtained in this thesis showed that the Decision Tree, and Random Forest classifiers outperform other algorithms. The evaluation results for DT, RF, SVM, and KNN classifications models found to be (0.98 %, 0.96%, 0.94% and 0.91%) of the F1 score metric, respectively. The evaluation result for the decision tree classifier model by using F1-Score was 98%, which is higher than the results of the methods applied to the same dataset in the literature.
منذ الإعلان عن حالة الطوارئ الصحية لمرض فيروس كورونا (COVID-19) ، أصبحت الكثير من الأخبار الكاذبة التي تم تداولها حول هذا الموضوع ، بما في ذلك الشائعات ونظريات المؤامرة والأساطير. تعد الأخبار الكاذبة من التهديدات في مجتمعات اليوم ، لأن هذا النوع من المعلومات ينتشر بسرعة وغالبًا ما يكون غير دقيق ومضلل. علاوة على ذلك ، يتم مشاركة الأخبار المزيفة بشكل أكبر بكثير من الأخبار القائمة على الأدلة بين مستخدمي وسائل التواصل الاجتماعي ، وبالتالي ، من المحتمل أن يؤدي ذلك إلى قرارات لا تراعي المصلحة الفضلى للفرد. إحدى أكثر الطرق فعالية لمشاركة المعلومات هي عبر الشبكات الاجتماعية على الإنترنت (OSN) مثل Twitter. في الوقت نفسه ، أصبحت هذه الشبكات بيئة يسهل الوصول إليها لنقل معلومات مزيفة أو مضللة ، لا سيما حول جائحة COVID-19 الحالي. أصبح التحقق من الحقائق والكشف عن المعلومات الخاطئة حول أي أخبار متعلقة بـ COVID-19 أكثر أهمية من أي وقت مضى بسبب ما يمكن تعريفه على أنه "وباء معلومات". لذلك ، تقترح هذه الرسالة الكشف عن أخبار COVID-19 المزيفة أو المضللة باللغة الإنجليزية على منصة Twitter من خلال تحليل الميزات النصية وميزات المستخدم والعواطف وميزات المشاعر في نماذج التصنيف المختلفة لتصنيف الأخبار. تم إجراء العديد من التجارب لتحسين دقة النموذج من خلال ضبط المعلمات الفائقة واستراتيجية اختيار الميزة عن طريق recursive feature elimination. أظهرت النتائج التجريبية التي تم الحصول عليها في هذه الرسالة أن مصنفات Decision Tree و Random Forestتفوقوا في الأداء على الخوارزميات الأخرى. تم العثور على نتائج التقييم لنماذج تصنيفات DT و RF و SVM و KNN لتكون (0.98٪ ، 0.96٪ ، 0.94٪ و 0.91٪) من مقياس درجة F1 ، على التوالي. كانت نتيجة التقييم لنموذج مصنف Decision Tree باستخدام درجة F1 98٪ ، وهي نسبة أعلى من نتائج الأساليب المطبقة على نفس مجموعة البيانات في الأدبيات.
The electronic version is available in theses database \\ University of Jordan.
Includes abstracts in Arabic and English.

Subject: Management information systems
Information technology.
Machine learning
COVID-19 (Disease) -- Social aspects
Online social networks
Twitter

Dissertation Note: Thesis (M. Sc. in Computer Information Systems)--The University of Jordan (Amman, Jordan), King Abdullah II School of Information Technology, Department of Computer Information Systems , 2022.
Physical Description: CD-ROM1 : PDF.
Publication Date: 2022.

Results 1 - 1 of 1
  Agency: Collection: Call No.: Item Type: Status: Copy: Barcode: Media Type:
Theses & Disertations Thesis 658.4038 O12 No Circulation Available 1 JUF0845578 Compact Disc Read-only Memory