بازنمایی دانش یک شاخه از هوش مصنوعی است که عبارت است از تبیین و کدگذاری اطلاعات مرتبط با همه مفاهیم و موجودیتهای جهان پیرامون و همچنین روابط میان آنها، به نحوی که ماشین قادر به استفاده از آنها در حل مسائل پیچیده باشد. حقیقت آن است که پیش از انتظار انجام هوشمندانه وظایف مختلف از هر عاملی، بایستی دانش مربوط به آن حوزه و همه مفاهیمی که ماشین با آنها سروکار خواهد داشت، برای ماشین بازنمایی شود. انتظار رفتار هوشمندانه از ماشین بدون تبیین دانش مرتبط با آن حوزه برای آن، به انتظار انجام رفتار هوشمندانه و مناسب از شخصی در انجام یک وظیفه معین میماند، که هیچ دانشی در رابطه با آن ندارد. از اینرو، برای دستیابی به رفتار هوشمندانه توسط هر عاملی (انسانی یا ماشینی)، پیش از هر کاری نیازمند بازنمایی دانش مرتبط با آن هستیم به نحوی که توصیف جامعی از هر یک از مفاهیم و موجودیتهای مرتبط با آن، و همچنین ارتباطات معنایی میان آنها صورت پذیرد. این بازنمایی در ادامه مبنای شناخت عامل از مفاهیم و به طور کلی دنیای پیرامون برای ماشین شده و این شناخت، زیربنای رفتار هوشمندانه او را شکل میدهد. در رساله جاری به منظور تبیین دنیای پیرامون برای ماشین، شامل توصیف جامع همه مفاهیم و همچنین روابط مختلف حاکم میان آنها، یک رویکرد جامع بازنمایی دانش پیشنهاد شده است که اهداف مختلفی را دنبال میکند، ازجمله توصیف کامل و مشروح هر مفهوم و موجودیت برای ماشین (شامل توصیفات زبانی-متنی-، تصویری، صوتی، و ویدئویی)، مدلسازی روابط معنایی حاکم میان مفاهیم موجود، ایجاد امکان استدلال و استنتاج روی دانش موجود و دستیابی به دانش جدید، تشریح و توصیف همزمان تک تک مفاهیم (مفردات) و انواع در یک بازنمایی، تمهید انعطاف پذیری در بازنمایی حاصله به منظور سهولت در حذف، درج و ویرایش توصیفات مختلف، و دستیابی به یک بازنمایی با امکان محاسبهپذیری بالا برای ماشین. در عین حال همه این توانمندیها بایستی به نحوی برای ماشین کدگذاری شود که از قابلیت خوانش خوبی برخوردار باشد. برای این منظور رویکرد بازنمایی دانش پیشنهادی در این رساله، در دو فاز مجزا با انجام فعالیتهای مختلف در جهت نیل به اهداف خود پیش میرود. فاز نخست این بازنمایی به انجام فعالیتهای پیشپردازشی مرسوم اختصاص دارد که طی آن متون ورودی برای انجام محاسبات اصلی، برای ماشین قابل هضم میشود. در فاز دوم از این رویکرد که به بازنمایی دانش اختصاص دارد، ابتدا در گام نخست برای همه مفاهیم و موجودیتهای استخراج شده از متون ورودی در فاز اول، پرسوجوهایی با پایگاه دانش DBpedia صورت گرفته و از این طریق اطلاعات مرتبط با هر مفهوم، از این پایگاه دانش استخراج شده و در قالب یک "گراف دانش`` در کنار هم قرار میگیرد. یک گراف دانش یک مدل قابل خوانش توسط ماشین است که در بردارنده دانش مرتبط با هر یک از مفاهیم بوده و همچنین روابط معنایی میان آنها را نیز ترسیم میکند. پس از آن در گام دوم از این فاز، رویکرد پیشنهادی با هدف غنیسازی بازنمایی و استغنای آن با برخی از ابعاد مغفول در رابطه با هریک از مفاهیم، سه مرحله غنیسازی روی بازنمایی ایجاد شده اعمال میکند، شامل غنیسازی مبتنی بر هستیشناسی (که برای این منظور از هستیشناسی Dbpedia استفاده شده است)، غنیسازی مبتنی بر واژگان شدت احساسات NRC، و غنیسازی مبتنی بر پایگاهداده روانشناسی زبان MRC. در این مرحله بازنمایی جامعی از مفاهیــم دنیای پیرامون در اختیار ماشین است. لازم به تاکید است که همه این بازنماییها در قالب استاندارد RDF برای ماشین، کدگذاری شده است. در ادامه این فاز، برای محاسبهپذیرتر کردن این بازنمایی برای ماشین، گراف دانش نهایی تعبیه شده و به یک فضای برداری نگاشت میشود. ماتریس تعبیه حاصل از این بازنمایی در کنار گراف دانش نهایی، اکنون قابلیت استفاده در وظایف مختلف توسط ماشین را داراست.در ادامه برای ارزیابی رویکرد پیشنهادی بازنمایی دانش، از آنجا که امکان ارزیابی مستقیم یک بازنمایی فراهم نیست، از این بازنمایی در انجام یک وظیفه استفاده شده است. برای این منظور وظیفه تشخیص شخصیت خودکار افراد از روی متون انتخاب شده است. از اینرو، در این رساله سیستمهای متعدد تشخیص شخصیت پیشنهاد شد که اساس عملکردی هر یک از آنها، بازنماییهای حاصل از رویکرد پیشنهادی بود. برخی از این سیستمها عامدانه صرفاً با اتکا بر مدلهای مبنای یادگیری ماشین شامل CNN، RNN، LSTM، و BiLSTM با هدف تأثیرپذیری کمینه از تواناییهای ذاتی مدلها و همچنین تأثیرپذیری بیشینه از بازنمایی حاصله از رویکرد پیشنهادی، اقدام به پیشبینی شخصیت نمودهاند. مقایسه نتایج ارزیابی این سیستمهای تشخیص خودکار شخصیت که اساساً مبتنی بر رویکرد بازنمایی دانش پیشنهادی هستند، با دیگر مدلهای مبنا (که مبتنی بر رویکردهای متفاوت هستند)، حکایت از توانایی قابل توجه رویکرد بازنمایی دانش پیشنهادی دارد. در عین حال در این رساله با اتکا بر همین بازنمایی دانش و با هدف استفاده بهینهتر از بازنمایی دانش پیشنهادی، از مدلهای پیچیدهتری برای این منظور استفاده شده است. نتایج ارزیابی این روشها که از مکانیزم توجه روی گراف دانش برای پیشبینیها استفاده کردهاند، بهبود قابل توجهی نسبت به روشهای ابتدایی پیشنهادی تشخیص شخصیت داشته است که این امر شاهد دیگری بر شایستگیهای روش بازنمایی دانش پیشنهادی است. در این رساله برای انجام تشخیص خودکار شخصیت، از مدل شخصیتی Big Five و همچنین مجموعهداده Essays استفاده شده است.
Knowledge Representation (KR) is a field of artificial intelligence dedicated to encoding and representing the information about the world’s concepts and the semantic relations among them in a form that a computer system can use to solve complex tasks. Indeed, before anticipating intelligent behaviours from an agent, it should be supported by the knowledge of the current task. Expecting intelligent behaviours from a machine without the representation of related knowledge looks like anticipating intelligent behaviours from someone in a specific task who does not know anything about it. Hence, to achieve intelligent behaviours by an agent at first, we should represent the knowledge of the task in a way that a descriptive explanation of each concept, along with the semantic relations among them, clearly model the reality for the agent (both for human and machine). This representation would form the agent’s cognition about the concepts and the world, concluding intelligent behaviours.In this dissertation, to represent the knowledge of the world for the machine, which clearly describes the concepts and entails the semantic relations among them, a comprehensive knowledge representation approach is proposed, which follows some principal objectives. Including providing a descriptive and clear explanation about the concepts and entities of the world (through text, image, sound and video), modelling the semantic relations among concepts, allowing reasoning over the current knowledge and achieving new ones, entailing descriptions about individuals and types simultaneously, supporting flexibility, and providing efficient computability. Meanwhile, the representation should be encoded to be highly machine-readable and consistently meet the objectives. Accordingly, the proposed knowledge representation approach is made up of two main phases. The first phase is dedicated to the pre-processing activities, which makes the input texts more digestible for the machine. In the next phase, querying all the extracted concepts and entities in DBpedia, the related knowledge about each is extracted in the form of a “knowledge graph”. A knowledge graph is a graph-based data model that formally represents the semantics of the existing concepts in the input text and models the knowledge behind them. It provides a machine-readable cognitive understanding of concepts and semantic relationships among them. Then to enrich the acquired representation, we have applied three enrichments, namely ontology-based enrichment (that provides the entailments of types descriptions), NRC properties enrichment, and MRC properties enrichment. Each of which covers some neglected information about the concepts. Now, a comprehensive representation is available for the machine. It is important to note that all representations are encoded using the Resource Description Framework (RDF) standard. Finally, to enhance the computability of the acquired representation by the machine, the knowledge graph is embedded and mapped to a real-valued space. At last, the resulting embedding matrix, along with the knowledge graph as a comprehensive knowledge representation, are ready to be used in different tasks. Since it is impossible to evaluate the resulting representations directly, we had to apply them to a specific task to appraise and assess the proposed knowledge representation approach. To do so, we used them in the task of text-based automatic personality prediction. Accordingly, several automatic personality prediction systems were proposed to predict the individuals’ personalities, each of which entirely relies on the proposed knowledge representation approach. Specifically, to perform personality predictions at first, four deep learning models which are based on convolutional neural network (CNN), simple recurrent neural network (RNN), long short-term memory (LSTM), and bidirectional long short-term memory (BiLSTM) were suggested. The basic models were intentionally used to decrease the potential abilities of the classifiers and increase the effect of the proposed knowledge representations. Comparing the evaluation results of the proposed method by baseline models confirms that the suggested prediction methods were so accurate, despite their simplicity. It indicates that the proposed knowledge representation approach successfully models the concepts for the machine. Meanwhile, some personality prediction systems were also suggested, which were based on complex classifiers. They used the attention mechanism over the knowledge graph to recognize the most significant parts of the graph. The results demonstrate considerable enhancements in prediction accuracies, which is another fact indicating the capabilities of the proposed knowledge representation task. In all of the investigations relating to personality prediction, we have used the Big Five personality model and the Essays dataset.
A Comprehensive Knowledge Representation Approach for Machine