ترجمه مقالهSentiFars): A Persian Polarity Lexicon for Sentiment Analysis SentiFars: واژه نامه قطبی فارسی برای تجزیه و تحلیل احساسات)

مقاله با عنوان SentiFars: واژه نامه قطبی فارسی برای تجزیه و تحلیل احساسات را از اینجا دانلود کنید.

پشتیبانی: دارد. در صورت هرگونه مشکل با شماره 09367938018 در واتس اپ یا تلگرام و یا جهت سفارش ترجمه مقاله با پشتیبانی به شماره 09191732587 در واتس اپ یا تلگرام تماس حاصل فرمایید.

کیفیت محصول: عالی

قیمت: 15000 تومان

ژورنال: elsevier

سال مقاله: 2019

جهت سفارش ترجمه با کم ترین قیمت موجود در کشور به واتساپ و تلگرام به شماره ی 09191732587 مراجعه کنید.

چکیده

در مفید بودن افکار عمومی نسبت به موضوعات مختلف در شبکه های اجتماعی و شبکه جهانی جهانی شکی نیست. استخراج احساس مردم درمورد یک موضوع از متن کار ساده ای نیست. واژه نامه های قطبیت که برچسب یا نمره قطبی را به کلمات و عبارات اختصاص می دهند ، در سیستم های تجزیه و تحلیل احساسات نقش مهمی دارند. از آنجا که انگلیسی غنی ترین زبان در این زمینه است ، بهره مندی از منابع موجود انگلیسی برای ایجاد منابع جدید ، محققان زیادی را در سال های اخیر به خود جلب کرده است. در این مقاله ، ما یک روش مبتنی بر ترجمه جدید برای ایجاد منابع قطبیت در زبانهای کم منبع مانند فارسی پیشنهاد می دهیم. نتایج ارزیابی تجربی رویکرد پیشنهادی تأثیر آن را تأیید می کند. منبع تولید شده بزرگترین واژه نامه قطبیت در دسترس برای فارسی است.

مقدمه

استخراج اطلاعات وظیفه استخراج اطلاعات از مقدار زیادی داده است. این اطلاعات ممکن است از نظر مردم باشد و داده ها در قالب متن باشد. تجزیه و تحلیل احساسات – نوعی استخراج اطلاعات – استخراج احساسات یا عقاید نسبت به مسئله ای از داده ها است. این داده ها معمولاً به صورت متنی است و به هر زبان طبیعی قابل نوشتن است. این وظیفه در دهه های اخیر بسیار محبوب بوده است. رویکردهای مختلفی برای تجزیه و تحلیل احساسات داده های متنی وجود دارد. گروهی از رویکردها از تکنیک های یادگیری ماشین استفاده می کنند و گروه دیگر به روشهای مبتنی بر الگو تکیه می کنند. هر دو گروه ممکن است از واژه نامه های قطبیت استفاده کنند. از واژه نامه های قطبیت در تخمین قطبیت احساس یک قطعه از متن بر اساس قطبیت کلمات تشکیل دهنده آن از فرهنگ لغت استفاده می شود.

برخی از زبانهای طبیعی مانند انگلیسی دارای مجموعه ای غنی از منابع قطبیت هستند ، در حالی که زبانهای دیگر مانند فارسی از کمبود چنین منابع رنج می برند. برخی از رویکردها برای تولید فرهنگ لغت های قطبیت سعی در ساختن واژه نامه از ابتدا با استفاده از منابع زبان و پیکره [17] و [10] دارند ، در حالی که رویکردهای دیگر مانند کار فعلی و [9] از واژه نامه های موجود به انگلیسی بهره مند می شوند و آنها را به زبان های دیگرترجمه میکنند. مزیت گروه اول دقت آن است ، در حالی که آنها معمولاً از نظر زمان و تلاش انسانی گران هستند. از طرف دیگر ، رویکردهای گروه دوم معمولاً دقیقاً مانند رویکرد اول نیستند اما به اندازه گروه اول به تلاش نیاز ندارند.

روشهای مبتنی بر ترجمه قبلی معمولاً یک فرهنگ لغت قطبی را در زبان مبدا (انگلیسی) به زبان مقصد ترجمه می کنند. از آنجا که ممکن است فرهنگ لغت قطبیت انگلیسی اشتباهاتی داشته باشد ، بنابراین این ترجمه منجر به تولید یک فرهنگ لغت قطبی اشتباه می شود. در روش پیشنهادی ، همانطور که چندین واژه نامه ترجمه و ترکیب می شود ، خطاهای احتمالی در نمرات قطبیت یک فرهنگ لغت قطبیت (اختصاص یافته به یک اصطلاح) را می توان با امتیاز سایر واژگان برای همان اصطلاح جبران کرد. مشارکتهای این مقاله به شرح زیر است: 1) پیشنهاد یک روش مبتنی بر ترجمه برای ساخت واژه نامه های قطبیت برای زبانهای بدون منبع که ترکیبی از نمرات قطبیت چندین واژه نامه قطبیت موجود در انگلیسی است ، 2) ساخت اولین فرهنگ لغت قطبیت در فارسی که اختصاص می یابد سه نمره قطبیت (جمع بندی 1) برای هر ورودی و 2) پیشنهاد یک روش ترجمه مبتنی بر WordNet به منظور انتخاب مناسب ترین ترجمه برای هر اصطلاح.

Abstract

There is no doubt on the usefulness of public opinion towards different issues in social media and world wide web. Extracting the feeling of people about an issue from text is not straightforward. Polarity lexicons which assign polarity tags or scores to words and phrases play an important role in sentiment analysis systems. As English is the richest language in this area, getting benefit of existing English resources in order to build new ones have attracted many researchers in recent years. In this paper, we propose a new translation-based approach for building polarity resources in resource-lean languages such as Persian. The results of empirical evaluation of the proposed approach approve its effectiveness. The generated resource is the largest publicly available polarity lexicon for Persian.
INTRODUCTION
Information extraction is the task of extracting information from large amount of data. This information might be people’s opinion, and data might be in textual format. Sentiment analysis–a form of information extraction–is the task of extracting the sentiment or opinion towards an issue from data. This data is usually in textual format, and can be written in any natural language. This task has been very popular in recent decades. There exist several approaches to sentiment analysis of textual data. One group of approaches uses machine learning techniques and another group relies on pattern-based methods. Both groups might use polarity lexicons. Polarity lexicons are used in estimating the sentiment polarity of a piece of text based on the polarity of its constituent words obtained from the lexicon. Some natural languages such as English have a rich set of polarity resources, whereas other languages such as Persian suffer from the lack of such resources. Some approaches to generate polarity lexicons attempt to build a lexicon from the scratch using language resources and corpus [17] and [10], while other approaches such as the current work and [9] benefit from the existing lexicons in English and translate them to other languages. The advantage of first group is its accuracy, while they are usually expensive in terms of time and human effort. On the other hand, the second group of approaches are not usually as accurate as the first one but they do not need as
much effort as the first group do. In this paper, a new translation-based method which combines several polarity lexicons in source language (English), is used to generate a polarity lexicon in the destination language (Persian). Previous translation-based methods usually translate a polarity lexicon in source language (English) to the destination language. Because the English polarity lexicon may have errors, this translation would result in generating an erroneous polarity lexicon. In the proposed method, as several lexicons are translated and combined, potential errors in polarity scores of one polarity lexicon (assigned to a term) can be compensated by the scores of other lexicons for the same term. The contributions of this paper are as follows: 1) Proposing a translation-based method for building polarity lexicons for resource-lean languages which combines the polarity scores of several existing polarity lexicons in English, 2) Building the first polarity lexicon in Persian which assigns three polarity scores (summing up to 1) to each entry, and 2) Proposing a WordNet-based translation method in order to choose the most relevant translation to each term.

جدید ترین ها

جدید ترین محصولات ما

محصولات بیشتر
ترجمه مقاله A 0.45 V, Nano-Watt 0.033% Line Sensitivity MOSFET-Only Sub-Threshold Voltage Reference With no Amplifiers(حساسیت به خط 0.45 ولت ، نانو وات 0.033٪  مرجع ولتاژ زیر آستانه بدون تقویت کننده)

ترجمه مقاله A 0.45 V, Nano-Watt 0.033% Line Sensitivity MOSFET-Only Sub-Threshold Voltage Reference With...

15000 تومان

ترجمه مقاله A ± 3 ppm/◦C Single-Trim Switched Capacitor Bandgap Reference for Battery Monitoring Applications(3 m ppm / ◦C خازن سوئیچ تک اصلاح شده مرجع برای برنامه های نظارت بر باتری)

ترجمه مقاله A ± 3 ppm/◦C Single-Trim Switched Capacitor Bandgap Reference for Battery Monitoring...

15000 تومان

ترجمه مقالهSentiFars): A Persian Polarity Lexicon for Sentiment Analysis SentiFars: واژه نامه قطبی فارسی برای تجزیه و تحلیل احساسات)

ترجمه مقالهSentiFars): A Persian Polarity Lexicon for Sentiment Analysis SentiFars: واژه نامه قطبی فارسی...

15000 تومان

ترجمه مقاله (Internet of Things: A survey on machine learning-based intrusion detection approaches) (اینترنت اشیا: یک نظرسنجی در مورد رویکردهای تشخیص نفوذ مبتنی بر یادگیری ماشین )

ترجمه مقاله (Internet of Things: A survey on machine learning-based intrusion detection approaches) (اینترنت...

15000 تومان

ترجمه مقاله (Real‑time fleet management decision support system with security constraints) (سیستم پشتیبانی تصمیم گیری ناوگان در زمان واقعی با محدودیت های امنیتی)

ترجمه مقاله (Real‑time fleet management decision support system with security constraints) (سیستم پشتیبانی تصمیم...

15000 تومان

ترجمه مقاله با عنوان Ground surface settlements due to construction of closely-spaced twin tunnels with different geometric arrangements (تونل زنی و تکنولوژی زیر زمینی)

ترجمه مقاله با عنوان Ground surface settlements due to construction of closely-spaced twin tunnels...

10000 تومان

ترجمه مقاله (Green decoration materials selection under interior environment characteristics A grey-correlation based hybrid MCDM method) (انتخاب مواد دکوراسیون سبز تحت خصوصیات محیط داخلی: یک روش ترکیبی مبتنی بر همبستگی خاکستری )

ترجمه مقاله (Green decoration materials selection under interior environment characteristics A grey-correlation based hybrid...

15000 تومان

ترجمه مقاله (Country-level corruption and accounting choice Research & development capitalization under IFRS) (فساد در سطح کشور و انتخاب حسابداری: سرمایه تحقیق و توسعه تحت IFRS )

ترجمه مقاله (Country-level corruption and accounting choice Research & development capitalization under IFRS) (فساد...

15000 تومان

error: شما فقط اجازه مطالعه دارید
قیمت می خواهید؟ ما ارزانترین قیمت را ارائه می کنیم. کافیست فایل خود را یا از طریق منوی خدمات و سرویس ها => سفارش ترجمه ارسال کنید یا برای ما به آدرس research.moghimi@gmail.com ایمیل کنید یا در تلگرام و واتس آپ با شماره تلفن 09191732587 ارتباط بگیرید و ارزانترین قیمت ترجمه را از ما بخواهید
+