لارس اشتاینرت, تجزیه و تحلیل رسمی, کسب بودجه , تحقیق و بررسی , روش شناسی , نرم افزار , تجسم, نوشتن-پیش نویس اصلی * و کریستین هراف, مفهوم سازی , گزینش داده ها, تحقیق , روش شناسی , مدیریت پروژه, منابع, نظارت , اعتبار سنجی, نوشتن-نقد و بررسی & ویرایش
لارس اشتاینرت
لابراتوار سیستم های شناختی-دانشگاه برمن-برمن-المان
کریستین هراف
لابراتوار سیستم های شناختی-دانشگاه برمن-برمن-المان
این یک مقاله دسترسی باز است که تحت شرایط مجوز انتساب کریتیو کامنز توزیع شده است که اجازه استفاده بدون محدودیت و توزیع و تولید مثل در هر رسانه ای را می دهد به شرطی که نویسنده و منبع اصلی اعتبار داده شود.
داده های مرتبط
فایل اس 1: ترکیب شده.مجموعه داده سی اس وی شامل داده های بازار و تمام ویژگی های ورودی. مجموعه داده شامل 94663 نمونه است که نشان دهنده مجموعه تمرین و تست است. این شامل ستون های زیر است: مهر زمان پرس و جو ('زمان'), نام ارز رمزنگاری شده ('ارز رمزنگاری شده'), نرخ ('نرخ'), حجم معاملات ('حجم'), تعداد توییت ها ('تعداد توییت ها'), میانگین نمره مثبت ویدر ('مثبت'), میانگین نمره منفی ویدر ('منفی'), میانگین امتیاز ویدر مرکب ('مرکب') و میانگین امتیاز خنثی ویدر ('خنثی).
تمام داده های مربوطه در مقاله و فایل های اطلاعاتی پشتیبانی می شوند.
چکیده
ارزهای رمزنگاری شده اخیرا مورد توجه رسانه های زیادی قرار گرفته اند. به خصوص نوسانات زیاد قیمت چنین توجهی را به خود جلب کرده است. علوم رفتاری و ادبیات علمی مرتبط شواهدی را نشان می دهد که بین رسانه های اجتماعی و نوسانات قیمت ارزهای رمزنگاری شده رابطه نزدیک وجود دارد. این امر به ویژه به ارزهای کوچکتر اعمال می شود, که می تواند قابل ملاحظه ای توسط مراجع در توییتر تحت تاثیر قرار. اگرچه این به اصطلاح" الت کوین ها " اغلب حجم معاملات کمتری دارند اما گاهی اوقات توجه زیادی را در رسانه های اجتماعی جلب می کنند. در اینجا ما نشان می دهیم که نوسانات در کوین ها را می توان از رسانه های اجتماعی پیش بینی کرد. برای انجام این کار ما یک مجموعه داده حاوی قیمت و فعالیت رسانه های اجتماعی 181 الت کوین را در قالب 426520 توییت در یک بازه زمانی 71 روزه جمع کردیم. سپس خلق و خوی عمومی با استفاده از تجزیه و تحلیل احساسات تخمین زده شد. برای پیش بینی بازده الت کوین تجزیه و تحلیل رگرسیون خطی را بر اساس 45 روز داده انجام دادیم. ما نشان دادیم که بازده کوتاه مدت را می توان از طریق فعالیت و احساسات در توییتر پیش بینی کرد.
مقدمه
تا چند سال پیش, ارز رمزنگاری به سختی مورد توجه عمومی قرار. فقط تعداد کمی از مردم در مورد بیت کوین شنیده بود, اگر در همه. این امر با ظهور بازار کالاهای غیرقانونی جاده ابریشم و علاقه روزافزون مردم به اصطلاح "دارک نت"تغییر کرد. به نظر می رسید که ناگهان بیت کوین به عنوان ارز برای اهداف غیرقانونی درک شد. امروزه ارزهای رمزنگاری شده به طور فزاینده ای جایگاه خود را در هشیاری جامعه و مردم نشان می دهند. این امر با افزایش علاقه به تحقیق همراه است. بدین ترتیب, تعداد فزاینده ای از مطالعات تمرکز خود را بر روی بیت کوین و ارز رمزنگاری به طور کلی قرار داده اند. دو سوالی که بسیاری از این مطالعات مطرح می کنند عبارتند از: بازده ارزهای رمزنگاری شده چگونه تعیین می شود و می توان پیش بینی کرد? در مورد کالاهای سنتی شواهد منطقی وجود دارد که نشان می دهد بازده ارزهای رمزنگاری شده به نوعی با درک عمومی مرتبط است. ارزهای رمزپایه تمایل زیادی به فرار دارند که باعث می شود نسبت به عوامل خارجی حساس باشند. این گروه هایی را جذب می کند که سعی می کنند از این شرایط با استفاده از طرح های معمولی "پمپ و تخلیه" استفاده کنند [1]. در چنین طرحی ارزهای رمزپایه انتخاب شده در مقادیر کم و نامحسوس در بازه زمانی مشخص خریداری می شوند. در مجموع این خرید سپس اضافه کردن به مقدار قابل توجهی. در مرحله دوم, این ارز رمزنگاری هستند و سپس به شدت از طریق رسانه های اجتماعی ترویج, که منجر به خرید توسط اشخاص دیگر. افزایش قیمت مربوطه بازده بسیار بالایی را برای افرادی که طرح را شروع می کنند فراهم می کند. این امر به ویژه در مورد ارزهای رمزنگاری شده کوچکتر به اصطلاح "الت کوین"صدق می کند. کوین ها راحت تر تحت تاثیر قرار می گیرند و بنابراین در این مطالعه مورد توجه ویژه قرار می گیرند. اگر چه هیچ انطباق موجود در مورد اصطلاح "التکوین" در ادبیات علمی وجود دارد, ما با اکثر نویسندگان که طبقه بندی هر جایگزین برای بیت کوین به عنوان یک دگرساز دیدن همه موارد [2, 3]. عامل دیگری که ارتباط بین بازده ارزهای دیجیتال و رسانه های اجتماعی را نشان می دهد مبتنی بر نظریه های علوم رفتاری است. سیستم عامل های رسانه های اجتماعی مانند توییتر را می توان به عنوان یک شاخص جمعی از افکار و ایده ها و همچنین خلق و خوی عمومی در نظر گرفت [4]. حالات خلق مثبت منجر به خوش بینی بیشتر نسبت به تصمیمات سرمایه گذاری می شود [5]. بدین ترتیب, رسانه های اجتماعی ممکن است یک شاخص پیش بینی خوب برای سرمایه گذاری در ارز رمزنگاری, که وسعت در قیمت های خود را منعکس. در حالی که انواع اطلاعات رسانه های اجتماعی در دسترس است,
ما معتقدیم که به ویژه تنوع کوتاه مدت توییتر است که این پلتفرم را به یک شاخص بسیار مناسب برای پیش بینی های کوتاه مدت تبدیل می کند. علاوه بر این, بر خلاف خدمات مانند گوگل ترندز, توییتر صرفا اطلاعات در مورد فعالیت بلکه در مورد خلق و خوی مرتبط فراهم نمی کند. شکل 1 قیمت و فعالیت رسانه های اجتماعی را نشان می دهد که با تعداد توییت های پینکوین ارز رمزنگاری شده نشان داده می شود. در نگاه اول می توان به ارتباط مشکوک شد.
همبستگی متوسط پیرسون (ر = 0.438) بین قیمت پینکوین و تعداد توییت های ارجاع شده به ارز رمزنگاری شده قابل مشاهده است.
در محدوده این کار می خواستیم به این نشانه ها توجه بیشتری داشته باشیم. در بازه زمانی 71 روزه یک مجموعه داده با پوشش 181 الت کوین جمع کردیم. از نظر ادبیات علمی این یک دستاورد بی نظیر است. بر اساس این دادهها تحلیل رگرسیون خطی بهمنظور ایجاد مدلهای پیشبینی کوتاهمدت انجام شد. هدف از این مدل ها تجزیه و تحلیل امکان پیش بینی بازده الت کوین بر اساس فعالیت رسانه های اجتماعی بود. این فعالیت با تعداد توییت هایی که به یک الت کوین خاص اشاره داشتند و احساساتی که داشتند اندازه گیری شد. بنابراین ما این فرضیه را مطرح کردیم که می توان بازگشت یک الت کوین را بر اساس تعداد توییت های ارجاع شده و احساسات موجود در توییت های مذکور پیش بینی کرد. علاقه علمی به ارزهای دیجیتال نسبتا جدید است. با این حال, برخی از کار مرتبط در وجود وجود دارد. برخی از مقالات با کاربران بیت کوین مقابله [6-8], بیت کوین به طور کلی [2, 9-13] و یا پویایی بازار از ارز رمزنگاری [14-16]. مقالات کمتری رابطه بین قیمت ارزهای رمزنگاری شده یا بازده و فعالیت رسانه های اجتماعی را تجزیه و تحلیل کرده اند. در حالی که برخی از نویسندگان تجزیه و تحلیل خود را بر اساس انجمن های اینترنتی [17, 18], گوگل ترندز و ویکی پدیا [19] یا سیستم عامل های رسانه های اجتماعی مانند ق [20], دیگران از داده های تهیه شده توسط توییتر استفاده کرده اند [21]. نویسندگانی مانند گارسیا و شوایتزر [22] حتی چارچوبی برای بسته بندی چندین سیگنال اجتماعی و اقتصادی به منظور پیش بینی نرخ بازگشت بیت کوین ایجاد کرده اند. کریستوفک [23] رانندگان اغلب ادعا شده از قیمت بیت کوین را بررسی کرده است. چند نویسنده استدلال می کنند که بیت کوین, در نتیجه ارز رمزنگاری به طور کلی, به طور عمده در یک قاب سوداگرانه خطاب شده است [7, 24, 25]. از این رو, می توان گفت ممکن است توجیه و یا حتی مناسب تر برای درمان ارز رمزنگاری بسیار شبیه به سهام به جای پول بدون پشتوانه. کارهایی مانند [26, 27] به ترتیب بر پیش بینی میانگین صنعتی داو جونز (جیا) و شاخص های مختلف بازار سهام متمرکز شده اند. هر دو مطالعه از توییت ها از جمله عبارات خاصی از خلق و خوی استفاده کرده اند. در حالی که بولن و همکاران . [26] توانسته اند نشان دهند که برخی از ابعاد خلق و خوی علیت بالایی نسبت به مقادیر بسته شدن جیا دارند, ژانگ و همکاران . [27] همبستگی متوسط منفی پیدا کرده اند, در میان چیز های دیگر, بین نسبت توییت که حاوی سیگنال های امید و تمام شاخص های در نظر گرفته, یعنی داو جونز, نزدک و بازدید کنندگان&پ 500, با یک تاخیر زمانی یک روزه. در حالی که ما در حال ارزیابی ادبیات فوق بودیم,
ما در سراسر چند چیز است که ایستاده بود. هیچ مقاله مرتبط با ارزهای دیجیتال به جز یکی دیگر از ارزهای رمزنگاری شده به جز بیت کوین در تجزیه و تحلیل خود در نظر گرفته نشده است. این ممکن است به دلیل علاقه برتر به بیت کوین باشد یا حتی ممکن است یک دلیل پیش پا افتاده تر وجود داشته باشد: بسیاری از مردم حتی ممکن است از وجود ارزهای رمزپایه دیگر اطلاع نداشته باشند. دوم اینکه تمام مقالات مربوط به ارزهای رمزنگاری شده فقط روی قیمت های روزانه متمرکز شده اند. ارزهای رمزنگاری شده بسیار بی ثبات هستند. از این رو, با توجه به قیمت روزانه اجازه می دهد یک دانه بیشتر, تصویر دقیق. همچنین قابل توجه است که در بین همه مقالات رویکردهای تحلیل احساسات متفاوت است. برخی از نویسندگان [4, 21] توییت اختصاص داده اند یک کلاس (مثبت, خنثی, منفی) و تعدادی از توییت هر یک از تجزیه و تحلیل خود استفاده کرده اند. نویسندگان دیگر مانند کیم و همکاران . [17] رویکردی مبتنی بر ظرفیت اعمال کرده اند که قدرت احساسات را نیز در نظر گرفته است. بسیاری از مطالعات بیشتر در وجود است که تلاش کرده اند برای پیش بینی قیمت بازار سهام با استفاده از عوامل مختلف وجود دارد. به خصوص پیش بینی با استفاده از احساسات عمومی به نظر می رسد از منافع فوق العاده باشد. مثلا, برخی از نویسندگان نیز احساسات در توییتر استفاده کرده اند [28-33] در حالی که دیگران احساسات از بوردهای پیام سهام استفاده کرده اند [34, 35]. با این حال, علاقه علمی در ارز رمزنگاری نسبتا جدید است و بنابراین, تنها تعداد کمی از مطالعات وجود دارد. این قابل درک است زیرا ارزهای رمزپایه همانطور که امروز می شناسیم با ظهور بیت کوین که کمتر از ده سال پیش است شروع به وجود کردند [36]. بر اساس این دلایل, ما با هدف گسترش این زمینه با افزایش مقدار ارز رمزنگاری موجود در تجزیه و تحلیل ما. برای این منظور ما داده های 181 مورد از بزرگترین کوین ها را جمع کردیم. ما همچنین به ارزش عاطفی توییت های مربوط به ارزهای رمزنگاری شده توجه کردیم. ما نشان دادیم که چگونه فعالیت و احساسات توییتر می تواند برای برخی از ارزها برای پیش بینی بازده کوین استفاده شود. این اولین بار است که ارزهای رمزپایه کوچک به دلیل پتانسیل پیش بینی خود بر اساس توییتر به شدت مورد بررسی قرار می گیرند. برای حمایت بیشتر از این زمینه در حال رشد, ما مجموعه داده های جمع شده را با جامعه علمی در اطلاعات پشتیبانی (فایل اس 1) به اشتراک می گذاریم.
مواد و روش ها
برای این کار ما قیمت الت کوین و فعالیت رسانه های اجتماعی 181 الت کوین را در یک دوره 71 روزه جمع کردیم. هر دو قیمت و فعالیت های رسانه های اجتماعی هر سه ساعت به روز می شوند تا امکان تجزیه و تحلیل کوتاه مدت نیز فراهم شود. این مجموعه داده ها پیوسته نیستند اما به دو دوره زمانی تقسیم می شوند. دوره اول از 21 مارس شروع می شود و در 5 مه 2017 به پایان می رسد و بنابراین 45 روز را پوشش می دهد. داده های جمع شده در این محدوده نشان دهنده مجموعه تمرینی بود. دوره دوم 26 روز را پوشش می دهد و از 9 مه شروع می شود و در 4 جون 2017 به پایان می رسد. داده های حاصل از این محدوده به عنوان مجموعه تست عمل می کنند. این مجموعه برای ارزیابی مدل ها بر اساس مجموعه تمرینی مورد استفاده قرار گرفت. نسبت این مجموعه ها در حدود 1.73: 1 است. در مجموع مجموعه داده های ما شامل قیمت 181 الت کوین مختلف و 426520 توییت است. تمام مجموعه داده ها به صورت مشروع و کاملا مطابق با شرایط خدمات منابع مورد استفاده قرار گرفتند. منابع داده های ما در بخش های بعدی توضیح داده خواهد شد.
داده های توییتر
برای جمع کردن توییت های مربوط به الت کوین ها از رابط کاربری جستجوی توییتر استفاده کردیم [37]. با استفاده از این, یکی به طور مستقیم می توانید خزیدن داده های توییتر از جمله نام های کاربری, هشتگ, توییت, مهر زمانی مرتبط از توییت و تعداد بازتوییت. در مورد ما یک پرس و جو به یک کوین خاص اشاره کرد. این کار با استفاده از کدهای رسمی ارز انجام شد. اینها برای مثال E اتریوم و L ال تی سی برای لایت کوین و غیره هستند. ما توییت هایی را جمع کردیم که بازتوییت شدند همانطور که توییت هایی را جمع کردیم که به چندین الت کوین اشاره می کنند. این بود که اطمینان حاصل شود, که تصویر که به جامعه توییتر معرفی شد, می شود در مجموعه داده های ما منعکس. به دلیل محدودیت های اعمال شده توسط توییتر فقط می توان یک نمونه تصادفی از حداکثر 100 توییت در هر پرس و جو جمع کرد و در نتیجه هر سه ساعت یکبار فعالیت رسانه های اجتماعی را برای هر الت کوین به روز کرد. نمایش داده شد در فواصل سه ساعته پردازش شد و شامل تا 100 توییت که از پرس و جو گذشته ارسال شده بود. برای هر پرس و جو همه توییت ها و تعداد کل توییت ها را ذخیره کردیم.
تحلیل احساسات
به منظور استخراج احساسات بیان شده در یک صدای جیر جیر, ما اعمال ویدر, یک مدل تجزیه و تحلیل احساسات مبتنی بر ظرفیت که به ویژه به تجزیه و تحلیل متن رسانه های اجتماعی مانند توییت [38]. توییت ها اغلب حاوی تنوع زبان هستند و استفاده مکرر از شکلک ها را نشان می دهند, اختصارات یا عامیانه [39]. این ویژگی های خاص منجر به الزامات خاصی در مورد تجزیه و تحلیل احساسات می شود تا از دست رفتن اطلاعات جلوگیری شود. ویدر با تکیه بر واژگان حاوی شکلک های سبک غربی و کلمات اختصاری مرتبط با احساسات به این خواسته ها پاسخ می دهد [38]. با این حال, چندین روش تجزیه و تحلیل احساسات دیگر در وجود است که به یک نتیجه مشابه منجر خواهد شد وجود دارد. هنگام استفاده از ویدر برای تجزیه و تحلیل احساسات, چهار نمره مختلف محاسبه می شوند: مثبت, خنثی, منفی و مرکب. نمرات مثبت و خنثی و منفی بخش یا بخش از متن است که به گروه مربوطه خود را همسان هستند. این بخشها وقتی به یکدیگر اضافه می شوند باید مجموع 1 را داشته باشند. نمره مرکب نشان دهنده مجموع ظرفیت هر کلمه در فرهنگ لغت است. سپس این مبلغ به نمره ای بی ن-1 (بسیار منفی) و +1 (بسیار مثبت) نرمال می شود. شکل 2 نمرات محاسبه شده با استفاده از ویدر را در دو توییت نمونه مصنوعی تولید می کند. این توییت شامل چندین عبارت مثبت مانند "وای" و شکلک های شاد است. در نتیجه, صدای جیر جیر دارای نمره مثبت بالا و نمره ترکیب بسیار مثبت. توییت برجسته شده با نقاط قرمز خلاف این را با استفاده از عبارت با معنی منفی بیان می کند "چه جهنمی داری انجام می دهی. ”. این منجر به نمره منفی بالا و نمره ترکیبی بسیار منفی می شود. نمرات ذکر شده در بالا برای هر صدای جیر جیر تنها محاسبه شد. این توییت با توجه به مهر زمان خود را با محاسبه میانگین هر نمره گروه بندی شدند. این به ما اجازه داد تا این نمرات را به الت کوین ارجاع داده شده اختصاص دهیم و متعاقبا از ویژگی های مدل های پیش بینی استفاده کنیم.
توییت برجسته شده شامل عبارات مثبت مختلف است. در تضاد, صدای جیر جیر قرمز خال خال حاوی زبان معنی منفی. بر این اساس, هر دو توییت به طور گسترده ای متفاوت از نظر چهار نمرات ویدر محاسبه.
داده های ارز
مجموعه داده های مربوط به امور مالی از طریق نمودارهای رمزنگاری شده توسط پلتفرم اینترنتی دریافت شده است نمودارهای رمزنگاری [40]. این پلتفرم نمای کلی از بازار ارزهای رمزنگاری شده را فراهم می کند. در کنار اطلاعات مربوط به صرافی های مختلف ارزهای رمزنگاری شده, همچنین شامل اطلاعات مربوط به خود ارزهای رمزنگاری شده خاص است, مانند نرخ ارز, حجم معاملات, عرضه فعلی و کدهای ارز رسمی. بر این اساس از نمودارهای رمزنگاری شده برای جمع کردن دادههای بازار استفاده کردیم. برای تجزیه و تحلیل ما تمام الت کوین ها را در نظر گرفتیم که کریپتوکوینچارت ها داده ها را در طول زمان کامل فراهم می کنند. این مبلغ در مجموع به 181 سکه رسید. به دلیل موقعیت برتر بازار در صرافی های ارزهای دیجیتال تعریف قیمت ها در بیت کوین معمول است . این امر در مورد نمودارهای رمزنگاری نیز صدق می کند. اطلاعات قیمت در همان فواصل سه ساعته فعالیت رسانه های اجتماعی همان ارز رمزنگاری شده به روز می شود. با همگام سازی زمان دستیابی به داده های مالی و رسانه های اجتماعی اطمینان حاصل کردیم که هیچ گونه نشت اطلاعات وجود ندارد. جدول 1 خلاصه ای از مجموعه داده های ما را نشان می دهد.
جدول 1 | این جدول مجموعه تمرینات ما را توصیف می کند. اندازه گیری های انجام شده بر اساس 60273 نمونه با پوشش 181 الت کوین در مجموع محاسبه شد و مروری بر داده های مورد تجزیه و تحلیل در این مطالعه داشت. حجم و نرخ در بیت کوین تعریف شده است. | متغیر | میانگین | اس. دی. |
---|---|---|---|---|
حداقل | حداکثر | نومتویتس | 3.635 | 100 |
12.243 | 0.000 | مثبت | 3.635 | 0.068 |
0.000 | 0.700 | خنثی | 3.635 | 0.443 |
0.000 | 1.000 | 0.000 | 3.635 | 0.032 |
0.000 | 0.727 | مرکب | 0.058 | 0.161 |
-0.922 | 0.956 | جلد | 3.635 | 3736.074 |
0.000 | 97574.006 | نرخ | 3.635 | 0.057 |
0.000
0.912
پیش پردازش داده ها
این مورد بود که برخی از کوین هایی که ما داده های بازار را جمع کردیم هیچ فعالیت یا تقریبا هیچ فعالیت رسانه های اجتماعی در توییتر نداشتند. به منظور ایجاد مدل های پیش بینی قابل اعتماد, با این حال, ضروری است به مقدار قابل توجهی از داده ها. به همین دلیل مصلحت نبود که در تحلیل های ما این الت کوین ها را در نظر بگیریم که این الزامات را نداشتند. از این رو, ما فقط شامل کسانی که التکوین که در توییتر در حداقل ارجاع شد 10% از تمام روز در مجموعه تمرینی ما. با انتخاب یک سطح نسبتا پایین ما می خواستیم اطمینان حاصل کنیم که ما در تجزیه و تحلیل های ما به همان اندازه که ممکن است در نظر بگیریم. این رویکرد منجر به تعداد کل 131 الت کوین شد که در مراحل بعدی مورد توجه قرار گرفتیم.
رویکرد پیش بینی
به منظور ایجاد مدلهای پیشبینی از تحلیل رگرسیون خطی حداقل مربعات معمولی بر روی مجموعه تمرینی خود استفاده کردیم. تعداد توییت ها و تمام نمرات محاسبه شده با استفاده از ویدر به عنوان ویژگی های ورودی استفاده شد. این منجر به تعداد کل 333 نمونه با 5 ویژگی یعنی تعداد توییت های سه ساعت گذشته و ابزار چهار نمره ویدر این توییت ها برای هر ارز شد. به جای اینکه نرخ ها را به عنوان متغیر پاسخ در نظر بگیریم از بازده الت کوین استفاده کردیم. در مقابل نرخ, بازده فرض می شود کمتر همبسته و اجازه می دهد برای تنظیم استراتژی سرمایه گذاری مستقیم. بنابراین استفاده از بازده به جای نرخ خطر دریافت نتایج را به دلیل داده های همبسته خودکار کاهش می دهد. بازده کوین ها برای یک افق زمانی محاسبه شد تی = [1, 8]. به عنوان نمونه در فواصل سه ساعته جمع شدند, یک تاخیر زمانی مربوط به یک فاصله سه ساعت. بنابراین موارد زیر معتبر است:
بر این اساس بازده را تا 24 ساعت محاسبه کردیم. رویکرد توصیف شده برای تمام 131 الت کوین اعمال شد. با این حال ما هر مدل را به صورت دقیق تجزیه و تحلیل و ارزیابی نکردیم. در عوض ما روی مجموعه کوچکی از الت کوین ها تمرکز کردیم که بالاترین ارتباط بین ویژگی های ورودی و بازده را نشان می داد. این با استفاده از میانگین مقدار ر 2 برای دوره زمانی کامل مجموعه تمرین اندازه گیری شد. تحقیق 2 ارزش, یا ضریب تعیین, نشان دهنده نسبت توضیح داد از تنوع متغیر وابسته, در اینجا بازده, توسط متغیرهای مستقل, فعالیت و احساسات. از این رو, ما تمرکز ما بر روی این پنج کوین که بالاترین میانگین تحقیق نشان داد مجموعه 2 ارزش برای همه زمان نشدم برای پیدا کردن کسانی که مدل با متوسط خوب پیش بینی کوتاه مدت. این مدل ها به داده های جدید و غیر قابل مشاهده از مجموعه تست ما اعمال شد. به منظور در نظر گرفتن تعداد تست های اماری به حساب و در نتیجه کاهش خطر ابتلا به خطای نوع اول, ما اعمال اصلاح بونفرونی.
نتایج
استفاده از تجزیه و تحلیل رگرسیون خطی در داده های جمع شده ما منجر به طیف گسترده ای از نتایج شد. در حالی که برخی از بازده های الت کوین به نظر نمی رسد به تغییرات در فعالیت های رسانه های اجتماعی و خلق و خوی عمومی در توییتر پاسخ دهند. شکل 3 تجسم تحقیق 2 ارزش پنج سکه انتخاب شده برای همه وقفه زمان. انتخاب بر اساس بالاترین میانگین تحقیق 2 ارزش یک تصویر همگن را فراهم نمی کند. بجای, این رویکرد انتخاب ارز با انواع زیادی از فعالیت های رسانه های اجتماعی, حجم معاملات و قیمت. اتریوم با توجه به سرمایه بازار خود بزرگترین الت کوین است [41]. اتریوم به همین ترتیب علاقه زیادی در توییتر ایجاد کرد (میانگین تعداد توییت ها: 61.4) و حجم معاملات بالایی داشت (میانگین حجم: 29825.8 بیت کوین ) و نرخ (میانگین نرخ: 0.0437 بیت کوین). این ارز رمزنگاری شده در اولین تاخیر زمانی ( 2 = 0.242) یا به عبارت دیگر پس از سه ساعت دارای مقادیر تحقیق 2 بالا بود. این بدان معناست که این مدل به ویژه برای توضیح تغییرات بسیار کوتاه مدت در بازده مناسب بود. در مقابل, بیت کوین, وکسل و پورویدز هستند و نه کوچک است. بیت کویندارک علاقه کمی به رسانه های اجتماعی ایجاد کرد (میانگین تعداد توییت ها: 1.05) و حجم معاملات نسبتا کمی داشت (میانگین حجم: 119.7 بیت کوین ). این امر در مورد وکسل ها نیز صدق می کند (میانگین تعداد توییت ها: 1.55; میانگین حجم: 107.19 بیت کوین ), دلار استیم (میانگین تعداد توییت ها: 0.19; میانگین حجم: 123.10 بیت کوین ) و پورویدز (میانگین تعداد توییت ها: 1.11; میانگین حجم: 0.89 بیت کوین ). دومی به ویژه سطح پایینی از معاملات منعکس شده در میانگین حجم را نشان داد. وکسل پس از 9 ساعت افزایش واقعی در مقادیر تحقیق 2 را نشان داد و پس از 12 ساعت به بالاترین مقدار تمام مدل ها رسید. به طور کلی, بیت کویندارک تحقیق نسبتا بالا فراهم 2 ارزش برای همه زمان نشدم در حالی که اتریوم واقعا یک مقدار اوج در تاخیر اول فراهم.<0.001) with significant effects of number of tweets (p<0.001) and neutral sentiment (p<0.001).
تحقیق بالا 2 ارزش برای برخی از وقفه مواجه می شدند. سطح اهمیت (اصلاح شده بونفرونی): * * * پ-ارزش
هنگامی که استفاده از این مدل به داده های جدید, تصویر تغییر اشاره به میانگین تحقیق 2 ارزش برای همه پیش بینی در نظر گرفته. این جای تعجب نداشت زیرا مدل بر اساس داده های تمرین بود. بر این اساس مقادیر تحقیق 2 برای تمام الت کوین ها در مجموعه تست پایین تر از مجموعه تمرین بود که در شکل 4 دیده می شود . با این حال, نه تنها میانگین تحقیق 2 ارزش برای تمام مدل های تغییر بلکه زمان نشدم که مدل های ما بهترین جا. به خصوص اتریوم برجسته بود. در ست تمرینی این مدل به ویژه برای توضیح تغییرات در تاخیر زمانی اول مناسب بود. این مدل با بررسی داده های جدید ارتباط قابل توجهی را در تاخیر زمانی گذشته فراهم کرد. در جهت مخالف این برای پورویدز نیز معتبر بود. همانطور که در مجموعه تمرین, تحقیق 2 مقادیر برای وکسل ها در تاخیرهای بعدی بیشتر از مقادیر قبلی بود. بیت کوین هنوز هم بالاترین میانگین تحقیق نشان داد 2 ارزش بیش از همه زمان نشدم. پس از اعمال تصحیح بونفرونی به 16 مورد از 40 پیش بینی اهمیت دادیم. برای اطمینان از اینکه اثر معنی داری بین پیش بینی کننده های ما و بازده وجود داشته, ما همچنین تجزیه و تحلیل همبستگی مشترک بر اساس هر دو داده های تمرین و تست با اثر ثابت برای نوع سکه انجام و یک تناسب قابل توجهی از مدل پیدا شده است (اف = 2.14 الکترونیکی-249, پ
به طور کلی, همه تحقیق 2 ارزش کاهش یافته است. برای 16 مورد از 40 پیش بینی اهمیت یافت.
بحث و گفتگو
توییتر مرکز توجه بسیاری از مطالعات مختلف مربوط به پیش بینی بیت کوین بوده است [21] و شاخص های بازار سهام [26-30, 32] و یا حتی نتایج انتخابات [42, 43]. تمرکز این مطالعه بررسی این بود که این پلتفرم اطلاعاتی را فراهم می کند که می تواند برای تعیین بازده الت کوین استفاده شود. این اطلاعات در پنج بعد مختلف اندازه گیری شد: میزان فعالیت توییتر اندازه گیری به عنوان تعدادی از توییت و حاوی خلق و خوی عمومی اندازه گیری به عنوان متوسط مثبت, خنثی, نمره منفی و مرکب. هدف از این کار پاسخ به این سوال بود که بر اساس این اطلاعات داده شده می توان بازده الت کوین را پیش بینی کرد. ما از مجموعه تمرینی خود استفاده کردیم که شامل 45 روز قیمت الت کوین و اطلاعات فوق برای ایجاد مدل های رگرسیون خطی است. به جای استفاده از خود قیمت ها بازده را در فواصل سه ساعته به مدت 24 ساعت محاسبه کردیم. فقط الت کوین هایی که حداقل در 10 درصد روزهای دوره مشاهده فعالیت رسانه های اجتماعی داشتند مورد توجه بیشتر قرار گرفتند. ما مدل های رگرسیون خطی را برای تمام الت کوین های در نظر گرفته شده ایجاد کردیم و بر این پنج مورد تمرکز کردیم که در توضیح واریانس بازده اندازه گیری شده به عنوان میانگین مقدار تحقیق 2 در تمام وقفه های زمانی مناسب ترین بودند. سپس این مدلها با استفاده از دادههای تست دیده نشده در 26 روز پس از دوره تمرین مورد ارزیابی قرار گرفتند. برای اطمینان از اینکه همبستگی خودکار وجود ندارد ما بین تمرین و مجموعه تست چهار روز مکث می کنیم. ما نتایج قابل توجهی برای هر الت کوین در نظر گرفته شده برای حداقل یک تاخیر زمانی پیدا کردیم. به طور خلاصه, این منجر به نتایج قابل توجهی برای 16 بیرون از 40 پیش بینی. بالاترین مقادیر تحقیق 2 در مجموعه تست ما توسط بیت کویندارک ( 2 = 0.107) و وکسل ( 2 = 0.062) حاصل شد. تا جایی که می دانیم هیچ مطالعه دیگری وجود ندارد که رویکرد مشابهی را برای پیش بینی بازده ارزهای دیجیتال به کار برده باشد. بنابراین مقادیر مرجع به راحتی در دسترس نیستند. همانطور که قبلا ذکر, چند نویسنده برای درمان ارز رمزنگاری به عنوان یک شی از حدس و گمان استدلال. به همین دلیل منطقی است که اجازه استفاده از نتایج مطالعات مربوط به پیش بینی بازار سهام را نیز بدهیم. با استفاده از احساسات از بوردهای پیام سهام برای پیش بینی تغییرات در قیمت سهام, داس و چن تحقیق دریافت 2 ارزش 0.0027 [34]. انتویلر و فرانک گزارش تحقیق 2 ارزش 0.049 در هنگام پیش بینی قیمت بازار سهام نیز در بوردهای پیام سهام بر اساس [35]. تتلاک و همکاران .
کسری از کلمات منفی در اخبار خاص شرکت برای پیش بینی بازده سهام در روز بعد استفاده می شود و تحقیق پیدا شده است 2 ارزش تا 0.0024 [44]. با توجه به این نمونه, تحقیق یافت 2 ارزش تا 0.107 برای بازده بیت کویندارک پس از 21 ساعت مقایسه خوبی. حتی کمترین مقدار قابل توجه تحقیق 2 0.025 برای اتریوم پس از 24 ساعت با اکثر ادبیات موجود مطلوب است. اگرچه باز هم زمینه کاربرد و داده های اساسی یکسان نیست اما این مطالعات مقیاس تقریبی را برای نتایج ما فراهم می کند که به طور مطلوب مقایسه می شود. این در همان جهت به عنوان برخی از کار مرتبط اشاره کرد. گارسیا و شوایتزر [22] نشان داده اند که ظرفیت عاطفی و قطبش نظر در توییت ها می تواند پیش بینی کننده های مناسبی برای بازده بیت کوین باشد. با این حال مدل های ما تصویری یکپارچه از فاصله زمانی بین تغییرات در فعالیت های رسانه های اجتماعی و خلق و خوی عمومی در توییتر و تغییرات مربوطه در بازده الت کوین نشان ندادند. در حالی که به نظر می رسید برخی از الت کوین ها پس از سه ساعت مانند دلار بخار به سرعت پاسخ می دهند و برخی دیگر مانند اتریوم پس از 24 ساعت پاسخ قابل توجهی از خود نشان دادند. قابل ذکر است که دومین الت کوین بزرگ با توجه به سرمایه بازار خود اتریوم به تغییرات فعالیت و روحیه عمومی در توییتر پاسخ داد. این نتیجه با نتایج کیم و همکاران ارتباط دارد . [17]. نویسندگان رابطه معنی داری بین پاسخ های مثبت و منفی در یک انجمن اینترنتی مرتبط با اتریوم و قیمت ارز رمزنگاری شده در 3 تا 13 روز پیدا کردند. بر اساس یافته های ما قطعا می توانیم بیان کنیم که فرضیه ای که فرض می کند که تاثیر قابل توجهی از فعالیت های رسانه های اجتماعی و احساسات حاوی بازده کوین های بعدی وجود ندارد می تواند رد شود. با توجه به این شرایط می توان بازده الت کوین را تا حدودی با استفاده از اطلاعات ارایه شده توسط توییتر پیش بینی کرد. با توجه به این نتایج در یک زمینه فوق العاده با ادبیات موجود موافق هستند. مطالعات متعددی به پیش بینی قیمت ها یا بازده ارزهای رمزپایه و همچنین سهام اختصاص یافته است. در میان مطالعات مذکور طیف وسیعی از روشهای مختلف به کار گرفته شد. با این حال خیلی ها در همان جهت حرکت می کنند. تصویر کلی نشان دهنده رابطه بین رسانه های اجتماعی و قیمت هر دو ارز رمزنگاری شده و سهام است.
نتیجه گیری
واضح است که این مطالعه با محدودیت ها و پتانسیل هایی همراه است که فرد دامنه محدودی را در نظر می گیرد. نویسندگانی مانند نوفر [31] ایده تحلیل احساسات را بیشتر توسعه داده اند. نه تنها روحیه اجتماعی در توییتر را در نظر گرفته اند بلکه تعداد فالوورهای یک نفر را نیز در نظر گرفته اند. این به توییت های ارسال شده توسط کاربران متصل اهمیت بیشتری می دهد. این از نظر ما بازتاب بهتری از واقعیت است. می توان فرض کرد که افزایش تعداد پیروان برابر با افزایش تعداد افرادی است که می توانند تحت تاثیر قرار گیرند [27]. اگرچه توییتر یکی از بزرگترین کانال های رسانه های اجتماعی است و بنابراین شاخص خوبی برای خلق و خوی عمومی است اما سیگنال های بیشتری وجود دارد که ممکن است به پیش بینی بازده ارزهای دیجیتال کمک کند. بنابراین ممکن است ارزشمند باشد که انواع بیشتری از داده ها مانند گارسیا و شوایتزر را در نظر بگیریم [22] در مطالعه خود برای پیش بینی نرخ بازگشت بیت کوین انجام داده اند. بازده سایر ارزهای رمزپایه یا حجم جستجو در گوگل یا ویکی پدیا تنها دو نمونه ممکن است. برای این مطالعه دادهها در مجموع در یک بازه زمانی 71 روزه جمع شدند. در مقایسه با اکثر ادبیات, این بازه زمانی نسبتا کوتاه است. بازه زمانی طولانی برای نتایج دقیق تر اجازه می دهد. پتانسیل بیشتر در روش کاربردی کاربردی نهفته است. رویکردهای پیش بینی پیشرفته تر مانند شبکه های عصبی که توسط برخی از نویسندگان در ارزهای رمزنگاری شده اعمال می شود [18] و بسیاری دیگر در سهام [26, 29, 45-50] نوید پیشرفت های بیشتر در دقت پیش بینی را می دهد. استفاده از شبکه عصبی عمیق در پیش بینی بازده الت کوین تمرکز کار تحقیقاتی بعدی ما خواهد بود. با وجود این باید اذعان کرد که ما هر روز هشت نمونه برای 181 سکه جمع کردیم. به بهترین دانش ما, این تجزیه و تحلیل دقیق ترین نوسانات قیمت با بیشترین ارزهای مورد توجه قرار گرفته است. در میان تمام ادبیات مورد مطالعه ما نتوانستیم نویسنده ای را پیدا کنیم که رویکرد مشابهی را به کار گیرد. در عوض بسیاری روزی یک بار ارزش کسب می کردند. به طور خلاصه می توان گفت که این مطالعه رویکرد متفاوتی را در مقایسه با ادبیات موجود با تمرکز بر بیت کوین بلکه بسیاری از الکوین های مختلف به کار برد. تجزیه و تحلیل ما به نتایج جالبی رسید که نشان دهنده ارتباط بین فعالیت رسانه های اجتماعی و احساسات در توییتر و این کوین ها بود. برای تقویت زمینه جوان پیش بینی قیمت الت کوین, ما داده های جمع شده را با جامعه به اشتراک می گذاریم.