بخاطر طبیعت ناپایدار و غیرقابل پیش بینی بازارها، فرآیند پیش بینی و مدلسازی بورس و تخمین ارزش سهام همواره موضوعی چالشی بوده است. فرضیهی بازار از ابتدا بر این باور متکی بوده که پیش بینی قیمت سهامها غیرممکن است و سهامها رفتاری تصادفی دارند؛ اما تحلیلها و آنالیزهای تکنیکال اخیر نشان میدهند که بیشتر ارزش سهامها متاثر از قیمتهای قبلی هستند، در نتیجه، روندهای حرکتی، نقشی حیاتی برای تخمین موثر ارزش سهامها دارند. علاوه بر این، گروهها و تحرکات بازار سهام تحت تاثیر فاکتورهای متعددی مثل رخدادهای سیاسی، شرایط کلی اقتصادی، شاخص قیمت کالاها، انتظارات سرمایهگذاران، تغییرات در دیگر بازارهای سهام، حالت روانشناختی سرمایهگذاران و … قرار دارند. ارزش گروههای سهام با ارزش بازار بالا یا مارکت کپ بالا (high market capitalization) محاسبه میشود. پارامترهای تکنیکال مختلفی برای به دست آوردن دادههای آماری از ارزش قیمت سهامها وجود دارند. عموما شاخصها از قیمت سهامها با بالاترین سرمایهگذاری در بازار به دست میآیند و یک شمای کلی از وضعیت اقتصادی در هر کشوری به ما میدهند. برای مثال، یافتهها نشان دادهاند که رشد اقتصادی در کشورها رابطهی مستقیمی با ارزش بازار سهام دارد.
روشهای مختلف پیش بینی و مدلسازی بورس
طبیعت و ماهیت حرکات و تغییر ارزش سهامها مبهم و غیر قابل پیش بینی است. بخاطر همین است که سرمایهگذاری برای سرمایهگذاران کاری ریسکی است. از سوی دیگر، همواره تشخیص وضعیت بازار برای دولتها کاری سخت و مشکلی بزرگ بوده است. این یک گزارهی درست است که به طور کلی ارزش سهامها پویا و دینامیک، غیرپارامتری و غیرخطیاند؛ در نتیجه، این ویژگیها منجر به عملکرد ضعیف مدلهای آماری و ناتوانی در تخمین ارزش دقیق سهامها و نیز عدم پیش بینی روند حرکتی بازار میشود. یادگیری ماشینی (Machine Learning) قدرتمندترین ابزاری است که شامل الگوریتمهای مختلف برای ارتقای موثر عملکرد خود در بررسی موردی خاص میباشد. اعتقاد رایج این است که یادگیری ماشینی قابلیت چشمگیری در شناخت اطلاعات معتبر و تشخیص الگوها از داده ها دارد.
یادگیری عمیق (Deep Learning) زیرمجموعهای از یادگیری ماشینی یا همان یادگیری ماشین در هوش مصنوعی است که شبکههایی دارد که قادر به یادگیری نظارتنشدهی دادههای بدون ساختار و بدون برچسباند. تفاوت اصلی بین یادگیری عمیق و یادگیری ماشین در روشی است که دادهها در سیستم ارائه میشوند. الگوریتمهای یادگیری ماشین تقریبا همیشه به دادههای ساختاریافته نیاز دارند در حالی که شبکههای یادگیری عمیق متکی به لایههایی از شبکه های عصبی مصنوعی یا ANNها هستند. بخاطر ساختار ANNها به این روش، یادگیری عمیق گفته میشود. داشتن تعداد لایههای بیشتر از صد عدد هم در این روش امکانپذیر است.
بر خلاف متدها و روشهای سنتی در حوزهی یادگیری ماشینی، مدلهای گروهی روشی مبتنی بر یادگیری ماشینی هستند که در آنها برخی الگوریتمهای رایج برای حل یک مشکل خاص به کار میروند و عملکرد برتر هر متد در تخمین سریهای زمانی تایید شده است. برای مسایل تخمین در حوزهی یادگیری ماشینی، الگوریتمهای boosting و bagging روشهایی موثر و آشنا در میان روشهای گروهی هستند. اخیرا و با معرفی الگوریتمهای gradient boosting و XGBoost، که از سوی دیتاساینتیستهای بلندمرتبه به طور چشمگیر و رقابتی ای به کار رفت، پیشرفت هایی در مدل های درختی انجام شده است. علاوه بر این، یک روند مدرن دیگر در یادگیری ماشینی که به نام یادگیری عمیق یا آموزش شبکه های عصبی مصنوعی عمیق شناخته میشد، می تواند توپولوژی عمیق غیرخطی را در ساختار ویژهی خود در نظر بگیرد و این قابلیت فوقالعادهاش را از سریهای زمانی مالی میگیرد تا بتواند اطلاعات مربوط را بیرون بکشد. بر خلاف شبکه عصبی مصنوعی ساده، شبکه های عصبی بازگردنده یا همان RNNها بخاطر عملکرد خوبشان، در حوزهی مالی به موفقیت چشمگیری رسیدهاند. واضح است که فرآیند پیش بینی و مدلسازی بورس و بازار سهام نه تنها مرتبط با اطلاعات فعلی بلکه وابسته به دادههای قبلی است و این دادههای قبلی نقشی مهم دارند. پس، چنانچه فقط دادههای اخیر مورد استفاده قرار بگیرند، آموزش ناکافی خواهد بود. شبکه عصبی بازگشتی قادر است شبکه را وادارد تا رخدادهای اخیر را در حافظه نگه دارد و اتصالاتی میان هر یک از واحدهای شبکه برقرار کند. بنابراین، این مجموعه کاملا مناسب پیش بینیهای اقتصادی و از جمله پیش بینی و مدلسازی بورس خواهد بود. حافظهی طولانی کوتاه مدت یا به اختصار LSTM، زیرمجموعهی رشد یافته و اصلاح شدهای از متد RNN است که در حوزهی آموزش عمیق به کار میرود.
در زمینههای آکادمیک، مطالعات بسیاری در زمینهی راههای تخمین بازار سهام، انجام شده است. همچنین راهکارهای متنوعی برای مدلینگ سریهای زمانی مالی وجود دارند. روشهای هموارسازی نمایی یا Exponential smoothing، میانگین متحرک یا moving average و روش ARIMA همگی از مدلهای خطی متداول در تخمین قیمتهای آتی هستند. تحقیقات مختلفی برای گسترش تخمین قیمتهای سهام با استفاده از شبکههای عصبی مصنوعی یا به اختصار ANN ها، الگوریتم های ژنتیک یا GA، منطق فازی و دیگر روشها انجام شده است.
در تحقیقی با موضوع یادگیری عمیق برای پیش بینی بازار سهام در[1] میبینیم که از میان مدلهای درختی و شبکههای عصبی، روش حافظه طولانی کوتاه مدت یا LSTM بهترین عملکرد را در میان سایر روشها از خود نشان دادهاست. در این مساله، متدها توانستند به طور چشمگیری عملکردشان را بهبود بخشند و روش LSTM در مقایسه با رقبا بالاترین عملکرد را از آن خود ساخت. در کل و به عنوان نتیجهگیری، شاهد بودیم که هم الگوریتمهای درختی و هم الگوریتمهای آموزش عمیق، هر دو توانایی قابل توجهی در مسایل بازگشتی در حوزهی آموزش ماشین از خود نشان دادند. در تحقیق دیگری در [2] میبینیم که چهار متد آموزش عمیق شامل پرسپترون چندلایهای یا MLP، شبکه های عصبی بازگشتی یا RNN، حافظه طولانی کوتاه مدت یا LSTM و شبکه های عصبی کانولوشن یا CNN برای پیش بینی و مدلسازی بورس و بازار سهام در دو بازار NSE هند و NYSE نیویورک مورد استفاده قرار گرفته اند. در نتایج این بررسی آمده است که متد CNN عملکردی بهتر از سایر روشها نشان داده است. همچنین نتایج این تحقیق با مدل ARIMA مقایسه و مشاهده شد که شبکه های عصبی نسبت به مدل خطی ARIMA هم عملکرد بهتری دارند.
آنچه در تحقیقات نوین بین المللی در بازار سرمایه محرز است. برای همهی سرمایهگذاران ضروری است که تغییرات قیمت و ارزش سهام ها را پیش بینی کنند تا بتوانند تصمیماتی برای کسب سود بیشتر و کاهش ریسک احتمالی بگیرند.
[1]. https://arxiv.org/ftp/arxiv/papers/2004/2004.01497.pdf
[2]. https://www.sciencedirect.com/science/article/pii/S1877050918307828