true
کارکردهای علوم داده و هوش مصنوعی در بازارهای پول و سرمایه، این روزها بسیار میشنویم که دنیا در حال گذار به دورانی جدید است و به عصری نوین از زندگی بشریت وارد شدهایم که در آن اطلاعات و هوش مصنوعی پیشتاز هستند.
اکوپرشین: مهدی شهنازی، در دهههای گذشته در اقتصاد، واژگانی مانند اقتصاد نفت، اقتصاد گاز، اقتصاد حمل و نقل، اقتصاد کالایی واژگانی برجسته و جز مباحث اصلی دانشگاهی در رشتههای مرتبط با اقتصاد بود. اما امروزه واژهای جدید به این مجموعه اضافه شده است: «اقتصاد اطلاعات». این واژه این مفهوم را میرساند که اطلاعات نیز همانند نفت و گاز، به منبع تولید ثروت تبدیل شده است و مسلما میبایست بر روی این منابع مدیریت داشت.
خمیر مایه این نوع اقتصاد، دادههایی است که توسط ابزارهای الکترونیک (همانند موبایل، خودپرداز بانک و … ) و نرم افزارهای کاربردی ( شبکههای اجتماعی، بازیهای کامپیوتری، سامانههای خدماتی و … ) تولید میشوند. بهتر است مساله را با یک مثال ادامه دهیم.
روزها تلفنهای همراه صمیمی ترین دوست اکثر مردم محسوب میشوند. این دوست صمیمی شما را به یک منبع تولید داده برای سازمانها و شرکتهای مربوطه مینماید. برای درک این مساله، به روند زندگی یک شخص در طول شبانه روز توجه نمایید:
- شخص صبح زود از خواب بیدار میشود. گوشی موبایل خود را روشن میکند.
- نرم افزار شبکه اجتماعی خود را باز میکند و چند پست را میبیند و لایک میکند.
- به چند سایت سر میزند و سر خط خبرها را میخواند.
- قبض موبایل و تلفن خانه خود را با استفاده از درگاه بانکی یک نرم افزار و با موبایل پرداخت میکند.
- حس میکند که امروز حوصله سوار مترو شدن را ندارد، پس به سایت خرید مجوز ورود به طرح مراجعه میکند.
- در طول مسیر از نرم افزار مسیر یاب استفاده میکند.
- اتومبیل را در پارکینگ عمومی پارک میکند.
- از عابر بانک نزدیک محل کار مبلغی را به حساب همسرش واریز میکند.
- در هنگام ورود به محل کار زمان ورودش را در سیستم حضور و غیاب ثبت میکند.
- در طول روز خرید اینترنتی میکند.
- چندبار با تلفن همراه با افراد دیگر صحبت میکند.
- در مسیر بازگشت، از یک مغازه با عابربانک خود خرید میکند.
- و نهایتا در هنگام خواب، تلفن همراه خود را خاموش میکند.
به این فرآیند فکر کنید. آیا با استفاده از هر یک از این نرم افزارها و سامانههای اطلاعاتی، دادههایی را در بانکهای اطلاعاتی این شرکتها ثبت نشده است؟ با توجه به عملیاتی که در طول روز انجام شده است، حداقل دادههای مربوط به این عملیات در مکانهای زیر ذخیره شده است:
- روشن و خاموش کردن تلفن همراه و همچنین اطلاعات مخاطبین مکالمات تلفنی شما در مرکز مخابرات ثبت شده است.
- پرداخت قبوض از تلفن همراه و همچنین نام سایتها و صفحات خبری که به آنها مراجعه شده است، در شرکت تامین کننده اینترنت شما ثبت میشود.
- خرید مجوز طرح ترافیک در سامانه شهرداری ثبت میشود.
- مسیریاب، مسیر رفت و آمد را ثبت میکند.
- بانک تراکنشها و رفتار مالی را ثبت میکند.
- شرکتی که از آن خرید اینترنتی داشته ام، اطلاعات نیازهای من را ثبت میکند.
حال فرض کنید که این سازمانها و شرکتها، اطلاعات این شخص را در طول یک سال ذخیره کنند. اهمیت موضوع دقیقا در اینجا مشخص میشود. با داشتن کارهایی که این شخص در طول یکسال انجام داده است شناخت عمیقی از رفتار و عادتهای این فرد پیدا میشود و میتوان براساس عادات وی، کارهای زیادی انجام داد. حال از فاصله ای دورتر به مساله نگاه کنیم. اگر دادههای افراد جامعه توسط این سازمانها و شرکتها ذخیره شود، میتوان به شناخت رفتار جامعه در حوزههای مختلف پرداخت. به عنوان مثال میتوان با خوشه بندی رفتارهای مردم جامعه را به چند گروه تقسیم بندی کرد و متناسب با خواستهها و سلایق آنها به انها خدمات ارائه داد و یا رفتارهای اشتباه هر خوشه را اصلاح کرد و به سمت هدف تعیین شده سوق داد. حال باید این نتیجه حاصل شده باشد که چه قدرتی در این دادههای ذخیره شده، نهفته است. شناخت خوشههای جمعیتی بر اساس مشابهتهای رفتاری، میتواند کمک فراوانی به سیاست گذاران در برنامه ریزی کلان در هر حوزه ای نماید. در واقع سارمانها و شرکتها در حال ذخیره «دادههای تجربیات» افراد جامعه بدون پیش داوری هستند و با داشتن این داده ها، امکان پیش بینی و شبیه سازی رفتار جامعه در مولجهه با مسائل و مشکلات در حوزههای اجتماعی، مالی و … را خواهند داشت. پس میتوان گفت که دادهها علاوه بر ثروت، قدرت را هم به همراه میآورند. داده اساس اقتصاد نوین است.
با این پیش زمینه، میبایست میزان اهمیت ثبت تجربیات و بهره برداری از آنها مشخص شده باشد. در بخش بعدی به فرآیند این تبدیل یعنی تبدیل داده به کالای ارزشمند و گران قیمت پرداخته خواهد شد. به عصر حکمرانی دادهها خوش آمدید.
داده چیست؟
در گذشته منظور از داده، معمولا تحلیل آماری لیستی از اعداد بود. ام با گذشت زمان این تعریف تغییرکرد. در تعریف جدید هر آنچه که قابلیت ذخیره داشت به عنوان داده شناخته شد. با توجه به این موضوع صوت، تصویر، فیلم و متن نیز در کنار اعداد به عنوان داده شناخته میشوند. این نوع دادهها نیز امکان تحلیل دارند و روش تحلیل و ابزار آنها متفاوت میباشد.کلید تحلیل و پردازش این نوع دادهها را باید در هوش مصنوعی پیدا کرد. مباحثی مانند پردازش متن، پردازش تصویر و فیلم مباحثی پیشرفته در هوش مصنوعی هستند که توضیخ آنها از حوصله این متن خارج است.
حرکت از داده خام به مکعب اطلاعات:
همانطور که بیان شد، در اقتصاد اطلاعات، ماده اولیه داده است. بنابراین در وهله اول باید به موضوع چگونگی تامین دادهها به شکل مستمر با استفاده از روشهای مهندسی داده توجه نمود تا در نهایت بتوان به دادههای قابل اعتماد و اعتنا برای تحلیل و مدلسازی رسید. مهندسی داده بسیار شبیه به کار لوله کشی است. به عبارتی دریافت داده از منبع تا رساندن داده به مرحله ای که داده قابل تحلیل باشد، بسیار شبیه به لوله کشی آب، از منبع آب تا محل مصرف نهایی است.
دادهها میتواند از یک یا چند منبع اطلاعاتی استخراج شود و در یک جا تجمیع شوند. به عنوان مثال در بانکها، مشخصات مشتری و تراکنشها میتواند منبع داده محسوب شوند. در واحد بازاریابی، اطلاعات مشتری به همراه تراکنشهای خرید، میتواند منبع اولیه خوبی برای پردازش باشد. در بازار سرمایه نیز، اطلاعات بازارکه از طریق یک مجموعه API فراهم شود، منبع مناسب برای تامین داده است. این مجموعه اطلاعات، خوراک اولیه هر نوع تحلیل میباشد. بنابراین اولین مرحله در این فرآیند تامین دادههای خام است.
در مرحله دوم پالایش و آماده سازی دادهها از اهمیت ویژهای برخوردار است. در این مرحله ممکن است که بر روی دادهها پالایش انجام داد و شاید تغییراتی بر روی این دادهها انجام پذیرد. به عنوان مثال در تحلیل و گروه بندی مشتریان، ممکن است نیاز به سن افراد باشد ولی سال تولد افراد ذخیره شده باشد که در آنجا میبایست تبدیل انجام شود. و یا ممکن است در مجموعه داده دریافتی برخی از اطلاعات ثبت نشده باشد که در اصطلاح به این نوع دادهها دادههای گم شده میگویند و در مواجهه با این دادهها باید تصمیمی گرفته شود. شاید دو منبع اطلاعاتی از دو منبع مختلف در یکدیگر تلفیق شوند و به یک مجموعه داده تبدیل شوند. در اکثر مواقع فرآیند آماده سازی و ذخیره دادهها کاری زمانبر و نیاز به انرژی زیاد دارد.
به طور کلی از داده خام تا دادههای تحلیلی فرآیندی به شکل زیر انجام میشود. در ابتدا دادهها از یک منبع خوانده شده و در یک بانک اطلاعاتی تراکنش محور ذخیره میشوند. بعد از این کار، دادهها از بانک اطلاعاتی تراکنش محور خوانده شده و با استفاده از روشهای مهندسی داده به ساختاری جدید تبدیل و در بانک اطلاعاتی انباره داده ذخیره میشوند. این فرآیند ETL (Extraction,Transformation, Loading) نامیده میشود. دادهها در بانک اطلاعاتی انباره داده به شکل موضوع محور ذخیره میشوند. این نوع بانک اطلاعاتی مبنای اطلاعات تحلیلی است. در این نوع بانک اطلاعاتی، جدولی به نام FACT در مرکز قرار میگیرد که شامل اطلاعات محاسباتی و تحیلی میباشد و مجموعه جداولی موسوم به دیمانسون به این جدول متصل میشوند.
دیمانسیونها قدرت تحلیل چند بعدی را به تحلیلگر میدهند. خروجی انباره داده مکعبهای اطلاعاتی است. مکعبهای اطلاعاتی از ارزشمندترین ساختارهای اطلاعاتی میباشند. از انباره داده میتوان مکعبهای داده مختلفی استخراج کرد. فرآیند استخراج مکعب از دادههای خام را میتوان در تصویر زیر مشاهده کرد:
در شکل بالا، ردیف پایین نحوه ذخیره داده در هر یک از انواع بانکهای اطلاعاتی و خروجی به شکل مکعب را نمایش میدهد. در بانک اطلاعاتی تراکنشی، هر رکورد یک فروش را نمایش میدهد. با استفاده از ETL تغییراتی بر روی داده انجام شده و دادهها به شکل جدید در انباره داده، بارگزاری میشوند. در انباره داده سه جدول کوچک به عنوان جداول دیمانسیون و جدول واسط جدول Fact که تنها داده فروش داده قابل محاسبه در این جدول میباشد. سپس از روی این چهار جدول مکعب دادههای فروش ساخته میشود.
در شکل سمت راست، هر مکعب کوچک نشاندهنده فروش یک شهر-فصل-محصول میباشد. حال تصور کنید که در مکعب داده میخواهیم بدون توجه به محصول و فصل، فروش شهر تهران را محاسبه کنیم. جمع دادههای موجود در سطح بالای مکعب (بالاترین طبقه مکعب) این مقدار را نمایش خواهد داد.
همچنین اگر فروش شهر تهران را به شکل فصلی خواسته شود، مجموع دادههای مکعبهای ردیفی که از تقاطع بالاترین سطح با جلوترین سطح بوجود میآید حاصل میشود. هر یک از مکعبهای کوچک نیز میزان فروش در محصول-شهر-فصل را نمایش میدهد.همانطور که مشاهده میشود با ساختار مکعبهای اطلاعاتی دادههای ارزشمندی حاصل میشود. با حداقل پیمایش در یک مکعب میتوان انواع مختلف گزارش را بنابر نیاز استخراج نمود.
البته میتوان گفت که دادههایی با ابعاد بالاتر را نیز میتوان داشت. ساختار نهایی حاصل شده، ساختاری است که معمولا الگوریتمهای هوشمند نیاز دارند تا با استفاده از آن به ساخت مدل بپردازند. در ادامه به شکل مختصر به موضوع کاربرد هوش مصنوعی در بازارهای مالی پرداخته میشود.
کاربرد هوش مصنوعی در بازارهای مالی
حال که از دادههای خام دریافتی به دادهای پردازش شده رسیدیم، باید دید که این دادههای پردازش شده چگونه مورد استفاده قرار میگیرند تا به افراد در تصمیم گیری کمک کنند. در گذشته تنها تحلیلهای آماری با پیشفرضهای بسیار محکم و سخت، مورد استفاده قرار میگرفت که همواره هیچ مجموعه داده ای عملا تمام این پیش نیازها را نداشت. اما با ظهور هوش مصنوعی و الگوریتمهای هوشمند قضیه فرق کرد. پیشفرضهای آماری( با تمام احترام) دیگر مد نظر نبود. الگوریتمهای هوشمند به پیشفرضها کاری نداشتند و خوراکشان مجموعه داده بود و بر روی مجموعه دادهها پیمایش میکردند و بر روی تجربیات عمل میکردند. همانطور که گفته شد دادههای ورودی نتیجه ثبت تجربیات بود، در نتیجه جواب مساله نیز یکی از تجربیات ثبت شده در دادههای ورودی بود. به عبارتی جواب در مجموعه دادههای ورودی بود و الگوریتم سعی در پیدا کردن بهترین جواب از میان این تجربیات داشت.
این روزهای کلماتی مانند داده کاوی، یادگیری ماشین، یادگیری عمیق، شبکههای عصبی و … همردیف با هوش مصنوعی استفاده میشوند. این مساله باعث ایجاد عدم شفافیت در تعریف هر یک از این موضوعات شده است. از اینرو بهتر است حوزههای هر یک از این کلمات را مشخص کنیم. شکل زیر هر یک از این حوزهها را به طور کامل به تصویر کشیده است. همه این عناوین درذیل سر فصل هوش مصنوعی قرار دارند. همچنین به یاد داشته باشیم که از دید کاربردی، یادگیری ماشین و داده کاوی نیز تا حد زیادی مشابهت دارند.
هوش مصنوعی شامل بسیاری از موضوعات میشود. از مهمترین بخشهای هوش مصنوعی بخش و موضوع یادگیری ماشین است. در یادگیری ماشین به دنبال ماشینی هستیم که به طور خودکار با ارائه مجموعه داده تجربیات، بتواند به صورت خودکار یاد بگیرد و در آینده با استفاده از مدلی که ساخته است، در شرایط جدید به شکل خردمندانه پیش بینی و عمل نماید. به عبارتی همانگونه که یک کودک که با تجربه کردن و سعی خطا به یادگیری موضوعات مثلا راه رفتن میپردازد، الگوریتم هم قرار است همین کار را بکند و با یادگیری تجربیات، در آن حوزه صاحب دانش شود. بنابراین صحبت، یادگیری موضوع اصلی سیستمهای هوشمند است که با روشهای گوناگون تصمیم بر این کار دارند. دانشمندان حوزه یادگیری ماشین به طور کلی روشهای یادگیری را به سه قسمت تقسیم کرده اند:
- روشهای با نظارت : مانند دسته بندی، رگرسیون و تشخیص انحراف
- روشهای بدون نظارت : مانند خوشه بندی، کشف قوانین انجمنی و الگورهای ترکیبی
- روشهای تقویتی: مبتنی تشویق و تنبیه عمل انجامی توسط الگوریتم.
روشهای با نظارت مانند آموزش با یک معلم است. معلم دارای دانش در ان حوزه میباشد و نمونههای جواب گرفته شده را برای دانش آموز تشریح میکند تا دانش اموز توانایی تحلیل پیدا کند. در یادگیری ماشین، مجموعه تجربیات با نتیجه مشخص را در اختیار الگوریتم میگذاریم تا الگوریتم یاد بگیرد که چه اتفای افتاده است. به عنوان مثال در بازار سرمایه، دادههای سه سال مربوط به یک سهم را که شامل قیمت بازگشایی، بالاترین قیمت، پایینترین قیمت، حجم معاملات، به همراه یک خروجی که همان قیمت بسته شده سهم است به الگوریتم میدهیم تا با توجه به این دادههای واقعی مدلی ساخته شود که قیمت سهم در قابهای زمانی مختلف در آینده پیش بینی کند.
از جمله دیگر کاربردهای مربوطه در بازار پول میتوان به مدلسازی پیش بینی رفتار مشتریان دریافت کننده وام، پرداخت. در صورتیکه دادههای اشخاص وام گیرنده قبلی را به شکل ویژگیهای ورودی و خوش حسابی و بدحسابیشان را به عنوان خروجی و نشانه در نظر گرفت، این امکان بوجو.د میاید که مدل پیش بینی ساخت که در مواجهه با شخص درخواست کننده وام در همان ابتدا با احتمال موفقیت بالا، خوش حسابی و یا بدحسابی مشتری را پیش بینی نماید. از کاربردهای دیگر روشهای با نظارت، کشف تقلب است که میتواند به شناسایی دادههای پرت در مجموعه دادهها اعم از صورتهای مالی و یا رفتارهای مالی خارج از عرف اشاره کرد.
اما روشهای بدون نظارت مربوط به مسائلی است که نمونه قبلی از آن موجود نیست و میبایست بر اساس آن به یک دانش رسید و میتواند به شکلی سیال باشد و با ورود دادههای جدید، تغییراتی در مدل ایجاد شود. به عنوان مثال میخواهیم سهامهایی که در مدت زمان مشابه، رفتاری مشابه را انجام میدهند را شناسایی شود و مدلی استخراج شود که تعداد گروههای رفتاری و ویژگیهای ان مشخص شود. به عبارتی در آینده با داشتن این مدل، بتوانیم، ببینیم رفتار سهمی جدید، در کدام گروه قرار میگیرد و ویژگیهای آن به کدام گروه نزدیکتر است. در واقع با دانستن این موضوع میتوان رفتاری متناسب با این سهام داشت.
روشهای تقویتی نیز روش دیگری در حوزه یادگیری ماشین میباشد که بر اساس تشویق و تنبیه نسبت به ساخت مدل و بهینه سازی مدل اقدام میکند و موضوعی جدید و جذاب در حوزه یادگیری ماشین است.
از جمله دیگر کاربردها میتوان به پیش بینی شاخص، بهینه سازی سبد سهام، کشف گرایشها در بازار، بررسی رفتار صنعت و ماردی از این دست اشاره کرد. اما هدف اصلی در بازار سرمایه میتواند در مجموع باید با ساخت مدلهای مختلف و کمینه کردن خطا، و ترکیب مدلها به ایجاد یک استراتژی معاملاتی هوشمند رسید. در مجموع مدلهای طراحی شده و استراتژی تدوین شده، آسان کردن تصمیم گیری برای سرمایه گذار را میسر میسازد. البته این مذلها و استراتژی به عنوان تصمیم یار و توصیه گر میباشند، نهایتا تصمیم به معامله با خود فرد سرمایه گذار خواهد بود.
نقش شرکتهای پردازش اطلاعات در بازارهای مالی
شرکتهای پردازش اطلاعات مالی، ذاتا شرکتهای فناوری اطلاعات محور میباشند که به عنوان یک تسهیلگر میتوانند نقش مهمی در تصمیمات سرمایه گذاران و معامله گران در بازارهای مالی ایفا نمایند. هر چند که این شرکتها از لحاظ قانونی اجازه توصیه به خرید و یا فروش ندارند، ولی هر آنچه که یک معامله گر برای خرید و یا فروش نیاز دارد را به شکل اماده در اختیارش میگذارد. این شرکتها میتوانند با ارائه ابزارها و دادههای با کیفیت، توانایی تصمیم گیری و قدرت تحلیل و شناخت را برای سرمایه گذار و معامله گر فراهم نمایند تا با تصمیمات بهتر بتواند سود بیشتری نسبت به حالت تحلیل سنتی را کسب نماید.
اگر بخواهیم ماموریتی برای شرکتهای پردازش اطلاعات مالی تعریف کنیم، میتوان دو ماموریت به شرح زیر عنوان نمود:
- تامین دادههای خام با کیفیت و همچنین دادههای پردازش شده منتج از دیگر دادهها برای فعالان بازار.
- ساخت مدلها و ابزارهای تصمیم یار برای کمک به شناخت بهتر از بازار.
با توجه به این ماموریتها و حکمرانی داده در همه امور، شرکتهای پردازش داده نقشی استراتژیک و حیاتی در زنجیره خدمات نهادهای مالی دارند و میتوانند با بکارگیری ابزارهای هوش مصنوعی، نقشی کلیدی، در کشور ما این حوزه نوپا است و نیاز به حمایت دارد تا به بلوغ لازم در این حیطه برسد و جایگاه خود را پیدا نماید. بی شک در آینده ای نزدیک خرید و فروش به شکل سنتی، دیگر توجیهی نخواهد داشت و ماشینها بدون تحت تاثیر احساسات قرار گرفتن و بروز رفتارهای هیجانی و با استراتژیهایی که به شکل مداوم و خودکار بهینه میشوند، معاملات را انجام خواهند داد. با توجه به این موضوع شرکتهای پردازش اطلاعات وظایفی سنگین و خطیری در این حوزه خواهند داشت و با ارائه این ای دست ابزارها میتوانند باعث کارآیی بازار شود.
true
false
false
false