توسعه فناوری اطلاعات منجر به تولید دادههای عظیم در صنایع مختلف از جمله صنعت مخابرات شده است. ما در یک جهان متصل و دیجیتال زندگی میکنیم و حجم دادههای تبادل شده میان ما بسیار زیاد است. در عصر کلاندادهها، اپراتورهای مخابراتی با حجم زیادی از دادهها مواجه هستند که با بهکارگیری داده کاوی و تحلیل دادهها میتوانند اطلاعات با ارزشی را از میان کلاندادههای تولید شده در این صنعت استخراج کنند. حجم دادهای که هر روز توسط مشترکین و سیستمهای اپراتوری تولید میشود، آنقدر بزرگ است که میتوان آن را به یک معدن بزرگ الماس تاریک شده تشبیه کرد که برای یافتن الماسها (دانش) باید آن را کاوید. در این مطالعه ابتدا به معرفی طرحهای تحلیل کلان دادهها و چالشها و مزایای آن پرداخته میشود. سپس یکی از معماریهای انجام شده برای تحلیل کلان دادههای صنعت مخابرات را معرفی خواهیم کرد. در این معماری، دادههای سیستم پشتیانی عملیات و سیستم پشتیبانی کسبوکار اپراتورها را جمعآوری شده و بر اساس آنها پروفایل مشترکین را ترسیم میشود و نهایتا رفتار مشترکین تحلیل میشود.
کلیدواژه: کلانداده، دادهکاوی، پروفایل مشترکین، تحلیل رفتار مشترکین.
اپراتورهای مخابراتی از جمله غنیترین شرکتها از نظر تولید دادههای کلان هستند. با این حال هنوز اپراتورها روشهای موثر برای مدیریت دادهها، توسعه سرویسهای ارزش افزوده بر دادهها و سرمایهگذاری برای تولید دادهها ندارند. سوال مهم این است اپراتورها چگونه از این دادهها برای کاهش هزینههای عملیاتی، کاهش هزینهها و نرخ ریزش[1]، ارائه تجربه شخصیسازی به مشترکین و توسعه منابع جدید درآمدی استفاده میکنند. البته پاسخ به این سوال کار سادهای نیست.
در طول دهه گذشته اپراتورهای مخابراتی پیشرو، پروژههای در حوزه تحلیل کلان دادههای مخابراتی آغاز کرده اند اما نتوانستهاند به نتایج مورد انتظار دست یابند. مک کینزی، ۸۰ اپراتور مخابراتی که بر پلتفرمهای تحلیل کلان دادهها سرمایهگذاری کرده اند را بررسی کرده است و کمتر از ۸ درصد آنها بیشتر از ۱۰ درصد سود کردهاند [1]. در سال ۲۰۱۵ گارتنر پیشبینی کرد که ۶۰ درصد پروژههای تحلیل کلان دادهها به دلیل عدم مدیریت صحیح و فقدان چشمانداز درست و کمبود مهارتهای ذخیره داده با شکست مواجه خواهند شد [2]. در مطالعه دیگری [3]، محققان دریافتند که بازده سرمایهگذاری در پروژههای تحلیل کلان دادهها به شدت میتواند تحت تاثیر سه موضوع باشد: اول، انتخاب معماری مناسب که بر عملکرد و مقیاسپذیری راهحل اثر دارد و دوم، مالکیت پروژهها که بهتر است از بالاترین سطح سازمانها باشد. نهایتا، مدل حاکمیت که باید تمام جنبههای مربوط به حاکمیت پروژه و داده را پوشش دهد. البته هنوز هم فقدان دستورالعملهای حاکم بر پروژهها و طرحهای تحلیل کلان دادهها و عدم وجود معماری مرجع برای پروژههای مخابراتی پابرجاست [4].
در این مقاله ابتدا اشاره مختصری به تاریخچه تحلیل دادهها در صنعت مخابرات میشود. سپس چالشها و فرصتهایی که تحلیل کلان دادهها برای اپراتورهای مخابراتی ایجاد میکند، بررسی میشود. نهایتا یک مدل معماری برای انجام پروژههای تحلیل کلان دادههای مخابراتی معرفی و تشریح میشود.
چالشهایی که اپراتورها در کار با کلان دادهها با آن مواجه هستند: اپراتورهای مخابراتی در برخورد با هجوم دادههای تولید شده توسط دستگاههای متصل، رفتارهای مشترکین، شبکههای رسانههای اجتماعی، سوابق دادههای تماس، پورتالهای دولتی و اطلاعات صورتحساب با مشکلاتی مواجه هستند.
بر اساس مطالعه [5] در رابطه با اجرای تجزیه و تحلیل دادههای بزرگ در آفریقای جنوبی، چالشها در سه بخش فناوری[2]، سازمانی[3] و محیطی[4]طبقهبندی شدهاند. از آنجا که چالشهای فناوری و سازمانی بیشترین تاثیر را در اجرای پروژههای تحلیل کلاندادهها دارند، در این مطالعه، به بررسی این دو دسته از چالشها پرداخته میشود.

چالشهای فناوری
عدم وجود یک معماری مرجع برای اجرای پروژههای تحلیل کلان دادههای مخابراتی: طراحی معماری برای تحلیل کلان دادهها میتواند یک بازی فکری برای معماران داده باشد، زیرا نیاز به ادغام و تجمیع منابع دادههای مختلف دارد. در واقع، یکپارچهسازی دادهها به دلیل وجود منابع و سیستمهای اطلاعاتی سازمانی اپراتورها که بر توسعه محصولات و خدمات متمرکز است، یک چالش بزرگ است. گردآوردن این قطعات داده در یک پلتفرم متمرکز میتواند یک کار چالش برانگیز باشد [5].
کیفیت بد داده: طبق نظرسنجی McKinsey که بر روی 273 اپراتور مخابراتی در سراسر جهان انجام شده [1]، اعلام شد که دلیل اصلی شکست پروژههای تحلیل کلان دادهها به دلیل کیفیت بد داده است. عوامل موثر در این امر را میتوان با تعداد زیادی از سیستمها و عملکردهای موجود در مجموعه راهحلهای اپراتورهای مخابراتی و با حجم دادههای مدیریت شده توضیح داد.
بهرهوری و ذخیرهسازی: افزایش تقاضای ترافیک داده که توسط رسانههای اجتماعی، برنامههای کاربردی تلفن همراه هدایت میشود، اپراتورها را مجبور به یافتن راههای جدیدی برای مدیریت و استفاده از دادههای خود میکند. در واقع راهحلهای سنتی مبتنی بر پایگاههای داده مرسوم (RDBMS[5])، محدودیتهای زیادی از نظر عملکرد، ذخیرهسازی و مدیریت انواع مختلف دادهها، مخصوصا دادههای بدون ساختار، که خارج از حوزه RDBMS است، ایجاد میکنند.
چالشهای سازمانی
مالکیت و کنترل[6]: در بررسیهای انجام شده [6]، نشان داده شده است که اغلب مالک پروژههای تحلیل کلان دادهها، تیم هوش تجاری[7] است. اکثر سازمانها تا حد امکان عملکردهای هوش تجاری و انبار داده[8] را از طریق یک تیم فنی واحد رهبری میکنند که پیکربندی مناسبی برای پروژههای تحلیل کلان داده نیست. در واقع پروژههای مرتبط با تحلیل کلان دادهها به عنوان یک ابتکار فناوری در این تیمها در نظر گرفته نمیشود، بلکه بیشتر به عنوان یک برنامه تجاری که نیاز به دانش فنی دارد، در نظر گرفته میشود.
کمبود مهارت[9]: در واقع، چالش برانگیزترین موضوع در تعریف و اجرای پروژههای تحلیل کلان دادهها، یافتن یک تیم واجد شرایط است. در مقایسه با هوش تجاری، که بیشتر سازمانها آن را در طول چندین دهه توسعه داده اند، تحلیل کلان دادهها به عنوان فناوری جدید در نظر گرفته میشود. تجزیه و تحلیل پیشرفته دادهها به متخصصانی با دانش عمیق در حوزههای مختلف، از علم داده، قوانین حفظ حریم خصوصی و نیز درک کسبوکار مخابراتی نیاز دارد.
فرصتهایی که کلان داده برای اپراتور فراهم میکند
در صنعت مخابرات، تحلیل کلان داده یک تغییر دهنده بازی محسوب میشود، زیرا به اپراتورها این فرصت را میدهد تا از مجموعه دادههای جدید بهرهبرداری کنند و اطلاعات ارزشمندی را برای درک بهتر رفتار مشترکین استخراج کنند. در نتیجه، اپراتورها پیشنهادات هدفمندتری را ارائه میدهند، در نتیجه درآمدها را بهبود میبخشند و هزینهها را کاهش میدهند.
بدون شک راهحلهای مبتنی بر تحلیل کلان دادهها ، صرف نظر از سرعت تولید، ابزاری برای پردازش انواع مختلف دادهها (ساختاریافته و بدون ساختار) برای اپراتورهای مخابراتی [7] فراهم میکند. این دادهها را میتوان در قالب پروفایل مشتری عرضه کرد. ارائهدهندگان خدمات ارتباطی[10] میتوانند پروفایلهای مشتریان را بررسی کنند، مشترکین را براساس رفتارشان دستهبندی کنند و شاخصهای مشتری مناسب را توسعه دهند. علاوه بر این، با کمک تحلیل کلان دادههای مخابراتی میتوان برنامههای تشخیص تقلب را توسعه داد.
زمینههای دیگری که با تحلیل کلان دادهها امکانپذیر است، عبارتاند از:
- بهبود کیفیت خدمات: اپراتورها میتوانند بینش بهتری در مورد شبکههای خود به دست آورند تا آنها را پایدار، بهینه و مقیاسپذیر کنند.
- کیفیت تجربه[11]را میتوان در هر نقطه تماس از طریق خدمات با کارایی بالا، بازخورد سریع و پیشنهادات شخصی بهبود بخشید.
- رصد برخط دادههای تماس[12]برای تشخیص رفتارهای غیرمعمول
- مراقبت پیشگیرانه شبکه و تشخیص ناهنجاری
- تحلیل ترافیک شبکه همراه با تجزیه و تحلیل بلادرنگ نرخ تماس از دست رفته[13]، برای ارائه بهینهسازی مسیریابی تماس.
- تولید خودکار پیشنهادات بر اساس ترجیحات مشتریان
- استفاده از رسانههای اجتماعی و دادههای وب و تلفیق آنها با ایدههای بازاریابی با هدف دستیابی به بازگشت سرمایه بهتر از طریق کمپینهای بازاریابی
- معماری تحلیل کلان دادهها در اپراتور
مدل ارائهشده در اپراتورهای مخابراتی برای تحلیل کلاندادهها
گام اول: جمعآوری دادهها
دادههای تولید شده در سامانه پشتیبانی عملیات و سامانه پشتیبانی کسبوکار در یک بستر کلانداده تجمیع میشوند.
گام دوم: تولید پروفایل مشترکین
مهمترین اقدامی که در تولید پروفایل مشترکین انجام میشود، برچسب زدن آنها است. هدف از برچسب زدن دستهبندی کاربران و تبدیل آن به رکوردهای قابل فهم برای ماشین است[8-10]. علاوه بر این میتوان از الگوریتمهای خوشهبندی برای تحلیل پراکندگی سن و جنسیت مشترکین استفاده کرد. بر اساس نتایج دادهکاوی برچسب و شاخصهای مناسب، به مشترکین نسبت داده میشود. برچسبها نشاندهنده علاقه، ترجیح و تقاضای کاربران برای محتوا است و شاخصها، نشاندهنده سطح علاقه، سطح تقاضا و احتمال خرید است. مدلسازی مشترکین بر اساس برچسب شامل سه عنصر زمان، مکان و شخصیت است. دادههای کاربران را در این مطالعه در دو دسته اصلی طبقهبندی میکنیم.
دسته اول شامل دادههای ایستا است. منظور از دادههای ایستا آن دسته از اطلاعات کاربران است که با تغییر رفتار کاربر تغییر نمیکند، مانند اطلاعات پایهای کاربر (وابسته به شبکه اپراتور نیست) و اطلاعات شبکهای کاربر. این دسته از دادهها تغییرات کم و آهستهای در زمان دارند (نام کاربر، جنسیت کاربر، نوع سیمکارت، نوع شبکه، …).
دسته دوم شامل دادههای پویا مرتبط با کاربر است. دادههای پویا به آن دسته از دادههایی اطلاق میشود که به تغییر رفتار کاربر اشاره دارد. برای نمونه هزینه قبض هر کاربر براساس تعداد پیامها، زمان مکالمه، میزان ترافیک مورد استفاده و سرویسهای ارزشافزوده در اختیار کاربر است که وابسته به رفتار کاربر در آن ماه است. در واقع ویژگیهای رفتاری با ترجیحات کاربران برای استفاده از برنامهها و سرویسها در زمان و مکانهای مختلف باعث تمایز در دادههای پویا در بازههای زمانی مختلف میشود. این دادهها به صورت روزانه و ماهانه و بدون نظم مشخصی تغییر میکنند. بنابراین برای آشکارسازی رفتار مشترکین باید کلان دادهها را تحلیل کرد. شکل ۱، نمونهای از دستهبندی دادههای کاربران را در اپراتورهای مخابراتی نشان میدهد.

شکل 1: نمونهای از دستهبندی دادههای مشترکین
گام سوم: تحلیل خط سیر مشترکین
بعد از جمعآوری دادههای مشترکین و دستهبندی آنها بر اساس پروفایل آنها، گام بعد تحلیل رفتار و خط سیر[14] مشترکین است. از آنجا که منابع داده مخابراتی از نظر گستره جغرافیایی، بازه زمانی و دقت بر صنایع دیگر برتری دارد، از طریق تجزیه و تحلیل دادههای شبکهها میتوان به این سوال پاسخ داد که چه کسی، چه زمانی، کجا و چه چیزی را تجربه[15] کرده است . پاسخ به این سوال شامل چه کسی (سطح کاربر، جنسیت و سن کاربر، ARPU، کسب و کار و ..)، مکان (نقاط تجاری، مسیر و ..) و زمان، چه چیزی (کسب و کار، حجم کسب و کار، برنامه کاربردی و ..) و تجربه (ادراک کاربر، ادراک کسب و کار طبقه بندی شده و ..) است. در نهایت در این گام یک آرشیو پویا از هر کاربر تشکیل میشود که به رکوردهای خط سیر کاربران مشهور است. رکوردهای خط سیر کاربران فعالیتهای آنها را ثبت میکند که نشاندهنده گرایش، ترجیحات و الگوی رفتاری فرد است.
امروزه کلان دادهها به عنوان روند کلی توسعه در نظر گرفته میشوند. بنابراین، فرآیند توسعه «از اطلاعات دادهها به دانش و نهایتا تا هوشمندی» تنها با جمعآوری و ادغام مسیرهای فردی و انجام تجزیه و تحلیل عمیق و دادهکاوی [11] قابل انجام است.
گام چهارم: تحلیل رفتار مشترکین
تحلیل رفتار مشترکین مهم ترین تحلیل از دیدگاه داده کاوی است [12]. به این منظور لازم است مشخصههای پنهان رفتاری کاربر و ترجیحات آنها برای بهبود کیفیت سرویسها، بهبود دید کاربران و ایجاد مزیتهای رقابتی جدی برای اپراتورها بررسی گردد.
شرکتها راهحلهای مختلفی را برای جمعآوری دادهها و تجزیه و تحلیل ترجیحات رفتاری کاربر ارائه میکنند [13]. به عنوان مثال ارائهدهندگان خدمات نرمافزاری بر بستر وب، از رفتارهای کلیک کاربران در مرورگر وب استفاده میکنند. ارائهدهندگان خدمات وب، سابقه مرور کاربران در وب سایتها را به عنوان اساس تحلیل رفتار کاربران در نظر میگیرند. اپراتورهای مخابراتی رکوردهای دسترسی به شبکه را برای تحلیل رفتار مشترکین استفاده میکنند. در مقایسه با ارائهدهندگان سرویسهای نرمافزاری و ارائهدهندگان خدمات وب، اپراتورها طیف وسیعتری از دادههای رفتار خدمات را ثبت میکنند. بنابراین تحلیل رفتار و ترجیحات کاربر براساس تجزیه و تحلیل آماری دادههای اپراتور، جامعتر است. تحلیل رفتار مشترکین براساس دادههای اپراتور در چهار بعد قابل تعریف است که در شکل ۲، نشان داده شده است.

شکل ۲: ابعاد مورد استفاده در معماری تحلیل کلاندادهها
ترجیحات زمانی: با توجه به دادههای مربوط به خدمات داده و تماس در یک دوره زمانی پیشفرض، خلاصه میشوند (به عنوان مثال، صبح زود، صبح، ظهر، بعدازظهر، عصر، اواخر وقت، شب، نیمه شب)
ترجیحات مکانی: براساس اطلاعات مکانی که تجهیزات رادیویی در خدمات تماس و داده تولید میکنند، میتوان سرویسدهی در سطوح مختلف تکنولوژی (2/3/4G) را به مشترکین ارزیابی کرد.
ترجیحات پایانهای: انتخاب برند، مدل، نوع و قیمت گوشیهایی که مشترکین استفاده میکند، یکی دیگر از عواملی است که در رفتارشناسی مشترکین موثر است.
ترجیحات کسبوکاری: براساس انواع سرویسها و برنامه کاربردی مرورگر، ابزار دانلود، پیامرسانها و غیره میتوان میزان نفوذ استفاده از ابزارهای مختلف در کسبوکارها را تحلیل کرد.
نتیجهگیری
در این مطالعه به تحلیل کلاندادههای صنعت مخابرات پرداختیم. چالشها و فرصتهایی که اپراتورهای مخابراتی به واسطه این موضوع با آن مواجه هستند را برشمردیم و نهایتا یک معماری نوین برای تحلیل کلان دادههای مخابراتی را معرفی کردیم. همانطور که اشاره شد در این معماری، دادههای OSS و BSS جمعآوری میشوند. براساس این دادهها پروفایل هر کاربر ترسیم میشود. سپس با استفاده از نتایج تحلیل پروفایل و خط سیر مشترکین و رفتار مشترک در چهار بعد زمان، مکان، ترمینال و کسبوکار تحلیل میشود.
منابع
[1] Bughin, Jacques. “Reaping the benefits of big data in telecom.” Journal of Big Data 3.1 (2016): 1-17.
[2] Goasduff, L. “Gartner says business intelligence and analytics leaders must focus on mindsets and culture to kick start advanced analytics.” Retrieved on May 12 (2015): 2017.
[3] Kastouni, Mohamed Zouheir, and Ayoub Ait Lahcen. “Big data analytics in telecommunications: Governance, architecture and use cases.” Journal of King Saud University-Computer and Information Sciences (2020).
[4] Mahmoud, Magdi S., and Mutaz M. Hamdan. “Fundamental issues in networked control systems.” IEEE/CAA Journal of Automatica Sinica 5.5 (2018): 902-922.
[5] Malaka, Iman, and Irwin Brown. “Challenges to the organisational adoption of big data analytics: A case study in the South African telecommunications industry.” Proceedings of the 2015 annual research conference on South African institute of computer scientists and information technologists. 2015.
[6] Russom, Philip. “Big data analytics.” TDWI best practices report, fourth quarter 19.4 (2011): 1-34.
[7] Zhang, Yong, et al. “A Novel Big Data Assisted Analysis Architecture for Telecom Operator.” 2019 IEEE International Conferences on Ubiquitous Computing & Communications (IUCC) and Data Science and Computational Intelligence (DSCI) and Smart Computing, Networking and Services (SmartCNS). IEEE, 2019.
[8] Xu, Lexi, et al. “Telecom big data based user offloading self-optimisation in heterogeneous relay cellular systems.” International Journal of Distributed Systems and Technologies (IJDST) 8.2 (2017): 27-46.
[9] Shao, Guanglu, et al. “Telecom big data based user analysis and application in telecom industry.” International Conference on 5G for Future Wireless Networks. Springer, Cham, 2017.
[10] Liu, Yu, et al. “A novel power control mechanism based on interference estimation in LTE cellular networks.” 2016 16th International Symposium on Communications and Information Technologies (ISCIT). IEEE, 2016.
[11] Chao, Kun, et al. “A novel big data based telecom user value evaluation method.” 1st International Congress on Signal and Information Processing Networking and Computers. 2016.
[12] Cheng, Xinzhou, et al. “A novel big data based telecom operation architecture.” 1st International Conference on Signal and Information Processing, Networking and Computers. 2016.
[13] Cheng, X. “Digging Big Data: Telecom Data Description, Mining and Application.” China Machine Press (2019).
پینوشت
[1] Churn
[2] Technological
[3] Organizational
[4] Environmental
[5] Relational Database Management System
[6] Ownership and Control
[7] Business Intelligent (BI)
[8] Datawarehouse (DWT)
[9] Skill Shortage
[10] Communication Service Provider
[11] Quality of experience
[12] Call Data Record
[13] Call Drop Rate
[14] Trajectory
[15] Who, When, Where, What and Experience (4W&E)


