تهدید حریم خصوصی کاربران با دادههای کلان
گروه دانش و فن
داده شامل اطلاعات است؛ اما این همه ماجرا نیست. جزئیات یک حادثه یا اخباری درباره سلامت انسان دادهای نیست که ما با آن سروکار داشته باشیم. وقتی ما از داده صحبت میکنیم درواقع منظورمان مجموعه داده، سازماندهی و ذخیرهسازی آن است.
کلان داده مجموعه بسیار بزرگی از دادهها است که ابزارهای سنتی ما برای مدیریت این اطلاعات به کار نمیآیند. کلان داده میتواند اشکال مختلفی داشته باشد.
رایانههای شخصی ما بطور کلی توانایی مدیریت حجم کمی از دادهها را دارند. کل اطلاعاتی را که میتوانید وارد یک کامپیوتر کنید، در نظر بگیرید؛ در عین حال نرمافزارهای پایگاهداده قابلیت مدیریت حجمهای بزرگتری از اطلاعات را دارند. این ابزارها میتوانند روی دادههای یک درایو سخت قرار بگیرند؛ البته ممکن است به قفسههایی شامل نوتبوکها و پوشهها نیاز داشته باشند. اما این ابزارها برای رسیدگی به کل حجم اطلاعاتی که ما به عنوان کلان داده به آنها اشاره میکنیم کافی نیستند. به همین خاطر روشهای جدیدی توسعه یافتهاند.
محاسبات ابری کارها را از کامپیوترهای ما روی سرورهای راه دور تخلیه میکند. به همین دلیل روشهای زیادی برای دسترسی و استفاده از اطلاعات وجود دارد. اینترنتی که در حال حاضر میشناسید اینترنت افراد است، جایی که در آن مردم از طریق ماشینهایی تسهیلکننده با یکدیگر ارتباط برقرار میکنند. به عنوان نمونهای از این تعاملات، تصور کنید شما سایتی که دیگران طراحی کردهاند را بازدید میکنید و یا متنی که دیگران در سایت تایپ کردهاند میخوانید.اینترنت اشیاء جایی است که در آن اشیاء بدون دخالت بشر مستقیما با یکدیگر ارتباط برقرار میکنند؛ مثلا یک دستگاهی که بر آبوهوا نظارت میکند را در نظر بگیرید؛ ترموستاتی هوشمند به این اطلاعات دسترسی پیدا میکند و درجه حرارت منزل شما را تنظیم میکند. کلان داده و اینترنت اشیاء کاملا به یکدیگر وابستهاند. سازمانها باید بدانند با حجم انبوهی از اطلاعاتی که جمعآوری میشود، چهکاری باید انجام دهند. اشیاء از طریق اینترنت و به لطف دادههایی که در دسترسشان است میتوانند خودشان اقداماتی را صورت بدهند. هرچه دستگاههای بیشتری به این روش عمل میکنند دادههای بیشتری تولید میشود.
منظور از یادگیری ماشین در واقع توانایی یادگیری کامپیوتر بر مبنای دادهها است؛ همین توانایی اساس شکلگیری وضعیتهای مختلف رادیو اینترنتی پاندورا به سبک مخصوص شما است. همچنین یادگیری ماشین در پشت پرده پیشنهادات محتوای یوتیوب و نتفلیکس قرار دارد.
این پیشبینیها مبتنی بر الگوریتمها هستند. الگوریتم جستوجوی گوگل و نیز الگوریتمی که تعیین میکند چه چیزی در فید خبری فیسبوک مشاهده کردهاید همگی مبتنی بر توانایی یادگیری ماشین هستند.
اما اینها بخش کوچکی از چگونگی تاثیر یادگیری ماشین بر زندگی روزمره ما هستند.
هوش مصنوعی گام بعدی پس از یادگیری ماشین است. در هوش مصنوعی نه تنها یادگیری کامپیوتر باز دادهها وجود دارد، بلکه کامپیوتر از این اطلاعات در راستای تصمیمگیری متکی به خود و شکلدهی رفتار خودش استفاده میکند. مایکروسافت و گوگل نمونههایی از تلاش برای ساخت رباتهای انسانی هستند؛ فیسبوک نیز هوش مصنوعی را برای کمک به جلوگیری از خودکشی به کار گرفته است. فناوری به سرعت در حال پیشرفت است، تا جایی که نمونههای متعددی وجود دارد که «تفکر کردنِ کامپیوتر» بهتر از نوع بشری آن عمل میکند.
علم تجزیه و تحلیل کلان داده چیست؟
منابع کلان داده به خودی خود هیچگونه اطلاعاتی را در اختیار ما نمیگذارند، در واقع شخصی باید باشد که مفهوم این اطلاعات را دریابد. در واقع کل کاری که در تجزیه و تحلیل کلان داده باید انجام شود به این صورت است: بررسی حجم زیادی از اطلاعات غیر قابل فهم و سپس فهمیدن آنچه میتوان از آن استخراج کرد.
شرکتها در زمینههای مختلف برای ارایه روشهای تحلیل مخصوص خودشان در حوزه کلان دادهها با یکدیگر رقابت میکنند و به همین ترتیب کلان دادهها روی زندگی شما تاثیر میگذارند، حتی اگر یک مخالف تکنولوژی دنیای مدرن باشید. اما چرا به کلان دادهها روی آوردهایم؟ به این علت که با بینش صحیح، کلان دادهها مزایای زیادی دارند.
کلان داده در تجارت الکترونیک
بازاریابی مدرن به دادهها وابستگی شدیدی دارد و ما هم با هر خریدی که انجام میدهیم اطلاعات زیادی تولید میکنیم. در این رابطه کلان داده وعدههای بسیاری به حوزه بازاریابی داده است که اصلیترین آنها پاسخ به دو نیاز اصلی است.
اول به کمک آنها میتوان درباره شخص خریدار، زمان، مکان، نوع و قیمت خرید اطلاعات کسب کرد؛ و مورد دوم به دست آوردن ارتباطی منطقی بین محصولاتی که مشتریان میبینند یا در موردشان میخوانند یا میشنوند و در نهایت چیزی که خریداری میکنند. برخی فروشگاهها با ردیابی کارتهای اعتباری و وفاداری مشتریان از طریق دوربین یا ردیابی تلفنشان میفهمند کدام بخش از فروشگاه بیشتر توجه آنها را جلب کرده است. مشتریان قبل از خرید باید به صورت آنلاین حسابهایی ایجاد کنند که این کار به سایتها اجازه میدهد نه تنها خریدهای آنها بلکه هر قلمی که آنها مشاهده میکنند را نیز ردیابی کنند.
در عوض تکنیکهایی مثل هدفگیری و شناسایی مشتری که نیمی از بودجه بازاریابی را هدر میدهند و تنها برای کوتاهمدت اثربخش هستند، پاسخ به این دو نیاز بسیار اثربخشتر است.
برای پاسخ به این نیازها، بازاریابها باید با استفاده از کلان داده از طریق تشخیص الگوی مصرف مشتری و شناخت علاقهمندیها و عادات مصرف، خرید بعدی وی را پیشبینی کنند. در واقع فروشگاهها طرحهای خود را بر مبنای علاقه و رفتار مشتریان پایهگذاری میکنند تا شرایط همکاری بهتری را در تجارت پیدا کنند. فروشندگان آنلاین بر مبنای اطلاعات جمعیتشناختی و سایر معیارها درباره چیزی که ما میخواهیم ببینیم تصمیم میگیرند. فروشگاههای جدید غیر مجازی آمازون نمونهای از ادغام دو دنیا هستند. نیازهای بزرگی وجود دارند که از طریق نظارت بر علایق و رفتار آنلاین ما به وجود میآیند. گوگل و فیسبوک غولهای سودآور تکنولوژی هستند که دلیل آن توانایی آنها در فروش تبلیغات است که نسبت به پلتفرمها و روشهای تبلیغاتی دیگر بهتر میتوانند گروه مصرفکنندگان به خصوص را مورد هدف قرار بدهند؛ این قابلیت آنها به لطف اطلاعاتی است که برای استفاده از سرویسهای آنها ارایه میکنیم.
حریم خصوصی در کلان داده
کاهش حریم خصوصی از جمله معایب بزرگ کلان داده است؛ اکثریت مردم بیشتر از هر زمان دیگری در تاریخچه بشری درباره ما اطلاعات دارند. نه تنها پیدا کردن محل زندگی ما، بلکه دانستن در مورد جایی که میرویم، شخصی را که دوست داریم، نحوه زندگی ما، و تفکرات ما نیز آسان است. این موضوع باعث میشود که مسائل شخصی و اجتماعی بیشتر در معرض دستکاری قرار بگیرند. ممکن است ما فریب بخوریم و رمز و شماره کارت اعتباری خود را از دست بدهیم یا تحت تاثیر قرار بگیریم تا به کاندیداهایی رای بدهیم که تمایلی به حمایت از آنها نداریم. دادههای بیشتر راههای بیشتری برای تبلیغکنندگان و شرکتهای رسانهای فراهم میکند تا میلها و ارزشهای ما را شکل دهند. نسبت به گذشته اطلاعات و دادههای بیشتری درباره ما وجود دارد و این دادهها در مکانهای بیشتری نگهداری میشوند و این مساله باعث میشود اهداف بیشتری در معرض حمله قرار بگیرند. در حال حاضر سرقت دادههای ما به صورت غیر قابل کنترل و بی وقفه رخ میدهد. حتی شرکتهایی که روند درستی برای حفاظت از دادههای ما در مقابل حملات خارجی دارند اغلب خودشان فعالیتهای مشکوکی روی دادههای ما انجام میدهند، همانند چیزی که در فیسبوک شاهد بودیم. مساله ریسک بعدی پیشبینیهایی است که افراد از طریق اطلاعات کلان داده انجام میدهند. مثلا آیا برای بیمه سلامتی افرادی که عادتهای غذایی ناسالم دارند بیشتر هزینه کنیم؟ آیا باید امنیت و آرامش را در مناطقی که پیشبینی میکنیم افزایش بدهیم؟ آیا قیمت برای خریداران آنلاین که در مناطق فقیر زندگی میکنند افزایش مییابد؟
یافتن راههایی برای حفاظت از داده، احترام به حریم خصوصی و حفظ ارزشهایمان به صورت چالشهایی مداوم با روندی در جهت کلان دادهها ادامه خواهد داشت.