جمع سپاری داده

جمع‌سپاری داده، پیش‌بینی تورم اقتصادی به‌وسیلۀ عکاسی از پمپ بنزین

یه مطلب از کتاب «همه دروغ می‌گویند»[۱] می‌بینیم و بعد می‌ریم سراغ داستانِ جمع سپاری داده[۲] که یکی از مفاهیم «اقتصاد داده»[۳] حساب می‌شه، و بعدش کمی در مورد مشکلاتش حرف می‌زنیم.

توی این ویدیو پروژۀ مایکروسافت رو توضیح دادم که بر خلاف جمع‌سپاری داده، می‌خواد همینجوری به مردم پول بده.

پیش‌بینی تولید و تورم اقتصادی

ریسینگر خاطرنشان کرد که نیجریه در آوریل ۲۰۱۴ پیش‌بینی تولید ناخالص داخلی[۴] خود را به روز کرده و بخش‌‌هایی که احتمالاً قبلاً از آنها غافل شده بوده است را در نظر گرفته، تولید ناخالص پیش‌بینی شده‌ی این کشور ۹۰ درصد بالاتر رفت!

ریسینگر با صدایی که آرام آرام بلند ‌‌می‌شد گفت:«آنها بزرگ‌ترین اقتصاد در آفریقا هستند. ما حتی اساسی‌ترین چیزهای لازم را هم در مورد آن کشور نمی‌دانیم.» او ‌‌می‌خواست راهی بیابد تا دید دقیق‌تری نسبت به عملکرد اقتصادی پیدا کند.

راه حل او یک مثال خوب است تا به درک جدیدی از اینکه چه چیزی داده است برسیم و ارزش این درک جدید را دریابیم.

ریسینگر شرکتی با نام پرمیس[۵] پیدا کرد که در کشورهای در حال توسعه گروهی کارمند دارای گوشی هوشمند برای خود استخدام کرده و از کارمندان خود ‌‌می‌خواهد که از اتفاقات غیرعادی و جالبی که ‌‌می‌تواند ارزش اقتصادی داشته باشد عکس بگیرند.

کارمندان ممکن است یکسری عکس فوری از بیرون پمپ بنزین یا مخازن میوه در سوپرمارکت‌ها بگیرند. آنها از این مکان بارها و بارها عکس ‌‌می‌گیرند. آن وقت این عکس‌ها برای پرمیس فرستاده ‌‌می‌شوند و در آنجا گروه دوم کارمندان که دانشمندان کامپیوتر هستند این عکس‌‌ها را به اطلاعات تبدیل ‌‌می‌کنند.

تحلیل‌گران این شرکت ‌‌می‌توانند همه چیز را از طول صف پمپ بنزین تا تعداد سیب‌های موجود در سوپرمارکت تا رسیدگی این سیب‌ها تا قیمت روی سبدهای سیب را کدبندی کنند.

پرمیس ‌‌می‌تواند از عکس‌‌هایی که از فعالیت‌های گوناگون گرفته شده استفاده کند و با گذاشتن این داده‌‌ها در کنار هم تولید و تورم اقتصادی را پیش‌بینی کند.

درکشورهای درحال توسعه صف‌های طولانی پمپ بنزین یک شاخص پیشگام در پیش‌بینی وقوع مشکلات اقتصادی‌اند. عدم دسترسی به میوه یا نرسیده بودن آن نیز از نشانه‌های مشکلات اقتصادی است.

عکس‌های محلی شرکت پرمیس در چین به محققین کمک کرد که پیش از انتشار داده‌های رسمی، متوجه افزایش قیمت خوراکی‌ها در سال ۲۰۱۱ و کاهش قیمت خوراکی‌ها در سال ۲۰۱۲ شوند.

پرمیس این اطلاعات را به بانک‌ها یا صندوق‌های پوشش ریسک ‌‌می‌فروشد و با بانک جهانی همکاری ‌‌می‌کند. مانند بسیاری از ایده‌‌های خوب، پرمیس مانند باقیات‌الصالحات است که همواره از آن خیر و نیکی به پا ‌‌می‌خیزد.

بانک جهانی به تازگی به حجم اقتصاد زیرزمینی سیگار در فیلیپین علاقه نشان داد. آنها به خصوص خواستند تأثیر تلاش‌های اخیر دولت که شامل حمله‌های تصادفی برای سختگیری بر تولیدکننده‌‌های سیگار قاچاق را ببینند.

ایده‌ی هوشمندانه‌ی پرمیس چه بود؟ از کارمندانش خواست تا از جعبه‌های سیگار در خیابان عکس بگیرند و ببیند که چند تا از آنها برچسب مالیاتی (که بر روی تما‌‌می ‌سیگارهای قانونی هست) را دارند.

آنها فهمیدند که این بخش از اقتصاد زیرزمینی که در سال ۲۰۱۵ بزرگ بود به طور قابل توجهی در سال ۲۰۱۶ کوچک تر شده و تلاش‌‌های دولت ثمربخش بوده است.[۶]

نویسنده‌ها توی این فصل از کتاب سعی دارن ابعاد جدیدی از اشکال جدید داده رو نشون بدن و ذهنیت قدیمی که فقط اسم و فامیل اشخاص یا مثلاً تجزیه و تحلیل چهره به عنوان داده‌های با ارزش محسوب می‌شه رو تغییر بدن.

طبق این بحث، تقریباً هر داده‌ای که به مقدار زیاد وجود داشته باشه قابلیت اینو داره تا چیزهایی که تو نگاه اول کاملاً با اون داده‌ها غیر مرتبطه پیش‌بینی کنه و به بینش جدیدی تبدیل بشه.

مثلاً درک وضعیت اقتصادیِ یک کشور از روی تصاویر نورانی ماهواره‌ای که تو شب گرفته شده.

جمع‌سپاری داده چیست؟

«جمع‌سپاری داده یه روش مشارکتی برای ساخت یه مجموعۀ داده با کمک گروه بزرگی از مردمه.

از طریق جمع‌آوری داده‌های جمع‌سپاری، محققا می‌تونن داده‌های زیاد، ارزشمند و پراکنده رو با هزینۀ خیلی پایین‌تر از روش‌های سنتیِ جمع‌آوریِ داده جمع کنن.

جمع‌آوری داده‌های جمع‌سپاری شده به محققا این امکان رو می‌ده تا راحت‌تر به افراد و مکان‌ها دسترسی پیدا کنن و به محققا دانش و بینشی از بازارهای محلی، رویدادها یا حتی قیمت‌ها می‌ده.»[۷]

من به عنوان یه شرکت یا کسب‌وکار یا نهاد دولتی یا هر چیزی، نیاز دارم به داده‌های خاص (مثل مثالی که بالا توی نیجریه بود). نیاز دارم به تمیز کردنِ داده‌هام یا برچسب زدن یا کارایی که تو جریان رسیدن به دانش یا پیش‌بینی باید طی کنم.

به جای اینکه این رو خودم داخل مجموعۀ خودم انجام بدم برون‌سپاری می‌کنم. اما نه به یه نفر؛ به چند ده یا چند هزار یا حتی چند میلیون نفر.

وظایف خرد می‌شه و از طریق یه پلتفرم به اشتراک گذاشته می‌شه. اون طرفِ پلتفرم، کارگرای داده میان و هر کدوم یکی از این وظایف کوچولو[۸] رو دست می‌گیرن و انجام می‌دن و از طریق همون پلتفرم به من می‌رسونن و من هم از طریق همون پلتفرم بهشون پول می‌دم.

جالب اینجاست که توی این پروسه با توجه به مثالی که بالا دیدیم اگه پروژه حرفه‌ای درست شده باشه خیلی خیلی بعیده که کارگرا بدونن کاری که دارن انجام می‌دن در نهایت به چه دانشی می‌خواد برسه یا برای آموزش چه هوش مصنوعی برای چه کاری می‌خواد ازش استفاده بشه.

فرآیند تجزیه و تحلیل کلان داده، منبع: data science foundation

تجزیه و تحلیل کلان داده[۹] به فرآیندی گفته می‌شه که طی اون مشکل یا هدفی تعریف می‌شه و داده‌های مرتبط تو حجم بالا جمع‌آوری می‌شه و بعد از اون تروتمیز می‌شه و مدل می‌شه که سر و شکلی پیدا کنه که بشه از اون اطلاعات خام در راستای اون هدف یا حل مشکل، دانش یا بینشی برای تصمیم‌گیری و اجرا به دست آورد.

تروتمیز کردن یا جمع‌آوری داده‌ها و مراحل میانی این فرآیند درسته که تو خیلی از موارد توسط هوش مصنوعی انجام می‌شه، ولی واقعیت اینه که تو خیلی از موقعیت‌ها هم نمی‌شه از هوش مصنوعی استفاده کرد (حداقل فعلاً). اینجا جمع‌سپاری داده خیلی کمک می‌کنه.

۳ پلفترم‌ مطرح جمع‌سپاری داده

۱- Amazon Mechanical Turk

در اوقات فراغت خود کسب درآمد کنید، برای انجام کارهای ساده پول دریافت کنید.

مشاغلی که توی سایت آمازون مکانیکال تورک[۱۰] هست:

  • پردازش تصویر / ویدیو
    • برچسب گذاری اشیاء یافت شده در یک تصویر برای بهبود جستجو یا هدف‌گذاری تبلیغاتی
    • کمک به شرکت‌ها برای انتخاب بهترین تصویر برای نمایش محصول
    • بررسی تصاویر یا ویدیوهای آپلود شده توسط کاربر را (بالای ۱۸ نباشه مثلاً)
    • طبقه‌بندی و شناسایی اشیاء موجود در تصاویر ماهواره‌ای
  • تایید و پاکسازی داده‌ها
    • حذف محتوای تکراری از فهرست‌نویسی‌های کسب‌و‌کار
    • شناسایی لیست محصولات ناقص یا تکراری در یک کاتالوگ
    • بررسی جزئیات رستوران مانند شماره تلفن یا ساعات کار
    • تبدیل داده‌های بدون ساختار در مورد مکان‌ها به آدرس‌های کارآمد و صحیح
  • جمع‌آوری اطلاعات
    • پاسخ دادن به سؤالات از رایانه یا دستگاه تلفن همراه در مورد هر موضوعی
    • تکمیل داده‌های تحقیقات بازار یا نظرسنجی در مورد موضوعات مختلف
    • نوشتن محتوا برای وب‌سایت‌ها
    • یافتن فیلدها یا عناصر داده خاص در اسناد بزرگ حقوقی و دولتی
  • پردازش داده‌ها
    • ویرایش و رونویسی محتوای صوتی
    • ترجمه محتوا از زبانی به زبان دیگر
    • رتبه‌بندی دقت نتایج جستجو
    • دسته‌بندی اطلاعات بر اساس دستورالعمل‌ها

۲- MicroWorkers

میکرو ورکرز یه پلتفرم آمریکاییه که از سال ۲۰۰۹ فعالیت خودش رو تو زمینۀ جمع‌سپاری کارهای کوچیک شروع کرده.

مثل بقیۀ پلتفرم‌های این حوزه هم می‌تونید به عنوان کارفرما توش فعالیت کنید و کار تعریف کنید، و هم به شکل کارگر که کارای کوچولوی تعریف شده رو انتخاب کنید، انجام بدید و دستمزد بگیرید.

دسته‌بندی‌های مختلفی داره که تعدادش از آمازون تورک کمی بیشتره. ضمن اینکه برای وظایف مختلف قالب‌های پیش‌ساخته داره که کار سریعتر جلو بره.

۳- ClickWorker

کلیک‌ورکر یه پلتفرم آلمانیه که از سال ۲۰۰۵ فعالیتش رو تو زمینۀ جمع‌سپاری داده شروع کرده.

مشخصاً تو حوزۀ آموزش هوش مصنوعی فعالیت داره و اون طور که خودش می‌گه تا این لحظه ( اواخر ۲۰۲۱) بیشتر از ۲ میلیون و هشتصد هزار نفر کلیک‌ورکر زبروزرنگ تو کل دنیا داره.

علاوه بر وب‌سایتش یه اپلیکیشنم داره که کار رو برای کارفرما و کارگر خیلی راحت‌تر می‌کنه.

مدل توانمندسازی جمعیت

دیو دی‌والت[۱۱] موسس و مدیر عامل نایت دراگون[۱۲] (یه شرکت راهبر و سرمایه‌گذار تو حوزۀ امنیت داده‌، جمع آوری داده و حفظ حریم خصوصی) می‌گه: در حالی که جمع سپاری به عنوان «عمل به دست آوردن اطلاعات یا ورودی در یک کار یا پروژه با استفاده از خدمات تعداد زیادی از افراد، با یا بدون دستمزد، معمولاً از طریق اینترنت» تعریف می‌شود، ما می‌توانیم این جریان را به توانمندسازی جمعیت[۱۳] تعریف کنیم (اصطلاحی که شرکت ما استفاده می کند).

می‌توانیم به این شکل تعریف کنیم: تمرین بهره‌گیری از بینش جمعی میلیون‌ها فرد، جوامع و سازمان‌های آنها برای به دست آوردن دانش مشترک که به بهبود جهان‌مان کمک می‌کند.

امروزه بسیاری از گفتمان‌ها پیرامون استفاده از داده و حفظ حریم خصوصی بر این ایده متمرکز است که تنها کسب‌و‌کار یا نهاد خاصی از جمع‌سپاری یا جذب داده سود می‌برد. با این حال، با دنبال کردن مدل توانمندسازی جمعیت، من معتقدم که همه می‌توانند از آن سود ببرند.»[۱۴]

تاثیر تغییر معنی جمع‌سپاری به توانمندسازی یا کلمات مشابه

اولین بار جمع‌سپاری داده توسط پلتفرم آمازون مکانیکال تورک تو سال ۲۰۰۵ برای رفع نیازهای خودِ شرکت آمازون استفاده شد که تا الان هم ادامه داره.

اکثر مواقع اینکه «ما می‌خوایم دنیا رو به جای بهتری تبدیل کنیم» به عنوان یه سرپوش برای توجیه کارای جاه‌طلبانۀ شرکت‌های بزرگ استفاده می‌شه.

حرف این نیست که آقای دی‌والت یا امثال ایشون خیرخواه نیستن یا می‌خوان کلاهبرداری کنن، حرف اینه که به شکل واضح استفاده از جمعیت‌های بزرگ برای انجام کارهای خیلی کوچیک سودش برای شرکت‌های بزرگ خیلی بیشتر از جمعیت‌هاست و احتمال اینکه توی بلندمدت باعث تجمیع ثروت و قدرت بیشتر توی این شرکت‌ها بشه خیلی زیاده.

تو این وضعیتی که قانون خیلی از اتفاقات جدید عقبه و جمعیت‌های زیادی تو کشورهای فقیر در حال دست و پنجه نرم کردن با مرگ هستن، شاید این کار باعث تواندمندسازیِ اونا بشه، ولی این توانمندسازی به نظر می‌رسه در نهایت نه به شکل خودکفایی، بلکه به صورت بردگی دربیاد.

به نظرم این جریان رو با تغییر تعریف این اصطلاح از جمع‌سپاری به توانمندسازی نمی‌شه ماست‌مالی کرد.

همین الان مراجع قانون‌گذار و وکلای آمریکایی و اروپایی با این موضوع درگیرن که با این کارگرا به لحاظ قانونی چجوری باید رفتار بشه. حق بیمه دارن؟ کارگر روزمزد حساب می‌شن یا چیزایی به این شکل.

جمع‌بندی

تمام این فعالیت‌ها رو باید توی اقتصاد داده ببینیم. اقتصادی که توی اون داده به عنوان نفت جدید شناخته می‌شه.

رقابت بین شرکت‌های بزرگ سرِ این نفت جدید و کار گرفتن از جمعیت‌های بزرگ مردمی شاید چیزیه که بشر تو طول تاریخ تو این وسعت تو هیچ اقتصادی تا حالا باهاش روبرو نبوده.

البته نگاه بلندمدت به این ماجرا یه چیز دیگه رو هم پیش می‌کشه: این حجم داده‌ای که داریم به خوردِ هوش مصنوعی می‌دیم تا کی ادامه داره؟ و این هوش مصنوعی بعد از یاد گرفتن قراره چیکار کنه؟ در خدمت همۀ کساییه که برای یادگیری و رشدش کار کردن باشه یا در جهت منافع کارفرمایی که مالک اونه قراره کار بکنه؟ شایدم کلاً سرکشی کنه و برای خودش و به نفع خودش تصمیم‌گیری کنه.

به نطرم جمع‌سپاری داده اگر برای بالا بردن سلامت آدما استفاده بشه ایدۀ خیلی جالبیه، یه نوع مشارکت سازنده‌س که در نهایت نفعش به همه می‌رسه. ولی با شکلی که الان داره، که قدرت در اختیار یه عدۀ خاصه، به احتمال زیاد باعث بیشتر شدنِ قدرت قدرتمندا و ضعیف‌تر و وابسته‌تر شدنِ کارگرای داده می‌شه.

البته توی کوتاه‌مدت شاید برای کارگرا منافع خوبی داشته باشه. مخصوصاً کارگرایی که تو کشورای فقیر و پرجمعیت زندگی می‌کنن.

  1. همه دروغ می‌گویند، نشر شفاف (صفحه‌آرایی و صفحه‌بندی این ناشر خیلی ناجوره، واقعاً خوندنِ کتاب سخت بود).
  2. data crowdsourcing، اصطلاح جمع‌سپاری (crowd + outsourcing) رو اولین بار آقای جف هو، یکی از سردبیران نشریۀ وایرد (wired) تو سال ۲۰۰۶ مطرح کرد.
  3. data economy.
  4. کل ارزش پولی کالاها و خدمات نهایی تولید شده در یک بازه زمانی خاص.
  5. https://www.premise.com
  6. همه دروغ می‌گویند، فصل سوم، درک تازه‌ای از داده.
  7. https://dimewiki.worldbank.org/Crowd-sourced_Data
  8. micro task.
  9. Big Data Analytics (BDA).
  10. https://en.wikipedia.org/wiki/Mechanical_Turk
  11. Dave DeWalt
  12. https://nightdragon.com
  13. Crowd Empowerment
  14. https://www.forbes.com/sites/forbesfinancecouncil/2021/07/20/the-next-evolution-of-data-and-crowdsourcing-crowd-empowerment