یه مطلب از کتاب «همه دروغ میگویند»[۱] میبینیم و بعد میریم سراغ داستانِ جمع سپاری داده[۲] که یکی از مفاهیم «اقتصاد داده»[۳] حساب میشه، و بعدش کمی در مورد مشکلاتش حرف میزنیم.
توی این ویدیو پروژۀ مایکروسافت رو توضیح دادم که بر خلاف جمعسپاری داده، میخواد همینجوری به مردم پول بده.
- پیشبینی تولید و تورم اقتصادی
- جمعسپاری داده چیست؟
- ۳ پلتفرم مطرح جمعسپاری داده
- مدل توانمندسازی جمعیت
- تاثیر تغییر معنی جمعسپاری به توانمندسازی یا کلمات مشابه
- جمعبندی
پیشبینی تولید و تورم اقتصادی
ریسینگر خاطرنشان کرد که نیجریه در آوریل ۲۰۱۴ پیشبینی تولید ناخالص داخلی[۴] خود را به روز کرده و بخشهایی که احتمالاً قبلاً از آنها غافل شده بوده است را در نظر گرفته، تولید ناخالص پیشبینی شدهی این کشور ۹۰ درصد بالاتر رفت!
ریسینگر با صدایی که آرام آرام بلند میشد گفت:«آنها بزرگترین اقتصاد در آفریقا هستند. ما حتی اساسیترین چیزهای لازم را هم در مورد آن کشور نمیدانیم.» او میخواست راهی بیابد تا دید دقیقتری نسبت به عملکرد اقتصادی پیدا کند.
راه حل او یک مثال خوب است تا به درک جدیدی از اینکه چه چیزی داده است برسیم و ارزش این درک جدید را دریابیم.
ریسینگر شرکتی با نام پرمیس[۵] پیدا کرد که در کشورهای در حال توسعه گروهی کارمند دارای گوشی هوشمند برای خود استخدام کرده و از کارمندان خود میخواهد که از اتفاقات غیرعادی و جالبی که میتواند ارزش اقتصادی داشته باشد عکس بگیرند.
کارمندان ممکن است یکسری عکس فوری از بیرون پمپ بنزین یا مخازن میوه در سوپرمارکتها بگیرند. آنها از این مکان بارها و بارها عکس میگیرند. آن وقت این عکسها برای پرمیس فرستاده میشوند و در آنجا گروه دوم کارمندان که دانشمندان کامپیوتر هستند این عکسها را به اطلاعات تبدیل میکنند.
تحلیلگران این شرکت میتوانند همه چیز را از طول صف پمپ بنزین تا تعداد سیبهای موجود در سوپرمارکت تا رسیدگی این سیبها تا قیمت روی سبدهای سیب را کدبندی کنند.
پرمیس میتواند از عکسهایی که از فعالیتهای گوناگون گرفته شده استفاده کند و با گذاشتن این دادهها در کنار هم تولید و تورم اقتصادی را پیشبینی کند.
درکشورهای درحال توسعه صفهای طولانی پمپ بنزین یک شاخص پیشگام در پیشبینی وقوع مشکلات اقتصادیاند. عدم دسترسی به میوه یا نرسیده بودن آن نیز از نشانههای مشکلات اقتصادی است.
عکسهای محلی شرکت پرمیس در چین به محققین کمک کرد که پیش از انتشار دادههای رسمی، متوجه افزایش قیمت خوراکیها در سال ۲۰۱۱ و کاهش قیمت خوراکیها در سال ۲۰۱۲ شوند.
پرمیس این اطلاعات را به بانکها یا صندوقهای پوشش ریسک میفروشد و با بانک جهانی همکاری میکند. مانند بسیاری از ایدههای خوب، پرمیس مانند باقیاتالصالحات است که همواره از آن خیر و نیکی به پا میخیزد.
بانک جهانی به تازگی به حجم اقتصاد زیرزمینی سیگار در فیلیپین علاقه نشان داد. آنها به خصوص خواستند تأثیر تلاشهای اخیر دولت که شامل حملههای تصادفی برای سختگیری بر تولیدکنندههای سیگار قاچاق را ببینند.
ایدهی هوشمندانهی پرمیس چه بود؟ از کارمندانش خواست تا از جعبههای سیگار در خیابان عکس بگیرند و ببیند که چند تا از آنها برچسب مالیاتی (که بر روی تمامی سیگارهای قانونی هست) را دارند.
آنها فهمیدند که این بخش از اقتصاد زیرزمینی که در سال ۲۰۱۵ بزرگ بود به طور قابل توجهی در سال ۲۰۱۶ کوچک تر شده و تلاشهای دولت ثمربخش بوده است.[۶]
نویسندهها توی این فصل از کتاب سعی دارن ابعاد جدیدی از اشکال جدید داده رو نشون بدن و ذهنیت قدیمی که فقط اسم و فامیل اشخاص یا مثلاً تجزیه و تحلیل چهره به عنوان دادههای با ارزش محسوب میشه رو تغییر بدن.
طبق این بحث، تقریباً هر دادهای که به مقدار زیاد وجود داشته باشه قابلیت اینو داره تا چیزهایی که تو نگاه اول کاملاً با اون دادهها غیر مرتبطه پیشبینی کنه و به بینش جدیدی تبدیل بشه.
مثلاً درک وضعیت اقتصادیِ یک کشور از روی تصاویر نورانی ماهوارهای که تو شب گرفته شده.
جمعسپاری داده چیست؟
«جمعسپاری داده یه روش مشارکتی برای ساخت یه مجموعۀ داده با کمک گروه بزرگی از مردمه.
از طریق جمعآوری دادههای جمعسپاری، محققا میتونن دادههای زیاد، ارزشمند و پراکنده رو با هزینۀ خیلی پایینتر از روشهای سنتیِ جمعآوریِ داده جمع کنن.
جمعآوری دادههای جمعسپاری شده به محققا این امکان رو میده تا راحتتر به افراد و مکانها دسترسی پیدا کنن و به محققا دانش و بینشی از بازارهای محلی، رویدادها یا حتی قیمتها میده.»[۷]
من به عنوان یه شرکت یا کسبوکار یا نهاد دولتی یا هر چیزی، نیاز دارم به دادههای خاص (مثل مثالی که بالا توی نیجریه بود). نیاز دارم به تمیز کردنِ دادههام یا برچسب زدن یا کارایی که تو جریان رسیدن به دانش یا پیشبینی باید طی کنم.
به جای اینکه این رو خودم داخل مجموعۀ خودم انجام بدم برونسپاری میکنم. اما نه به یه نفر؛ به چند ده یا چند هزار یا حتی چند میلیون نفر.
وظایف خرد میشه و از طریق یه پلتفرم به اشتراک گذاشته میشه. اون طرفِ پلتفرم، کارگرای داده میان و هر کدوم یکی از این وظایف کوچولو[۸] رو دست میگیرن و انجام میدن و از طریق همون پلتفرم به من میرسونن و من هم از طریق همون پلتفرم بهشون پول میدم.
جالب اینجاست که توی این پروسه با توجه به مثالی که بالا دیدیم اگه پروژه حرفهای درست شده باشه خیلی خیلی بعیده که کارگرا بدونن کاری که دارن انجام میدن در نهایت به چه دانشی میخواد برسه یا برای آموزش چه هوش مصنوعی برای چه کاری میخواد ازش استفاده بشه.
تجزیه و تحلیل کلان داده[۹] به فرآیندی گفته میشه که طی اون مشکل یا هدفی تعریف میشه و دادههای مرتبط تو حجم بالا جمعآوری میشه و بعد از اون تروتمیز میشه و مدل میشه که سر و شکلی پیدا کنه که بشه از اون اطلاعات خام در راستای اون هدف یا حل مشکل، دانش یا بینشی برای تصمیمگیری و اجرا به دست آورد.
تروتمیز کردن یا جمعآوری دادهها و مراحل میانی این فرآیند درسته که تو خیلی از موارد توسط هوش مصنوعی انجام میشه، ولی واقعیت اینه که تو خیلی از موقعیتها هم نمیشه از هوش مصنوعی استفاده کرد (حداقل فعلاً). اینجا جمعسپاری داده خیلی کمک میکنه.
۳ پلفترم مطرح جمعسپاری داده
۱- Amazon Mechanical Turk
در اوقات فراغت خود کسب درآمد کنید، برای انجام کارهای ساده پول دریافت کنید.
مشاغلی که توی سایت آمازون مکانیکال تورک[۱۰] هست:
- پردازش تصویر / ویدیو
- برچسب گذاری اشیاء یافت شده در یک تصویر برای بهبود جستجو یا هدفگذاری تبلیغاتی
- کمک به شرکتها برای انتخاب بهترین تصویر برای نمایش محصول
- بررسی تصاویر یا ویدیوهای آپلود شده توسط کاربر را (بالای ۱۸ نباشه مثلاً)
- طبقهبندی و شناسایی اشیاء موجود در تصاویر ماهوارهای
- تایید و پاکسازی دادهها
- حذف محتوای تکراری از فهرستنویسیهای کسبوکار
- شناسایی لیست محصولات ناقص یا تکراری در یک کاتالوگ
- بررسی جزئیات رستوران مانند شماره تلفن یا ساعات کار
- تبدیل دادههای بدون ساختار در مورد مکانها به آدرسهای کارآمد و صحیح
- جمعآوری اطلاعات
- پاسخ دادن به سؤالات از رایانه یا دستگاه تلفن همراه در مورد هر موضوعی
- تکمیل دادههای تحقیقات بازار یا نظرسنجی در مورد موضوعات مختلف
- نوشتن محتوا برای وبسایتها
- یافتن فیلدها یا عناصر داده خاص در اسناد بزرگ حقوقی و دولتی
- پردازش دادهها
- ویرایش و رونویسی محتوای صوتی
- ترجمه محتوا از زبانی به زبان دیگر
- رتبهبندی دقت نتایج جستجو
- دستهبندی اطلاعات بر اساس دستورالعملها
۲- MicroWorkers
میکرو ورکرز یه پلتفرم آمریکاییه که از سال ۲۰۰۹ فعالیت خودش رو تو زمینۀ جمعسپاری کارهای کوچیک شروع کرده.
مثل بقیۀ پلتفرمهای این حوزه هم میتونید به عنوان کارفرما توش فعالیت کنید و کار تعریف کنید، و هم به شکل کارگر که کارای کوچولوی تعریف شده رو انتخاب کنید، انجام بدید و دستمزد بگیرید.
دستهبندیهای مختلفی داره که تعدادش از آمازون تورک کمی بیشتره. ضمن اینکه برای وظایف مختلف قالبهای پیشساخته داره که کار سریعتر جلو بره.
۳- ClickWorker
کلیکورکر یه پلتفرم آلمانیه که از سال ۲۰۰۵ فعالیتش رو تو زمینۀ جمعسپاری داده شروع کرده.
مشخصاً تو حوزۀ آموزش هوش مصنوعی فعالیت داره و اون طور که خودش میگه تا این لحظه ( اواخر ۲۰۲۱) بیشتر از ۲ میلیون و هشتصد هزار نفر کلیکورکر زبروزرنگ تو کل دنیا داره.
علاوه بر وبسایتش یه اپلیکیشنم داره که کار رو برای کارفرما و کارگر خیلی راحتتر میکنه.
مدل توانمندسازی جمعیت
دیو دیوالت[۱۱] موسس و مدیر عامل نایت دراگون[۱۲] (یه شرکت راهبر و سرمایهگذار تو حوزۀ امنیت داده، جمع آوری داده و حفظ حریم خصوصی) میگه: در حالی که جمع سپاری به عنوان «عمل به دست آوردن اطلاعات یا ورودی در یک کار یا پروژه با استفاده از خدمات تعداد زیادی از افراد، با یا بدون دستمزد، معمولاً از طریق اینترنت» تعریف میشود، ما میتوانیم این جریان را به توانمندسازی جمعیت[۱۳] تعریف کنیم (اصطلاحی که شرکت ما استفاده می کند).
میتوانیم به این شکل تعریف کنیم: تمرین بهرهگیری از بینش جمعی میلیونها فرد، جوامع و سازمانهای آنها برای به دست آوردن دانش مشترک که به بهبود جهانمان کمک میکند.
امروزه بسیاری از گفتمانها پیرامون استفاده از داده و حفظ حریم خصوصی بر این ایده متمرکز است که تنها کسبوکار یا نهاد خاصی از جمعسپاری یا جذب داده سود میبرد. با این حال، با دنبال کردن مدل توانمندسازی جمعیت، من معتقدم که همه میتوانند از آن سود ببرند.»[۱۴]
تاثیر تغییر معنی جمعسپاری به توانمندسازی یا کلمات مشابه
اولین بار جمعسپاری داده توسط پلتفرم آمازون مکانیکال تورک تو سال ۲۰۰۵ برای رفع نیازهای خودِ شرکت آمازون استفاده شد که تا الان هم ادامه داره.
اکثر مواقع اینکه «ما میخوایم دنیا رو به جای بهتری تبدیل کنیم» به عنوان یه سرپوش برای توجیه کارای جاهطلبانۀ شرکتهای بزرگ استفاده میشه.
حرف این نیست که آقای دیوالت یا امثال ایشون خیرخواه نیستن یا میخوان کلاهبرداری کنن، حرف اینه که به شکل واضح استفاده از جمعیتهای بزرگ برای انجام کارهای خیلی کوچیک سودش برای شرکتهای بزرگ خیلی بیشتر از جمعیتهاست و احتمال اینکه توی بلندمدت باعث تجمیع ثروت و قدرت بیشتر توی این شرکتها بشه خیلی زیاده.
تو این وضعیتی که قانون خیلی از اتفاقات جدید عقبه و جمعیتهای زیادی تو کشورهای فقیر در حال دست و پنجه نرم کردن با مرگ هستن، شاید این کار باعث تواندمندسازیِ اونا بشه، ولی این توانمندسازی به نظر میرسه در نهایت نه به شکل خودکفایی، بلکه به صورت بردگی دربیاد.
به نظرم این جریان رو با تغییر تعریف این اصطلاح از جمعسپاری به توانمندسازی نمیشه ماستمالی کرد.
همین الان مراجع قانونگذار و وکلای آمریکایی و اروپایی با این موضوع درگیرن که با این کارگرا به لحاظ قانونی چجوری باید رفتار بشه. حق بیمه دارن؟ کارگر روزمزد حساب میشن یا چیزایی به این شکل.
جمعبندی
تمام این فعالیتها رو باید توی اقتصاد داده ببینیم. اقتصادی که توی اون داده به عنوان نفت جدید شناخته میشه.
رقابت بین شرکتهای بزرگ سرِ این نفت جدید و کار گرفتن از جمعیتهای بزرگ مردمی شاید چیزیه که بشر تو طول تاریخ تو این وسعت تو هیچ اقتصادی تا حالا باهاش روبرو نبوده.
البته نگاه بلندمدت به این ماجرا یه چیز دیگه رو هم پیش میکشه: این حجم دادهای که داریم به خوردِ هوش مصنوعی میدیم تا کی ادامه داره؟ و این هوش مصنوعی بعد از یاد گرفتن قراره چیکار کنه؟ در خدمت همۀ کساییه که برای یادگیری و رشدش کار کردن باشه یا در جهت منافع کارفرمایی که مالک اونه قراره کار بکنه؟ شایدم کلاً سرکشی کنه و برای خودش و به نفع خودش تصمیمگیری کنه.
به نطرم جمعسپاری داده اگر برای بالا بردن سلامت آدما استفاده بشه ایدۀ خیلی جالبیه، یه نوع مشارکت سازندهس که در نهایت نفعش به همه میرسه. ولی با شکلی که الان داره، که قدرت در اختیار یه عدۀ خاصه، به احتمال زیاد باعث بیشتر شدنِ قدرت قدرتمندا و ضعیفتر و وابستهتر شدنِ کارگرای داده میشه.
البته توی کوتاهمدت شاید برای کارگرا منافع خوبی داشته باشه. مخصوصاً کارگرایی که تو کشورای فقیر و پرجمعیت زندگی میکنن.
- همه دروغ میگویند، نشر شفاف (صفحهآرایی و صفحهبندی این ناشر خیلی ناجوره، واقعاً خوندنِ کتاب سخت بود).
- data crowdsourcing، اصطلاح جمعسپاری (crowd + outsourcing) رو اولین بار آقای جف هو، یکی از سردبیران نشریۀ وایرد (wired) تو سال ۲۰۰۶ مطرح کرد.
- data economy.
- کل ارزش پولی کالاها و خدمات نهایی تولید شده در یک بازه زمانی خاص.
- https://www.premise.com
- همه دروغ میگویند، فصل سوم، درک تازهای از داده.
- https://dimewiki.worldbank.org/Crowd-sourced_Data
- micro task.
- Big Data Analytics (BDA).
- https://en.wikipedia.org/wiki/Mechanical_Turk
- Dave DeWalt
- https://nightdragon.com
- Crowd Empowerment
- https://www.forbes.com/sites/forbesfinancecouncil/2021/07/20/the-next-evolution-of-data-and-crowdsourcing-crowd-empowerment
مطالب مشابه
تنفر در حرف، علاقه در عمل
بگو سیب: مطالعهای در مورد خندهروتر شدنِ مردم در قرن بیستم
ربات اسپات بوستون داینامیکس، حگسرِ متحرک استخراج داده
نظریۀ شأن یا جایگاه داده از جارون لنیر
آسیبهای شبکههای اجتماعی از زبان تریستان هریس
بررسی مستند the social dilemma (معضل اجتماعی) + مشاهده و دانلود زیرنویس فارسی چسبیده